Sora促AI视频领域融资热潮,这些华人创业者搭上了顺风车
原标题:Sora 促AI视频领域融资热潮,这些华人创业者搭上了顺风车
作者:小红帽
白鲸出海注:本文是Morketing Global发布在白鲸出海的专栏文章,转载须保留本段文字,并注明作者和来源。商业转载/使用请前往Morketing Global主页联系,寻求作者授权。

题图来源 | Unsplash
对于大部分初创公司来说,2023 年无疑是难熬的一年。由于全球经济的不确定性和低增速带来的影响,风险投资公司(VCs)的投资意愿普遍降低。他们中的大多数选择了持币观望的策略,这无疑加剧了初创公司融资的难度。
然而,生成式人工智能领域却逆流而上,未受市场波动的影响。截至目前,热门的人工智能初创公司估值仍在持续飙升。风险投资者们对此领域充满热情,他们不惜支付额外的溢价来推高初创公司的估值。
当百度、阿里巴巴、月之暗面、智谱 AI 等科技巨头在 AI 大模型领域的竞争愈演愈烈之际,不少创业公司却开始将目光转向应用层面,寻求新的发展机遇。正如金沙江创投管理合伙人朱啸虎说的那样,“AI 创业公司应该避开大模型”集火,聚焦垂直应用端。
风险投资公司也在积极寻找投资大模型领域之外的机会,他们纷纷将目光投向那些利用大模型技术开发应用的初创公司。
仅仅一个月,就有三家华人创立的生成式 AI 公司获得融资,且融资金额都过了千万美金。
那些成因“螃蟹”的初创公司
项目一:应用场景成熟的 Haiper
就像 ChatGPT 带火了 AI 生成式文本,Sora 的横空出世也迅速将“AI 生成式视频”这个词带上了热搜,而一些相关创业公司蓄势待发。
3 月 7 日,人工智能视频生成平台 Haiper 宣布完成由 Octopus Ventures(章鱼风投)领投的 1380 万美元的种子轮融资。经过本轮融资,Haiper 的总融资额已累计至 1920 万美元,这为公司计划在 2024 年顺利推进 A 轮融资进一步铺平道路。
Haiper 于 2021 年底在伦敦成立,由 Miao Yishu 和 Wang Ziyu 创立,两位博士均持有牛津大学机器学习博士学位,并曾在谷歌 DeepMind 担任研究员。
根据职业社交平台领英的资料显示,在创立 Haiper 之前,Miao Yishu 曾在 TikTok 的全球信任与安全团队工作,任职技术主管。在拿到牛津大学的博士学位之前,Miao Yishu 曾于 2010 年 9 月至 2013 年六月的这段时间里,在清华大学攻读数据挖掘硕士学位。
领英的资料显示,Miao Yishu 在创立公司之前,曾在 TikTok 的全球信任与安全团队担任技术主管。此外,Miao Yishu 在攻读牛津大学博士学位之前,曾于 2010 年 9 月至 2013 年 6 月在清华大学攻读并获得数据挖掘硕士学位。
起初,Haiper 主要专注于 3D 重建领域。然而,在进行 AI 训练处理视频数据的过程中,两位创始人发现了 AI 视频生成这其中的商业潜力。于是,大约在 7 个月前,他们做出了战略性的转变,决定将重心转向视频生成领域。
虽然 Haiper 生成的视频片段可能还没有达到 OpenAI 发布样本的那种令人印象深刻的地步,但最起码在“主菜”上桌之前,它已经给大伙们提供了“前菜”试吃。
相反,目前还很少有人有机会体验 Sora 的功能。Haiper 已经能够让用户根据文本提示创建两秒的高清晰度视频,或者在较低分辨率下生成稍长的视频剪辑。此外,Haiper 还提供了通过静态图像生成动画版本或者以不同风格“重绘”视频的功能。公司还打算在近期增加使用 AI 技术来延长视频时长的功能。

图片来源:Haiper 官网
在产品尚未正式上线之际,Haiper 便积极展开了对应用场景的探索。早在 1 月 24 日,Haiper 便宣布与伦敦艺术大学时装学院展开合作,借助 AI 技术将时装草图转化为动态视频,让设计师能够在成衣制作之前预览上身效果。紧接着,在 2 月 9 日,Haiper 又宣布与京东展开合作,共同探索电商领域的应用场景。作为一款新生产品,Haiper 已经开始着力为自家技术寻找多样化的应用场景了。
目前,由于 Haiper 的计算能力有限,制作每个样本视频大约需要一分钟的时间。生成式人力的算力成本非常“可怕”。堆积算力需要搭建昂贵的 AI 加速卡群组,而像英伟达 H100 这种加速卡的单价可能高达 3 万美元以上。
虽然公司目前还未公开该模型的详细信息,但 Miao 透露,他们已私下联系了一些开发者试用其封闭的 API。他强调,开发者的反馈对于公司快速迭代模型至关重要。此外,Haiper 还在考虑未来开放源代码,以便让更多人能够探索该模型在不同场景下的应用潜力。
无独有偶,在 Haiper 宣布完成 1380 万美元的种子轮融资后不久,视频大模型公司爱诗科技也于 3 月 13 日宣布完成了约一亿元人民币的 A1 轮融资。此轮融资由达晨财智独家投资,而光源资本则担任了独家财务顾问的角色。
项目二:中国版 Sora,已实现 4K 分辨率视频的爱诗科技
爱诗科技来头不小,它是由字节跳动前视觉技术负责人王长虎于 2023 年 4 月创办,公司主要致力于开发 AI 视频生成模型及其应用。为营销、广告、游戏领域的内容创作行业提供帮助和服务。
王长虎在人工智能领域拥有丰富的产品经验。他毕业于中国科学技术大学并获得博士学位。2009 年毕业后,他曾在微软亚洲研究院担任主管研究员。到了 2017 年初,王长虎加入字节跳动,担任过人工智能实验室总监以及集团视觉技术的负责人。
目前,在海外市场,爱诗科技的国际版 AI 视频生成产品 PixVerse 已经正式开始运营。用户可以通过网页端或者加入 Discord-PixVerse 服务器来体验这一产品。在今年 3 月,面向国内用户的爱诗大模型也已经开放内测,内测链接为 https://aishiai.com/waitlist。
技术上,爱诗科技采用了与 Sora 相同的技术路线,即 DiT(Diffusion Transformer)架构。
PixVerse 主要提供了文生视频、图生视频等核心功能,并且爱诗科技宣称在去年十月就已经实现了生成 4K 分辨率的视频内容。
以文生视频功能为例,PixVerse 的产品界面提供了 Prompt、Style、Aspect-ratio 和 Negative-prompt 四个功能参数。其中,Prompt 参数用于输入一段句子或关键词语来指导视频内容的生成;Style 参数用于决定视频画面的风格;Aspect-ratio 参数则用于设定视频的画幅比例;而 Negative-prompt 参数则帮助用户规避在视频中不希望呈现的内容。

图片来源:PixVerse 国际版产品页面
现在的 AI 视频生成领域就好似 GPT-2 的前夕,而 VCs 现在需要做的就是在这个“泡泡”吹的足够大之前押注,才能满足“害怕错过”的心理需求。
正如投资机构 a16z 在投资备忘录所注解的那样“我们在过去的一年时间里在生成式视频这个领域频繁发力,但貌似还是不够。在消费者每天使用这些产品之前,还有很长的路要走。视频的 ChatGPT 时刻什么时候会到来?”
项目三:功能“量大管饱”的 HeyGen
正是这种“害怕错过”的投资人心理造就了生成式视频领域的融资热潮。除了前两家公司,第三家我们要介绍的公司也是由华人创办的。
早在去年,这家名为 HeyGen 的公司就凭借一系列 AI 生成式创意视频而名声大噪,其中包括让美国知名歌手泰勒·斯威夫特说普通话,以及赵本山和郭德纲讲英语的精彩内容。
3 月 28 日, 这家仅成立三年的 AI 视频生成创业公司宣布正在新一轮 6000 万美元的融资。而该轮融资之后,HeyGen 的估值也来到了 4.4 亿美元。
HeyGen 于 2020 年 11 月在洛杉矶创立,由前 Snap 软件工程师徐卓及其同济大学校友、前字节产品设计师梁望(Wayne Liang)共同发起。红杉资本中国、真格基金等机构均对其进行了重要投资。
HeyGen 涵盖了丰富的生成式视频功能,不仅支持主播换脸、文字转口播视频,还能创建虚拟主播,并具备语音翻译与克隆等功能。
具体来看,HeyGen 的文本转语音功能为用户提供了将书面文本转化为自然语音的便捷途径。通过这一功能,用户可以选择超过 40 种语言和 300 多种声音,用户还可以在脚本中的任意位置添加半秒停顿,以确保生成的语音听起来更加自然流畅。
HeyGen 提供了超过 100 种 AI 头像,这些头像涵盖了各种族裔、年龄以及不同的身形姿势。用户只需通过书写或音频录制脚本,即可轻松生成 AI 头像视频,并且在几分钟内实现口型同步。

图片来源:HenGen 网页
HeyGen 的 TalkingPhoto 功能让用户能够将任何图像转变为会说话的图片。通过这一功能,用户可以为照片添加真实的人类声音,将原本静态的视觉效果转化为生动的动态动画。用户只需为照片的对话编写一个脚本,然后观看图片变得栩栩如生。
HeyGen 联合创始人兼 CEO 徐卓(Joshua Xu)在近期透露,公司目前的年化收入已经超过了 2000 万美元,并且曾连续 9 个月实现了 50% 的月环比增长率。这一增速远超过其他竞品。
实际上,自 2023 年起,HeyGen 开始逐渐剥离中国投资者在公司的影响。去年 12 月 11 日,HeyGen 的国内实体诗云科技因决议解散,宣布申请注销登记,其业务重心也完全转移至美国市场。据知情人士援引公司内部人员的解释,数字人领域的技术门槛相对较低,国内市场竞争日益激烈,这可能是 HeyGen 选择出海的重要考量因素。
创业者们面临的挑战
AI 视频生成的这一波集中融资,与 Sora 的发布、并展现远高于之前同类产品的惊艳效果有着很强的关联。
AI 视频生成领域目前的竞争日益激烈。除了 OpenAI 最近推出的 Sora 之外,市场上还涌现了众多强有力的竞争者。其中,谷歌和英伟达支持的 Runway 已经成功筹集超过 2.3 亿美元的资金。同时,谷歌和 Meta 等科技巨头也各自研发了视频生成模型。去年,人工智能图片生成公司 Stability AI 在DEMO 预览中也宣布了 Stable Diffusion 视频模型。
从成本角度来看,Sora 的算力需求相较于 GPT-4 高出了多个数量级。这种庞大的算力需求无疑给视频生成领域的初创公司带来了巨大的商业化挑战和融资压力。对于初创公司而言,如何在保证产品质量的同时,有效控制成本,实现商业化盈利,是一个亟待解决的问题。同时,如何吸引投资者的目光,获得足够的资金支持,以应对高额的算力成本,也是这些公司必须面对的考验。因此,对于初创公司来说,如何在视频生成领域取得突破,既需要技术创新,也需要商业模式的创新。
文章信息来自于Morketing Global,不代表白鲸出海官方立场,内容仅供网友参考学习。对于因本网站内容所引起的纠纷、损失等,白鲸出海均不承担侵权行为的连带责任。如若转载请联系原出处。
友情提醒:白鲸出海目前仅有微信群与QQ群,并无在Telegram等其他社交软件创建群,请白鲸的广大用户、合作伙伴警惕他人冒充我们,向您索要费用、骗取钱财!


闽公网安备35010402350923号