一水 发自 凹非寺
量子位 | 公众号 QbitAI
AI视频顶流Pika拿着8000万美元(约5.8亿人民币)新融资又杀回来了!
投资者包括Spark Capital(领投)、Lightspeed和Greycrof等著名机构。
Pika回应量子位,本轮投后最新估值将来到4.7亿美元(约34亿人民币)。
这家由两位斯坦福华人博士创立的公司曾在去年底推出了产品1.0并宣布融资5500万美元。
而后半年,Pika从最初的4人团队扩展至13人,并陆续上线了几项新功能,还在今年4月入选福布斯AI50强榜单。
Pika所在的AI视频生成赛道,今年在技术和投融资领域均迎来双重爆发。
技术方面,OpenAI发布的Sora为行业树立了新的标杆,将时长一举拉到60s,而后开源社区发布了能生成2分钟视频的StreamingT2V,紧接着国内发布了对标Sora能生成16s、分辨率高达1080P的Vidu,再然后谷歌推出同样对标Sora能生成1分钟视频的Veo。
投资方面,继人们对文本和图像生成器的兴趣激增之后,使用AI生成视频被认为是下一个前沿领域,初创企业和大型科技公司都在押注该领域。除了Pika,其他AI视频初创公司Runway和Synthesia也在过去一年里筹集了大量资金。
目前,Pika等初创公司正在快速扩张,因为OpenAI和谷歌的视频工具尚未面向公众开放,这给它们留了一定时间。
那么,自半年前推出1.0以来,Pika后来都在忙啥呢?
AI视频生成赛道,在这段时间还有哪些大事件发生?
Pika最近半年干了啥?
概括而言,Pika近半年除了推出几项“锦上添花”的新功能外,一直在做产品和技术更新。
下面按照时间顺序大概梳理一下。
2023年12月,也就是Pika1.0上线后不久,其研究人员提出了将文本转3D生成速度提高4.7倍的方法。
这一被称为DreamPropeller的嵌入式加速算法,能够优化并增强任何基于分数蒸馏的文本到3D模型生成流程。
之后不久,Pika宣布面向所有公众开放,不过紧跟着推出了其付费订阅模式。
到了今年2月底,Pika宣布推出可以给视频中的人物配音,并同时“对口型”的唇形同步功能Lip Sync。
然后接着在3月份推出AI配音工具Sound Effects,有了这项新功能,用户既可以使用文本生成音效,也可以让Pika直接根据视频内容匹配音效。
至今年4月,Pika在成立不到1年后入选了福布斯AI50强榜单。
以上为Pika最近半年的动向,Pika表示公司目前拥有数百万用户(官方在彭博采访中未提供确切数字),不过能看到Discord上有近80万用户。
AI视频赛道已变天
简单回顾一下,Pika的创始人一共有两位,郭文景(Demi Guo)和Chenlin Meng,都是斯坦福博士。
从二人学术经历来看,她们分别专注于NLP和计算机视觉两个方向的AI研究,也都有生成式AI的学术经历。
这两人在AI生成领域专业背景深厚且技术过硬,以至于在团队仅有4人之时就获得了5500万美元融资。
Pika亮相的时机不可谓不妙,从去年11月开始,一个月内就有5家AI视频生成产品发布或迎来重大更新。
主要包括:
11月3日,Runway的Gen-2发布里程碑式更新,支持4K超逼真的清晰度作品。
11月16日,Meta发布Emu Video,这个工具在用户评估中号称打败Gen-2、Pika等对手。
11月18日,字节发布PixelDance,作品的动态性可谓史无前者,画面中的元素动作幅度都相当大,且不变形,让人眼前一亮。
11月21日,Stable AI也推出了自家的视频工具Stable Video Diffusion。
同在21日,Gen-2上线“涂哪动哪”的运动笔刷新功能,这是生成模型可控性上的一个重要里程碑。
接下来就是Pika在11月29日发布正式版1.0,叫板“老大哥”Runway。
可以说,Pika正是在人们将目光狂热转向视频生成领域时横空出世的,可谓赶上了风口。
但没人预料的到,新年伊始,OpenAI“杀手级”视频生成模型Sora发布,将视频生成的质量拉高了一个档次,时长也拉到了60秒。
Sora的热度盖过了一切,行业后来者也必须得卷起来了。
4月7日,GitHub开源了视频生成模型StreamingT2V,能够生成1200帧、时长120秒的长视频。
紧随其后,4月29日,清华大学与生数科技联合发布了Vidu,画面效果对标Sora,长度可达16秒,还能读懂物理规律。
然后就是谷歌在5月14日的开发者大会上发布了Veo,对标Sora能生成一分钟长视频。
总之,AI视频生成在技术上愈发成熟,也因此带动了行业投融资风潮。
仅在2024年3月一个月,就有三个华人创立的AI视频生成创企获得了融资,且融资额都过了千万美金。
3月7日,总部位于英国伦敦的Haiper(由两位前DeepMind团队的华人工程师建立)宣布产品上线,并已经完成1380万美金融资。
3月13日,由前字节跳动视觉技术负责人创立的爱诗科技,完成一亿元人民币(约合1380万美金)左右的A1轮融资。
3月24日,凭借让霉霉说中文视频火起来的AI数字人产品HeyGen(由前Snap软件工程师徐卓创立)完成一轮6000万美元的融资。
4月23日,爱诗科技完成A2轮超亿元融资,由蚂蚁集团领投。
6月1日,Runway获得1亿美元D轮融资,由谷歌领投。
就在6月5日,生数科技宣布完成数亿元Pre-A轮融资,由北京市人工智能产业投资基金、百度联合领投。
不难看出,AI视频生成今年将迎来新的爆发,而作为顶流之一,Pika自然有人关注。
且Pika现在声称他们已经构建起了自己的“基础模型”,因此不会依赖其他AI公司的技术。
虽然需要不少资金来训练模型,但创始人郭文景透露Pika在这块不需要消耗大量的资金,他们有点类似法国的Mistral AI,可以在较少资金的情况下也能训练出比较好的模型,不过具体没有透露。
最后,今天正值Pika一周年生日(从创始人休学创办Pika开始计算),官方也放出了纪念视频。
接下来,Pika计划在今年晚些时候发布其文本转视频模型的重大更新,这包括两方面,一个是提供更高质量、更长的视频,另一个是确保输出的一致性。
据创始人郭文景透露:
Pika的新工具可以让用户定义一个对象或角色,然后在视频中或最终在不同的剪辑中一致地生成它。
那么,你看好这家公司吗?欢迎在评论区留言讨论。
参考资料:
[1]https://arxiv.org/abs/2311.17082
[2]https://x.com/GoogleDeepMind/status/1790894262193988022
[3]https://streamingt2v.github.io/
[4]https://x.com/pika_labs/status/1797091532455248224
[5]https://pika.art/blog
[6]https://www.washingtonpost.com/technology/2024/06/04/pika-funding-openai-sora-google-video/
[7]https://www.bloomberg.com/news/articles/2024-06-05/spark-capital-jared-leto-back-ai-video-startup-pika