郭文景Pika再融5.8个亿，最新估值约34亿，已自研AI视频生成基础模型

一水发自凹非寺

量子位 | 公众号 QbitAI

AI视频顶流Pika拿着8000万美元（约5.8亿人民币）新融资又杀回来了！

投资者包括Spark Capital（领投）、Lightspeed和Greycrof等著名机构。

Pika回应量子位，本轮投后最新估值将来到4.7亿美元（约34亿人民币）。

这家由两位斯坦福华人博士创立的公司曾在去年底推出了产品1.0并宣布融资5500万美元。

而后半年，Pika从最初的4人团队扩展至13人，并陆续上线了几项新功能，还在今年4月入选福布斯AI50强榜单。

Pika所在的AI视频生成赛道，今年在技术和投融资领域均迎来双重爆发。

技术方面，OpenAI发布的Sora为行业树立了新的标杆，将时长一举拉到60s，而后开源社区发布了能生成2分钟视频的StreamingT2V，紧接着国内发布了对标Sora能生成16s、分辨率高达1080P的Vidu，再然后谷歌推出同样对标Sora能生成1分钟视频的Veo。

投资方面，继人们对文本和图像生成器的兴趣激增之后，使用AI生成视频被认为是下一个前沿领域，初创企业和大型科技公司都在押注该领域。除了Pika，其他AI视频初创公司Runway和Synthesia也在过去一年里筹集了大量资金。

目前，Pika等初创公司正在快速扩张，因为OpenAI和谷歌的视频工具尚未面向公众开放，这给它们留了一定时间。

那么，自半年前推出1.0以来，Pika后来都在忙啥呢？

AI视频生成赛道，在这段时间还有哪些大事件发生？

Pika最近半年干了啥？

概括而言，Pika近半年除了推出几项“锦上添花”的新功能外，一直在做产品和技术更新。

下面按照时间顺序大概梳理一下。

2023年12月，也就是Pika1.0上线后不久，其研究人员提出了将文本转3D生成速度提高4.7倍的方法。

这一被称为DreamPropeller的嵌入式加速算法，能够优化并增强任何基于分数蒸馏的文本到3D模型生成流程。

之后不久，Pika宣布面向所有公众开放，不过紧跟着推出了其付费订阅模式。

到了今年2月底，Pika宣布推出可以给视频中的人物配音，并同时“对口型”的唇形同步功能Lip Sync。

然后接着在3月份推出AI配音工具Sound Effects，有了这项新功能，用户既可以使用文本生成音效，也可以让Pika直接根据视频内容匹配音效。

至今年4月，Pika在成立不到1年后入选了福布斯AI50强榜单。

以上为Pika最近半年的动向，Pika表示公司目前拥有数百万用户（官方在彭博采访中未提供确切数字），不过能看到Discord上有近80万用户。

AI视频赛道已变天

简单回顾一下，Pika的创始人一共有两位，郭文景（Demi Guo）和Chenlin Meng，都是斯坦福博士。

从二人学术经历来看，她们分别专注于NLP和计算机视觉两个方向的AI研究，也都有生成式AI的学术经历。

这两人在AI生成领域专业背景深厚且技术过硬，以至于在团队仅有4人之时就获得了5500万美元融资。

Pika亮相的时机不可谓不妙，从去年11月开始，一个月内就有5家AI视频生成产品发布或迎来重大更新。

主要包括：

11月3日，Runway的Gen-2发布里程碑式更新，支持4K超逼真的清晰度作品。

11月16日，Meta发布Emu Video，这个工具在用户评估中号称打败Gen-2、Pika等对手。

11月18日，字节发布PixelDance，作品的动态性可谓史无前者，画面中的元素动作幅度都相当大，且不变形，让人眼前一亮。

11月21日，Stable AI也推出了自家的视频工具Stable Video Diffusion。

同在21日，Gen-2上线“涂哪动哪”的运动笔刷新功能，这是生成模型可控性上的一个重要里程碑。

接下来就是Pika在11月29日发布正式版1.0，叫板“老大哥”Runway。

可以说，Pika正是在人们将目光狂热转向视频生成领域时横空出世的，可谓赶上了风口。

但没人预料的到，新年伊始，OpenAI“杀手级”视频生成模型Sora发布，将视频生成的质量拉高了一个档次，时长也拉到了60秒。

Sora的热度盖过了一切，行业后来者也必须得卷起来了。

4月7日，GitHub开源了视频生成模型StreamingT2V，能够生成1200帧、时长120秒的长视频。

紧随其后，4月29日，清华大学与生数科技联合发布了Vidu，画面效果对标Sora，长度可达16秒，还能读懂物理规律。

然后就是谷歌在5月14日的开发者大会上发布了Veo，对标Sora能生成一分钟长视频。

总之，AI视频生成在技术上愈发成熟，也因此带动了行业投融资风潮。

仅在2024年3月一个月，就有三个华人创立的AI视频生成创企获得了融资，且融资额都过了千万美金。

3月7日，总部位于英国伦敦的Haiper（由两位前DeepMind团队的华人工程师建立）宣布产品上线，并已经完成1380万美金融资。

3月13日，由前字节跳动视觉技术负责人创立的爱诗科技，完成一亿元人民币（约合1380万美金）左右的A1轮融资。

3月24日，凭借让霉霉说中文视频火起来的AI数字人产品HeyGen（由前Snap软件工程师徐卓创立）完成一轮6000万美元的融资。

4月23日，爱诗科技完成A2轮超亿元融资，由蚂蚁集团领投。

6月1日，Runway获得1亿美元D轮融资，由谷歌领投。

就在6月5日，生数科技宣布完成数亿元Pre-A轮融资，由北京市人工智能产业投资基金、百度联合领投。

不难看出，AI视频生成今年将迎来新的爆发，而作为顶流之一，Pika自然有人关注。

且Pika现在声称他们已经构建起了自己的“基础模型”，因此不会依赖其他AI公司的技术。

虽然需要不少资金来训练模型，但创始人郭文景透露Pika在这块不需要消耗大量的资金，他们有点类似法国的Mistral AI，可以在较少资金的情况下也能训练出比较好的模型，不过具体没有透露。

最后，今天正值Pika一周年生日（从创始人休学创办Pika开始计算），官方也放出了纪念视频。

接下来，Pika计划在今年晚些时候发布其文本转视频模型的重大更新，这包括两方面，一个是提供更高质量、更长的视频，另一个是确保输出的一致性。

据创始人郭文景透露：

Pika的新工具可以让用户定义一个对象或角色，然后在视频中或最终在不同的剪辑中一致地生成它。

那么，你看好这家公司吗？欢迎在评论区留言讨论。

参考资料：

[1]https://arxiv.org/abs/2311.17082

[2]https://x.com/GoogleDeepMind/status/1790894262193988022

[3]https://streamingt2v.github.io/

[4]https://x.com/pika_labs/status/1797091532455248224

[5]https://pika.art/blog

[6]https://www.washingtonpost.com/technology/2024/06/04/pika-funding-openai-sora-google-video/

[7]https://www.bloomberg.com/news/articles/2024-06-05/spark-capital-jared-leto-back-ai-video-startup-pika

器件型号	数量	器件厂商	器件描述	ECAD模型	参考价格	更多信息
KSZ9131RNXI	1	Microchip Technology Inc	Ethernet Transceiver, PQCC48	ECAD模型下载ECAD模型	$4.24	查看
KSZ8721BL	1	Microchip Technology Inc	DATACOM, ETHERNET TRANSCEIVER, PQFP48	ECAD模型下载ECAD模型	$4.59	查看
KSZ8873MML	1	Microchip Technology Inc	DATACOM, LAN SWITCHING CIRCUIT, PQFP64	ECAD模型下载ECAD模型	暂无数据	查看

器件型号

数量

器件厂商

器件描述

数据手册

ECAD模型

风险等级

参考价格

更多信息

KSZ9131RNXI

Microchip Technology Inc

Ethernet Transceiver, PQCC48