加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • Pika最近半年干了啥?
    • AI视频赛道已变天
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

郭文景Pika再融5.8个亿,最新估值约34亿,已自研AI视频生成基础模型

06/09 08:30
1029
阅读需 11 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

一水 发自 凹非寺

量子位 | 公众号 QbitAI

AI视频顶流Pika拿着8000万美元(约5.8亿人民币)新融资又杀回来了!

投资者包括Spark Capital(领投)、Lightspeed和Greycrof等著名机构。

Pika回应量子位,本轮投后最新估值将来到4.7亿美元(约34亿人民币)。

这家由两位斯坦福华人博士创立的公司曾在去年底推出了产品1.0并宣布融资5500万美元。

而后半年,Pika从最初的4人团队扩展至13人,并陆续上线了几项新功能,还在今年4月入选福布斯AI50强榜单。

Pika所在的AI视频生成赛道,今年在技术投融资领域均迎来双重爆发。

技术方面OpenAI发布的Sora为行业树立了新的标杆,将时长一举拉到60s,而后开源社区发布了能生成2分钟视频的StreamingT2V,紧接着国内发布了对标Sora能生成16s、分辨率高达1080P的Vidu,再然后谷歌推出同样对标Sora能生成1分钟视频的Veo。

投资方面,继人们对文本和图像生成器的兴趣激增之后,使用AI生成视频被认为是下一个前沿领域,初创企业和大型科技公司都在押注该领域。除了Pika,其他AI视频初创公司Runway和Synthesia也在过去一年里筹集了大量资金。

目前,Pika等初创公司正在快速扩张,因为OpenAI和谷歌的视频工具尚未面向公众开放,这给它们留了一定时间。

那么,自半年前推出1.0以来,Pika后来都在忙啥呢?

AI视频生成赛道,在这段时间还有哪些大事件发生?

Pika最近半年干了啥?

概括而言,Pika近半年除了推出几项“锦上添花”的新功能外,一直在做产品和技术更新。

下面按照时间顺序大概梳理一下。

2023年12月,也就是Pika1.0上线后不久,其研究人员提出了将文本转3D生成速度提高4.7倍的方法。

这一被称为DreamPropeller嵌入式加速算法,能够优化并增强任何基于分数蒸馏的文本到3D模型生成流程。

之后不久,Pika宣布面向所有公众开放,不过紧跟着推出了其付费订阅模式

到了今年2月底,Pika宣布推出可以给视频中的人物配音,并同时“对口型”的唇形同步功能Lip Sync

然后接着在3月份推出AI配音工具Sound Effects,有了这项新功能,用户既可以使用文本生成音效,也可以让Pika直接根据视频内容匹配音效

至今年4月,Pika在成立不到1年后入选了福布斯AI50强榜单。

以上为Pika最近半年的动向,Pika表示公司目前拥有数百万用户(官方在彭博采访中未提供确切数字),不过能看到Discord上有近80万用户。

AI视频赛道已变天

简单回顾一下,Pika的创始人一共有两位,郭文景(Demi Guo)和Chenlin Meng,都是斯坦福博士。

从二人学术经历来看,她们分别专注于NLP计算机视觉两个方向的AI研究,也都有生成式AI的学术经历。

这两人在AI生成领域专业背景深厚且技术过硬,以至于在团队仅有4人之时就获得了5500万美元融资。

Pika亮相的时机不可谓不妙,从去年11月开始,一个月内就有5家AI视频生成产品发布或迎来重大更新。

主要包括:

11月3日,Runway的Gen-2发布里程碑式更新,支持4K超逼真的清晰度作品。

11月16日,Meta发布Emu Video,这个工具在用户评估中号称打败Gen-2、Pika等对手。

11月18日,字节发布PixelDance,作品的动态性可谓史无前者,画面中的元素动作幅度都相当大,且不变形,让人眼前一亮。

11月21日,Stable AI也推出了自家的视频工具Stable Video Diffusion

同在21日,Gen-2上线“涂哪动哪”的运动笔刷新功能,这是生成模型可控性上的一个重要里程碑。

接下来就是Pika在11月29日发布正式版1.0,叫板“老大哥”Runway。

可以说,Pika正是在人们将目光狂热转向视频生成领域时横空出世的,可谓赶上了风口。

但没人预料的到,新年伊始,OpenAI“杀手级”视频生成模型Sora发布,将视频生成的质量拉高了一个档次,时长也拉到了60秒。

Sora的热度盖过了一切,行业后来者也必须得卷起来了。

4月7日,GitHub开源了视频生成模型StreamingT2V,能够生成1200帧、时长120秒的长视频。

紧随其后,4月29日,清华大学与生数科技联合发布了Vidu,画面效果对标Sora,长度可达16秒,还能读懂物理规律。

然后就是谷歌在5月14日的开发者大会上发布了Veo,对标Sora能生成一分钟长视频。

总之,AI视频生成在技术上愈发成熟,也因此带动了行业投融资风潮。

仅在2024年3月一个月,就有三个华人创立的AI视频生成创企获得了融资,且融资额都过了千万美金

3月7日,总部位于英国伦敦的Haiper(由两位前DeepMind团队的华人工程师建立)宣布产品上线,并已经完成1380万美金融资。

3月13日,由前字节跳动视觉技术负责人创立的爱诗科技,完成一亿元人民币(约合1380万美金)左右的A1轮融资。

3月24日,凭借让霉霉说中文视频火起来的AI数字人产品HeyGen(由前Snap软件工程师徐卓创立)完成一轮6000万美元的融资。

4月23日,爱诗科技完成A2轮超亿元融资,由蚂蚁集团领投。

6月1日,Runway获得1亿美元D轮融资,由谷歌领投。

就在6月5日,生数科技宣布完成数亿元Pre-A轮融资,由北京市人工智能产业投资基金、百度联合领投。

不难看出,AI视频生成今年将迎来新的爆发,而作为顶流之一,Pika自然有人关注。

且Pika现在声称他们已经构建起了自己的“基础模型”,因此不会依赖其他AI公司的技术。

虽然需要不少资金来训练模型,但创始人郭文景透露Pika在这块不需要消耗大量的资金,他们有点类似法国的Mistral AI,可以在较少资金的情况下也能训练出比较好的模型,不过具体没有透露。

最后,今天正值Pika一周年生日(从创始人休学创办Pika开始计算),官方也放出了纪念视频。

接下来,Pika计划在今年晚些时候发布其文本转视频模型的重大更新,这包括两方面,一个是提供更高质量、更长的视频,另一个是确保输出的一致性。

据创始人郭文景透露:

Pika的新工具可以让用户定义一个对象或角色,然后在视频中或最终在不同的剪辑中一致地生成它。

那么,你看好这家公司吗?欢迎在评论区留言讨论。

参考资料:

[1]https://arxiv.org/abs/2311.17082

[2]https://x.com/GoogleDeepMind/status/1790894262193988022

[3]https://streamingt2v.github.io/

[4]https://x.com/pika_labs/status/1797091532455248224

[5]https://pika.art/blog

[6]https://www.washingtonpost.com/technology/2024/06/04/pika-funding-openai-sora-google-video/

[7]https://www.bloomberg.com/news/articles/2024-06-05/spark-capital-jared-leto-back-ai-video-startup-pika

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
LTC2875HS8#PBF 1 Linear Technology LTC2875 - ±60V Fault Protected 3.3V or 5V 25kV ESD High Speed CAN Transceiver; Package: SO; Pins: 8; Temperature Range: -40°C to 125°C
$3.57 查看
SGTL5000XNAA3R2 1 Freescale Semiconductor Audio Codec , Ultra Low-Power, 4 mw for DAC-to-HP, 98 dB SNR and -80 dB THD+N, QFN 32, Reel

ECAD模型

下载ECAD模型
$3.53 查看
ISO1042DWV 1 Texas Instruments Isolated CAN transceiver with 70-V bus fault protection & flexible data rate 8-SOIC -40 to 125

ECAD模型

下载ECAD模型
暂无数据 查看

相关推荐

电子产业图谱