加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 01.基于海量素材,AI一键生成文字转视频
    • 2.一键合成定制AI数字人,堪比真人交互体验
    • 3.大模型落地移动生态,AI原生创作工具出圈
    • 4.结语:文心大模型加速落地,开创视频创作新玩法
  • 推荐器件
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

有这款AI原生视频“神器”,创作者的职业天花板要冲破了?

2023/12/19
2263
阅读需 13 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

作者 |  三北,编辑 |  漠影

实测一键AI生成视频,数字人堪比真人主播。

大模型将如何变革内容创作行业?在PC时代,主要是剪辑师利用专业软件制作视频;在App时代,非专业人士也开始使用移动端工具创作视频,打造自媒体;进入AI时代,随着生成式AI技术爆发,行业又会有哪些新变化?百度旗下一款名为“度加”的AI视频创作工具,试图用一系列创新功能回答这些问题。在度加上,创作者输入一篇文案,便能生成一段素材丰富的视频。▲案例《泰国湄南河上欣赏夕阳》展示它支持对文案、标题、视频素材进行一键AI润色,帮创作者节省大量编辑修改的时间。

如果连脚本都不想写?用户可以使用度加的AI改写功能,或基于热点新闻直接生成文案脚本。不仅能生成所需视频,还能准确追溯信源。

还想要一个主播出镜?近十款风格不同的AI数字人可供选择,一分钟生成逼真的主播报幕。

AI生成视频赛道加速爆发,百度正用一款AI原生的视频创作工具开启视频行业的新玩法。度加的真实使用体感如何?它能为创作者带来什么实在的便利?又是否会成为新的AIGC爆款产品?通过上手体验度加剪辑App和度加创作工具PC客户端,智东西对这些问题进行了深入探讨。

01.基于海量素材,AI一键生成文字转视频

一个视频创作者日常会有这些繁琐工作:提选题、找素材、写脚本、剪辑包装、运营发布……如果有一个AI助手会怎么样?智东西首先从文转视频、AI文案和热点创作三个方面,体验了度加带来的视频创作新玩法。1、输入文案匹配视频,5分钟完成AI人机协作打开度加剪辑App,智东西首先通过“AI成片”板块的文生视频功能,做了一个新闻短视频。▲案例《马斯克终于承认了一款低价新车》展示操作十分简单——进入度加的“AI成片”板块,我将提前写好的文案粘贴到文本框中,点击“一键成片”,大功告成了一大半。

仅约30秒后,一个素材丰富的视频就成功生成了。页面简洁,上侧显示着视频预览,下方是可编辑的音视频轨道。

观看视频预览,视频与文本匹配十分精准。对于个别未匹配到的或可以优化的素材,智东西点击“素材推荐”,便在素材库中一键选择新的视频插入。

也可以通过插入本地素材,将自己此前下载的新闻视频补充进来,进一步完善了刚刚生成的视频。

最后,经过对视频模板、朗读音、背景音乐等方面的简单调整,一个人机协同创作的视频就生成了,前后仅花了不到10分钟。

同样的体验,在度加创作工具PC端上能够如法炮制,智东西也进行了测评,获得了一致的体验。

2、细节里都是AI,从脚本、标题到视频素材全都能润色

度加上,AI融入到了创作的各个环节。比如在《泰国湄南河上欣赏夕阳》视频的创作中,智东西就在文案脚本、标题拟定、视频素材替换等环节用到了AI功能。▲案例《泰国湄南河上欣赏夕阳》展示当智东西将游览了泰国郑王庙时写的一段游记填入到文本框,我立刻获得了AI生成的视频脚本,语言更生动和口语化。

点击“生成视频”,可以看到一个准确网罗了泰国郑王庙素材的视频,画面里的河水、夕阳、游轮等意象与文字描述精准匹配。点击发布,我根据AI推荐换了一个更具有话题度的标题——《30泰铢体验湄南河夕阳游轮,浪漫之旅》,然后就能立马同步到我的百家号账号,还可以下载并上传到其他平台。

可以看到,AI都藏在了这个软件的各个细节里,等待用户探索。3、热点推荐,文案也不用写了,全都用AI生成上面提到的都是有文案的基础上AI成片,如果我还没有文案,甚至没有选题思路,该怎么办呢?度加可以实现“找选题-写脚本-生成视频”全流程AI包办。基于此,智东西制作了题为《王阳明心学精髓是什么》的短视频。▲案例《王阳明心学精髓是什么》展示当智东西点击热门推荐榜单中的“王阳明心学精髓是什么”话题,点击“生成文案”,一个脚本文案在30秒左右立马生成。

我可以在此基础上进行编辑,然后点击“去创作”,短短几十秒之后,一个图文并茂的短视频就生成了。视频素材匹配准确,基本无需修改就能直接用。

这一功能在度加创作工具PC端上同样适用。新闻讲求真实性,信源追溯对自媒体创作来说至关重要。通过点击度加推荐热点旁的“搜索”符号,我发现能快速获取第一信源,从而对事实有一个及时了解。比如当我在度加创作工具PC端,点击“罗永浩支持董宇辉创业”这一话题旁的“搜索”,我很快地找到了新闻的第一手信源,看到了罗永浩发的微博原文,这对核实信息来说十分实用。

可以看到,基于百度移动生态能力,度加已经落地了相对成熟的文稿转视频能力。相比于剪映、快影等市面上的其他剪辑工具,度加或许开辟了新一代的AI视频创作玩法。用户点击热点,会自动生成视频文稿,然后文稿会转成视频,几次点击就能生成质量不错的视频。用户在操作完成后,还可以对素材、字幕等细节进行检查和修改。度加相关负责人告诉智东西,团队目前正在积极探索原生视频技术,会在2024年逐步落地在度加产品上。

2.一键合成定制AI数字人,堪比真人交互体验

生成式AI还带来了AI数字人的爆发,这是度加的另一大杀手锏。在度加剪辑App上,智东西看到有近十款风格各异的AI数字人可供选择。其中既有正式西装的精英,又有形象温婉的邻家姐姐,从五官细节到动作表情都十分逼真。比如,智东西就用正式西装AI数字人模板,生成了一个题为《零下34度电动车好开吗?》的视频。而全程,也不过花了5分钟左右,这可比真人录制要快得多。▲案例《零下34度电动车好开吗?》展示智东西先是直接粘贴了预先写好的文案,然后点击“生成视频”。

在经过近1分钟的等待后,一个逼真的数字人的口播初版视频就形成了。

接下来,我又进行了AI辅助的二创。AI会自动识别文案中的关键词,并提供相关素材的推荐,供我插入视频,丰富镜头语言。

比如度加就自动识别了“特斯拉”一词,推荐了一系列特斯拉相关视频供我选择插入,智东西便选择了一个插入。

对于度加没自动选中的词,比如“家用充电桩”,智东西自己抹选并在度加素材库里挑选了对应视频,与数字人口播进行了穿插播放。

经过多处关键词的素材选择和插入,一个主播和视频素材混剪的视频就生成了。AI数字人创作同样支持热点推荐和AI文案。比如当我输入一段较官方的“北京发布大模型三大重要成果”为主题的文案,度加可以用AI帮我改写出一段更简洁、口语化的脚本。检查发现,这段话无需修改就能直接用。

如下所示,这是生成式数字人口播视频。▲案例《北京发布大模型三大重要成果》展示度加相关负责人告诉智东西,数字人目前对于各行业的触达效果比较明显,用户对于数字人的接受程度和认知也越来越高,不再是单一的“纸片人”,而是拥有着更多形态、性格、语言方式的“数字生命”。与剪映、快影等其他同行相比,度加的数字人功能已经可以覆盖到各个领域的创作者,范围广泛,例如知识型创作者、娱乐和热点类创作者、美妆和医美赛道创作者……各行各业的创作者们都可以使用度加数字人进行内容创作,让AI为内容创作赋能。

3.大模型落地移动生态,AI原生创作工具出圈

度加相关负责人告诉智东西,视频创作的发展历程可以大概划分为三个阶段:一是PC时代,以Premiere和After Effects等传统编辑器为主,学习成本较高,主要是专业的剪辑师在使用,日活跃用户在百万量级。二是App时代,以快影和剪映等移动端产品为主,操作成本低,用户上传一张图片就能通过模版变为视频,不需要学习剪辑技巧,全球日活跃用户接近1亿。三是AI时代,用户只需要输入Prompt(提示词),就能生成视频,操作成本进一步降低,生产的效果极具创意,不再受限于用户已有的图片和视频素材,未来产品的日活跃用户会达到5亿+。

那么在AI时代,视频生产的“AI原生”意味着什么?

“重点还是需要明确用户在创作过程中,是AI+而不是+AI 。”度加相关负责人称,“我们所推进的AI+,正是端到端的通过AI来进行提效或者创作生成。”度加AI原生创作者使用度加的产品功能,就可以享受到AI+的创作支持。这离不开百度移动生态丰富的素材支持。百度拥有百家号海量素材库实时更新,视觉中国图片库丰富且质量较高;在追热点方面,热点事件半小时内入库,实时更新,覆盖广泛垂类,助媒体人追热点快人一步。同时,度加基于百度集团文心大模型的深厚底座支持,并在AI数字人、AI文案等赛道具有多年的经验积累,这都使得度加的AI功能的性能更佳,使用体验更流畅,从而做到真正的降本增效。

4.结语:文心大模型加速落地,开创视频创作新玩法

一键生成文字转视频,一分钟合成定制AI数字人,百度通过一款产品开启了AI原生视频创作的新玩法。经过体验,我们发现通用AI人机协同创作的雏形,已经在这一名为“度加”的产品里有所体现。背后,百度将其移动生态大量级素材与文心大模型相结合,打通了技术与应用场景的“最后一公里”,从而开创了视频创作的新玩法。度加的上线只是一个开始,AI文生原生视频等新功能也正在迭代计划中。百度能否在AI时代持续占领内容创作行业的先机,我们将持续关注。

推荐器件

更多器件
器件型号 数量 器件厂商 器件描述 数据手册 ECAD模型 风险等级 参考价格 更多信息
STM32F205RCT6 1 STMicroelectronics High-performance Arm Cortex-M3 MCU with 256 Kbytes of Flash memory, 120 MHz CPU, ART Accelerator

ECAD模型

下载ECAD模型
$27.28 查看
AT90CAN128-16MUR 1 Microchip Technology Inc IC MCU 8BIT 128KB FLASH 64QFN
$7.13 查看
ATXMEGA128A3U-MH 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, 9 X 9 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, MO-220VMMD, MLF-64
$6.98 查看
百度

百度

百度是拥有强大互联网基础的领先AI公司。是全球为数不多的提供AI芯片、软件架构和应用程序等全栈AI技术的公司之一,被国际机构评为全球四大AI公司之一。百度以“用科技让复杂的世界更简单”为使命,坚持技术创新,致力于“成为最懂用户,并能帮助人们成长的全球顶级高科技公司”。

百度是拥有强大互联网基础的领先AI公司。是全球为数不多的提供AI芯片、软件架构和应用程序等全栈AI技术的公司之一,被国际机构评为全球四大AI公司之一。百度以“用科技让复杂的世界更简单”为使命,坚持技术创新,致力于“成为最懂用户,并能帮助人们成长的全球顶级高科技公司”。收起

查看更多

相关推荐

电子产业图谱