AIGC视频生成工具“有言”测评：AI3D视频未来的发展方向在哪？

AIGC视频生成工具“有言”测评：AI3D视频未来的发展方向在哪？

2024-11-17 04:12 浏览:527

事情是这样的。

最近本社恐遇到一个头大的事儿，就是要真人出镜为我们公司的新产品拍摄一条宣传视频。

作为社恐，怎么拍怎么尬的感觉，你们懂吗？！

本来已经忙到爆炸了，拍了一整天却连一条合格的视频都拍不出来。怎么办？

文生视频如今这么火，效果一个赛一个地炸裂，我为啥不试试Sora、Pika这些AI工具呢...但Sora目前还不能体验，果断选择Runway、Pika试试，毕竟作为文生视频赛道的明星产品，生成效果也是非常牛逼，也支持数字人口播，但是还存在一个更大的问题：它们生成的视频内容不可控，时间短，还不能直接产出一个“靠谱”的商用级宣传视频。

不对，我为啥不去找找虚拟人+AI视频的可商用的AI工具呢...

于是笔者这段时间调研了一些视频生成的工具。并向行业老司机打听了下，最终锁定了一个叫有言的产品：

我的需求是做一个数码产品的讲解视频，要求是有人出镜讲解、有口播稿，视频中出现产品展示。而有言主打的就是拥有海量、高质量、超写实的3D虚拟人角色，所以模仿真人出镜的难题应该可以解决了。

我试用下来，最大的感受是有言将复杂的视频创作过程，拆解成了非常简单的三步：第一步是选择场景和人物，第二步是输入文本和素材，第三步是一键生成，然后就能得到了一个人物形象逼真、动作走位协调、镜头丰富、口播清晰的高质量视频。

放在过去很难想象这样一条专业、实用、高质量的视频在几分钟内就能完成制作和呈现，这一套丝滑的操作着实震惊到我了。出于职业习惯，我顺手扒拉了一下有言背后的技术路线。

其实，AI视频生成模型和应用过去一年层出不穷，比如AI视频鼻祖Runway是市场公认的比较成熟文生视频工具，还有后起之秀Pika，被视为Runway的强有力的对手，再到今年年初爆火的Sora，发布之后立刻抓住了全世界人们的眼球，让大家对“AI+视频”的期待值推向新的高度。

只需几个关键词，就能帮你生成突破想象、极具创意的视频作品，但是，case虽然惊艳，在创意度上基本秒杀普通人，但是距离落地，满足用户真实的视频制作需求还有一定距离。

Runway、Pika这类文生视频（Text to Video）模型只需要输入文本prompt、文本+图片的组合，即可生成一段高清的创意视频。背后都是基于扩散模型实现，也就是大家耳熟的Diffusion Model。现阶段，扩散模型已成为AI视频生成领域的主流技术路径。简单讲，Stable Video Diffusion是一种基于的端到端视频生成技术，其本质是将图像编码到潜在隐空间，在隐空间中完成处理计算，再decode到像素空间。

这意味着我们无法对图像视频的生成过程进行干预和控制，只能通过一遍又一遍地调整prompt输入，来“妄想”它能生成符合预期的视频，显然现阶段的AIGC技术还是做不到完全的指令追随。即使是当前文生视频的SOTA 模型Sora也不能很好地理解真实物理世界的时空规律，很难保证视频中人、镜头、场景的时空一致性。Sora现在体验不了，那就试试最火的Runway和Pika对我同样的需求的生成效果吧。

刚好，有言弥补了文生视频模型当前无法落地的问题——足够实用。

有言目前是全球唯一一个落地的3D视频AIGC原生产品，区别于类Sora这类文生视频，它的3D视频生产过程完全还原了真实世界的视频生产环节，拆解为人物角色、场景、动作表情、声音、运镜、灯光、以及素材，将各个视频要素进行AIGC化，这种技术路径的优势是准确性高、可控性强，解决了Sora代表的路径中无法解决的时空一致性问题，具备内容可控、可任意的视频时长。

另外，大家还记得前段时间特别火的霉霉说中文的视频吗，背后是用2d数字人产品实现的，其本质对已有的视频进行唇形同步，使人物的唇形和语音同步，实现看起来是真人说话的效果。这一类产品的AIGC能力是受限的，首先是需要已有视频作为基础，其次是不能生成新的动作、表情，镜头场景都是不可变的（除非拍摄了大量的视频素材，那这个成本就极高了），所以应用也是有限的。

3d数字人是基于三维图形学（3D Graphics）的一整套AI产线，包含建模modeling，动画 animation，模拟simulation 和渲染rendering，这些步骤共同构成了完整的3D视觉输出。

有言拥有行业内最顶尖的高质量3D数据生产能力，从3D虚拟人建模、AIGC动画能力、AIGC声音合成等3DAIGC算法，普通用户可以借助有言一站式完成所有视频创作的工作环节。

AI技术对普通人的影响不是停留在惊艳于它的高大上，而是将深度研究和简短的创新成果转化为有价值的产品，提升企业的生产效率。这也是我为什么说有言“足够实用”。

AIGC视频生成技术赋予每一个人创作视觉奇迹的能力。从前，制作视频需要专业的团队、昂贵的设备、漫长的周期，而现在文生视频的大爆发，只需轻点指尖，输入几个关键词，AI就能将你的创意转化为精彩的视频作品。

但是我期待看到AI视频生成技术带来的实际生产效率的提升和变革，技术应该服务于产品，产品服务于用户。有言作为一款高质量、高效率、低成本、低门槛、规模化的视频生成产品，不用真人出镜，也不需要拍摄，只需选择虚拟人、场景，输入文本和素材，即可通过AIGC一键生成高质量的3D视频。

而且据官方透露，不久将上线3D虚拟人AIGC功能，你可以上传一张照片，就能生成自己的3D虚拟人形象，还可以对人物进行编辑，人人可以拥有自己专属的3D虚拟形象，整个期待住了！

以上就是本篇文章【AIGC视频生成工具“有言”测评：AI3D视频未来的发展方向在哪？】的全部内容了，欢迎阅览！文章地址：http://xiaoguoguo.dbeile.cn/quote/951.html
行业资讯企业新闻行情企业黄页同类资讯网站地图返回首页多贝乐移动站 http://xiaoguoguo.dbeile.cn/mobile/ , 查看更多