推广 热搜： 行业金中国企业系统设备公司杯服务教师

首页 > 行业动态 > 最新动态

AIGC视频生成工具“有言”测评：AI3D视频未来的发展方向在哪？

日期：2024-11-17 浏览：527 移动：http://xiaoguoguo.dbeile.cn/mobile/quote/951.html

事情是这样的。

AIGC视频生成工具“有言”测评：AI3D视频未来的发展方向在哪？

最近本社恐遇到一个头大的事儿，就是要真人出镜为我们公司的新产品拍摄一条宣传视频。

作为社恐，怎么拍怎么尬的感觉，你们懂吗？！

本来已经忙到爆炸了，拍了一整天却连一条合格的视频都拍不出来。怎么办？

文生视频如今这么火，效果一个赛一个地炸裂，我为啥不试试Sora、Pika这些AI工具呢...但Sora目前还不能体验，果断选择Runway、Pika试试，毕竟作为文生视频赛道的明星产品，生成效果也是非常牛逼，也支持数字人口播，但是还存在一个更大的问题：它们生成的视频内容不可控，时间短，还不能直接产出一个“靠谱”的商用级宣传视频。

不对，我为啥不去找找虚拟人+AI视频的可商用的AI工具呢...

于是笔者这段时间调研了一些视频生成的工具。并向行业老司机打听了下，最终锁定了一个叫有言的产品：

我的需求是做一个数码产品的讲解视频，要求是有人出镜讲解、有口播稿，视频中出现产品展示。而有言主打的就是拥有海量、高质量、超写实的3D虚拟人角色，所以模仿真人出镜的难题应该可以解决了。

我试用下来，最大的感受是有言将复杂的视频创作过程，拆解成了非常简单的三步：第一步是选择场景和人物，第二步是输入文本和素材，第三步是一键生成，然后就能得到了一个人物形象逼真、动作走位协调、镜头丰富、口播清晰的高质量视频。

放在过去很难想象这样一条专业、实用、高质量的视频在几分钟内就能完成制作和呈现，这一套丝滑的操作着实震惊到我了。出于职业习惯，我顺手扒拉了一下有言背后的技术路线。

其实，AI视频生成模型和应用过去一年层出不穷，比如AI视频鼻祖Runway是市场公认的比较成熟文生视频工具，还有后起之秀Pika，被视为Runway的强有力的对手，再到今年年初爆火的Sora，发布之后立刻抓住了全世界人们的眼球，让大家对“AI+视频”的期待值推向新的高度。

只需几个关键词，就能帮你生成突破想象、极具创意的视频作品，但是，case虽然惊艳，在创意度上基本秒杀普通人，但是距离落地，满足用户真实的视频制作需求还有一定距离。

Runway、Pika这类文生视频（Text to Video）模型只需要输入文本prompt、文本+图片的组合，即可生成一段高清的创意视频。背后都是基于扩散模型实现，也就是大家耳熟的Diffusion Model。现阶段，扩散模型已成为AI视频生成领域的主流技术路径。简单讲，Stable Video Diffusion是一种基于的端到端视频生成技术，其本质是将图像编码到潜在隐空间，在隐空间中完成处理计算，再decode到像素空间。

这意味着我们无法对图像视频的生成过程进行干预和控制，只能通过一遍又一遍地调整prompt输入，来“妄想”它能生成符合预期的视频，显然现阶段的AIGC技术还是做不到完全的指令追随。即使是当前文生视频的SOTA 模型Sora也不能很好地理解真实物理世界的时空规律，很难保证视频中人、镜头、场景的时空一致性。Sora现在体验不了，那就试试最火的Runway和Pika对我同样的需求的生成效果吧。

刚好，有言弥补了文生视频模型当前无法落地的问题——足够实用。

有言目前是全球唯一一个落地的3D视频AIGC原生产品，区别于类Sora这类文生视频，它的3D视频生产过程完全还原了真实世界的视频生产环节，拆解为人物角色、场景、动作表情、声音、运镜、灯光、以及素材，将各个视频要素进行AIGC化，这种技术路径的优势是准确性高、可控性强，解决了Sora代表的路径中无法解决的时空一致性问题，具备内容可控、可任意的视频时长。

另外，大家还记得前段时间特别火的霉霉说中文的视频吗，背后是用2d数字人产品实现的，其本质对已有的视频进行唇形同步，使人物的唇形和语音同步，实现看起来是真人说话的效果。这一类产品的AIGC能力是受限的，首先是需要已有视频作为基础，其次是不能生成新的动作、表情，镜头场景都是不可变的（除非拍摄了大量的视频素材，那这个成本就极高了），所以应用也是有限的。

3d数字人是基于三维图形学（3D Graphics）的一整套AI产线，包含建模modeling，动画 animation，模拟simulation 和渲染rendering，这些步骤共同构成了完整的3D视觉输出。

有言拥有行业内最顶尖的高质量3D数据生产能力，从3D虚拟人建模、AIGC动画能力、AIGC声音合成等3DAIGC算法，普通用户可以借助有言一站式完成所有视频创作的工作环节。

AI技术对普通人的影响不是停留在惊艳于它的高大上，而是将深度研究和简短的创新成果转化为有价值的产品，提升企业的生产效率。这也是我为什么说有言“足够实用”。

AIGC视频生成技术赋予每一个人创作视觉奇迹的能力。从前，制作视频需要专业的团队、昂贵的设备、漫长的周期，而现在文生视频的大爆发，只需轻点指尖，输入几个关键词，AI就能将你的创意转化为精彩的视频作品。

但是我期待看到AI视频生成技术带来的实际生产效率的提升和变革，技术应该服务于产品，产品服务于用户。有言作为一款高质量、高效率、低成本、低门槛、规模化的视频生成产品，不用真人出镜，也不需要拍摄，只需选择虚拟人、场景，输入文本和素材，即可通过AIGC一键生成高质量的3D视频。

而且据官方透露，不久将上线3D虚拟人AIGC功能，你可以上传一张照片，就能生成自己的3D虚拟人形象，还可以对人物进行编辑，人人可以拥有自己专属的3D虚拟形象，整个期待住了！

本文地址：http://xiaoguoguo.dbeile.cn/quote/951.html 多贝乐 http://xiaoguoguo.dbeile.cn/ , 查看更多

特别提示：本信息由相关企业自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

相关行业动态

推荐行业动态

点击排行

网站首页 | 关于我们 | 联系方式 | 使用协议 | 版权隐私 | 网站地图 | 排名推广 | 广告服务 | 积分换礼 | 网站留言 | RSS订阅 | 违规举报 | 鄂ICP备2023001713号

(c)2008-现在多贝乐版权所有 QQ:3510875288 sitemap wla www wlb wlc