最新动态
AIGC视频生成工具“有言”测评:AI3D视频未来的发展方向在哪?
2024-11-17 04:12  浏览:67

事情是这样的。

AIGC视频生成工具“有言”测评:AI3D视频未来的发展方向在哪?

最近本社恐遇到一个头大的事儿,就是要真人出镜为我们公司的新产品拍摄一条宣传视频。

作为社恐,怎么拍怎么尬的感觉,你们懂吗?!

本来已经忙到爆炸了,拍了一整天却连一条合格的视频都拍不出来。怎么办?

文生视频如今这么火,效果一个赛一个地炸裂,我为啥不试试Sora、Pika这些AI工具呢...但Sora目前还不能体验,果断选择Runway、Pika试试,毕竟作为文生视频赛道的明星产品,生成效果也是非常牛逼,也支持数字人口播,但是还存在一个更大的问题:它们生成的视频内容不可控,时间短,还不能直接产出一个“靠谱”的商用级宣传视频。

不对,我为啥不去找找虚拟人+AI视频的可商用的AI工具呢...

于是笔者这段时间调研了一些视频生成的工具。并向行业老司机打听了下,最终锁定了一个叫有言的产品:

我的需求是做一个数码产品的讲解视频,要求是有人出镜讲解、有口播稿,视频中出现产品展示。而有言主打的就是拥有海量、高质量、超写实的3D虚拟人角色,所以模仿真人出镜的难题应该可以解决了。

我试用下来,最大的感受是有言将复杂的视频创作过程,拆解成了非常简单的三步:第一步是选择场景和人物,第二步是输入文本和素材,第三步是一键生成,然后就能得到了一个人物形象逼真、动作走位协调、镜头丰富、口播清晰的高质量视频。

放在过去很难想象这样一条专业、实用、高质量的视频在几分钟内就能完成制作和呈现,这一套丝滑的操作着实震惊到我了。出于职业习惯,我顺手扒拉了一下有言背后的技术路线。

其实,AI视频生成模型和应用过去一年层出不穷,比如AI视频鼻祖Runway是市场公认的比较成熟文生视频工具,还有后起之秀Pika,被视为Runway的强有力的对手, 再到今年年初爆火的Sora,发布之后立刻抓住了全世界人们的眼球,让大家对“AI+视频”的期待值推向新的高度。

只需几个关键词,就能帮你生成突破想象、极具创意的视频作品,但是,case虽然惊艳,在创意度上基本秒杀普通人,但是距离落地,满足用户真实的视频制作需求还有一定距离。

Runway、Pika这类文生视频(Text to Video)模型只需要输入文本prompt、文本+图片的组合,即可生成一段高清的创意视频。背后都是基于扩散模型实现,也就是大家耳熟的Diffusion Model。现阶段,扩散模型已成为AI视频生成领域的主流技术路径。简单讲,Stable Video Diffusion是一种基于的端到端视频生成技术,其本质是将图像编码到潜在隐空间,在隐空间中完成处理计算,再decode到像素空间。

这意味着我们无法对图像视频的生成过程进行干预和控制,只能通过一遍又一遍地调整prompt输入,来“妄想”它能生成符合预期的视频,显然现阶段的AIGC技术还是做不到完全的指令追随。即使是当前文生视频的SOTA 模型Sora也不能很好地理解真实物理世界的时空规律,很难保证视频中人、镜头、场景的时空一致性。Sora现在体验不了,那就试试最火的Runway和Pika对我同样的需求的生成效果吧。

刚好,有言弥补了文生视频模型当前无法落地的问题——足够实用。

有言目前是全球唯一一个落地的3D视频AIGC原生产品,区别于类Sora这类文生视频,它的3D视频生产过程完全还原了真实世界的视频生产环节,拆解为人物角色、场景、动作表情、声音、运镜、灯光、以及素材,将各个视频要素进行AIGC化,这种技术路径的优势是准确性高、可控性强,解决了Sora代表的路径中无法解决的时空一致性问题,具备内容可控、可任意的视频时长。

另外,大家还记得前段时间特别火的霉霉说中文的视频吗,背后是用2d数字人产品实现的,其本质对已有的视频进行唇形同步,使人物的唇形和语音同步,实现看起来是真人说话的效果。这一类产品的AIGC能力是受限的,首先是需要已有视频作为基础,其次是不能生成新的动作、表情,镜头场景都是不可变的(除非拍摄了大量的视频素材,那这个成本就极高了),所以应用也是有限的。

3d数字人是基于三维图形学(3D Graphics)的一整套AI产线,包含建模modeling,动画 animation,模拟simulation 和渲染rendering,这些步骤共同构成了完整的3D视觉输出。

有言拥有行业内最顶尖的高质量3D数据生产能力,从3D虚拟人建模、AIGC动画能力、AIGC声音合成等3DAIGC算法,普通用户可以借助有言一站式完成所有视频创作的工作环节。

AI技术对普通人的影响不是停留在惊艳于它的高大上,而是将深度研究和简短的创新成果转化为有价值的产品,提升企业的生产效率。这也是我为什么说有言“足够实用”。

AIGC视频生成技术赋予每一个人创作视觉奇迹的能力。从前,制作视频需要专业的团队、昂贵的设备、漫长的周期,而现在文生视频的大爆发,只需轻点指尖,输入几个关键词,AI就能将你的创意转化为精彩的视频作品。

但是我期待看到AI视频生成技术带来的实际生产效率的提升和变革,技术应该服务于产品,产品服务于用户。有言作为一款高质量、高效率、低成本、低门槛、规模化的视频生成产品,不用真人出镜,也不需要拍摄,只需选择虚拟人、场景,输入文本和素材,即可通过AIGC一键生成高质量的3D视频。

而且据官方透露,不久将上线3D虚拟人AIGC功能,你可以上传一张照片,就能生成自己的3D虚拟人形象,还可以对人物进行编辑,人人可以拥有自己专属的3D虚拟形象,整个期待住了!

    以上就是本篇文章【AIGC视频生成工具“有言”测评:AI3D视频未来的发展方向在哪?】的全部内容了,欢迎阅览 ! 文章地址:http://xiaoguoguo.dbeile.cn/quote/951.html 
     行业      资讯      企业新闻      行情      企业黄页      同类资讯      网站地图      返回首页 多贝乐移动站 http://xiaoguoguo.dbeile.cn/mobile/ , 查看更多