业界动态
开发一个自己的数字人,FACEGOOD把语音驱动表情技术开源了
2024-11-25 18:11

机器之心专栏

开发一个自己的数字人,FACEGOOD把语音驱动表情技术开源了

机器之心编辑部

助力 AI 数字人落地,FACEGOOD (量子动力)正式开源语音驱动表情技术 Audio2Face 技术。本文是对该技术的简要概述。

目前,元宇宙热潮下,AI 数字人也开始涉及众多领域,包含文娱、服务、教育、营销等。市面上出现的 AI 数字人包括功能型 AI 数字人,如虚拟助手、虚拟导游、虚拟客服等;陪伴型 AI 数字人,如虚拟伴侣、虚拟家属等;社会型 AI 数字人,如虚拟主播、虚拟偶像、虚拟教师、虚拟医生、虚拟导购等。

浦发银行的首位银行业数字员工「小浦」

虎牙 AI 数字人晚玉

搜狐新闻客户端联合搜狗推出的首个明星「AI 数字人」主播。

为了实现虚拟数字人的多域化渗透,让更多 AI 数字人的场景落地,FACEGOOD 决定将语音驱动口型的算法技术正式开源,这是 AI 虚拟数字人的核心算法,技术开源后将大程度降低 AI 数字人的开发门槛

项目地址:https://github.com/FACEGOOD/Audio2Face

项目背景

2019 年,第十届中国国际新媒体短片节组委会和 FACEGOOD 联合发布陆川导演 AI 数字人。

陆川导演 AI 数字人形象

观众可以和 AI 数字陆川面对面互动交流,为观众带来打破虚拟空间和现实空间次元壁的实时实感交流互动体验。为了能达到实时交互的效果,FACEGOOD 开发了一套数字人实时语音交互系统,实现了语音到表情动画的实时转换。

如今,FACEGOOD 选择将全套语音驱动表情的技术代码开源,免费提供给广大数字人开发者使用。

技术解读

该技术可以将语音实时转换成表情 blendshape 动画。这样做的原因是在现行的产业中,用 BS 去驱动数字形象的动画表情仍是主流,方便动画艺术家对最终动画产出最艺术调整,传输的数据量小,方便动画在不同的数字形象之间进行传递等等。

基于这些实际生产中的需求,FACEGOOD 对输入和输出数据做了相应的调整,声音数据对应的标签不再是模型动画的点云数据而是模型动画的 blendshape 权重。最终的使用流程如下图 1 所示:

在上面的流程中,FACEGOOD 主要完成 Audio2Face 部分,ASR、TTS 由思必驰智能机器人完成。如果你想用自己的声音,或第三方的,ASR、TTS 可以自行进行替换。

当然,FACEGOOD Audio2face 部分也可根据自己的喜好进行重新训练,比如你想用自己的声音或其它类型的声音,或者不同于 FACEGOOD 使用的模型绑定作为驱动数据,都可以根据下面提到的流程完成自己专属的动画驱动算法模型训练

那么 Audio2Face 这一步的框架是什么样呢?又如何制作自己的训练数据呢?具体如下图 2 所示:

常规的神经网络模型训练大致可以分为三个阶段:数据采集制作、数据预处理和数据模型训练。

最后来看两段效果展示视频:

http://mpvideo.qpic.cn/0b2eyyaagaaatyahfjpguvqvbrwdapdaaaya.f10003.mp4?dis_k=5236a16a9c920fa15931777e5d9c7f69&dis_t=1645604016&vid=wxv_2229691624635318275&format_id=10003&support_redirect=0&mmversion=false

http://mpvideo.qpic.cn/0bc3byabiaaatqagl6pgvvqvadwdcqhaafaa.f10003.mp4?dis_k=952ac3867835d8036ebc97eaa4d8be9a&dis_t=1645604016&vid=wxv_2229692600431755269&format_id=10003&support_redirect=0&mmversion=false

    以上就是本篇文章【开发一个自己的数字人,FACEGOOD把语音驱动表情技术开源了】的全部内容了,欢迎阅览 ! 文章地址:http://xiaoguoguo.dbeile.cn/news/1297.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 多贝乐移动站 http://xiaoguoguo.dbeile.cn/mobile/ , 查看更多   
最新新闻
曹德旺退掉美国绿卡:真正企业家不移民海外,要对国家与历史负责
“美国绿卡”,对于某些人来说是多么有极大的诱惑力,尤其是那些艺术圈里的一些名人,不惜名誉上的得失,挖空心思般地想获得,并
2024春节观察丨春节前夕实探线下金店:每克609元也要买?
央视网消息(记者/杨绎霏 姚抒廷 剪辑/杜安琪 编辑/阚纯裕):2024开年,适逢春节,黄金消费热度高涨。2024年1月,上海黄金交易
李佳琦直播带来的反思:普通女生为何应谨慎医美消费?
在最新一期直播中,知名网红主播李佳琦以其独特的视角引发了关于医美的热议。他公开表示,并不推荐普通女生进行医美项目,理由简
原创电子学生证代替手机进入校园的解决方案是什么?微幼科技
以前的孩子自己组团去玩耍,去学校,现在的孩子后面跟着一位或几位监护人。但当孩子上小学或幼儿园后,双职工家庭在没有老人的情
安利/吐槽|限薪令后内娱爱豆真实收入,大家可以根据名气猜一下自家花花大概赚多少
图里就是乐华发给艺人的税前分成,扣除税,剩下全是艺人的,假设艺人好好缴税,所以别歪楼。其中:B是王一博,2019至2021,分别
冲上热搜!李佳琦称不建议普通女生做医美
在当今这个号称“看脸”的时代,很多普通女生都在思考一个问题:到底要不要尝试医美呢?近日,李佳琦的一番话无疑让这个话题又一
东鹏饮料营收净利实现双增,“存贷双高”与董秘年薪成焦点
经济导报见习记者 贾义航近日,功能饮料龙头(605499.SH)极具热度。一方面,公司在2024年交出158.39亿元营收、63.09%净利增速亮
被61岁白发不染的叶童惊艳到!穿紧身衣毫无赘肉,腰臀比简直逆天
明明是老太太的年纪,却偏偏有少年感!?话说最近61岁的叶童,真的快把网友们迷晕了!当年爆火的《新白娘子传奇》,没想到现在还
东鹏特饮IPO:跟跑30年逆袭中国第一,能否反攻东南亚红牛大本营?
中国功能饮料市场正经历结构性调整,东鹏饮料(集团)股份有限公司(下称“”)依托高品价比错位竞争与深度分销网络实现市场份额
刘强东:京东高管降薪10%到20%,将投数百亿帮员工买房丨邦早报
【刘强东发全员信:京东高管降薪10%到20%,投入数百亿帮员工买房】日前,京东集团创始人、董事会主席刘强东在给全体员工的邮件中