推广 热搜: 未来    中国  企业  服务  政策  公司  快速  上海  设备 

行业报告丨生成式 AI 海内外公司布局梳理(下)

   日期:2024-12-03     作者:caijiyuan    caijiyuan   评论:0    移动:http://xiaoguoguo.dbeile.cn/mobile/news/2508.html
核心提示:原创 | 文 BTF机器人03 百度(1)广告收入增长趋缓,AI 成业务增长新驱动核心广告业务增长乏力 。百度是国内搜索及AI领域头部公

原创 | 文 BTF机器人

行业报告丨生成式 AI 海内外公司布局梳理(下)

03 百度

(1)广告收入增长趋缓,AI 成业务增长新驱动核心广告业务增长乏力 。

百度是国内搜索及AI领域头部公司,业务收入主要来自搜索广告带来的在线市场服务,自2018年以来收入规模基本在700亿元,增长较为乏力。

新业务均以AI 作为重要技术底座。除了百度及爱奇艺的广告收入,公司其他服务包括云服务、智能设备及服务、智能驾驶等,与人工智能技术有较强关联,是当前公司重点发力投入的第二、第三曲线业务,2021年收入达到438亿元,2017-2021年复合增长率为39%。

百度收入(亿元)

百度收入结构

其他服务收入的快速增长,得益于公司在AI领域的丰富积累与积极投入。

2017 年 All in AI,AI 生态逐步建立。据中国基金报,百度目前已投入了数十亿美元研究AI,多年来一直努力从网络营销向更深层次的技术转型。

当前,百度的AI生态集成为“百度大脑”,包含汽车及自动驾驶领域的开放人工智能平台百度Apollo平台,对话式的人工智能解决方案DuerOS,以及集合人工智能、大数据与云计算的服务方案百度智能云等。到2017年7月,公司总裁陆琪在百度世界大会上正式宣布All in AI。此后,公司又推出开源平台PaddlePaddle、大规模机器学习模型文心Ernie系统等。

百度的AI生态集成——百度大脑

百度AI布局重要节点

(2)近期提出计划推出类ChatGPT

对于生成式AI,百度也表达了密切的关注,并已有较多产品布局。百度CEO李彦宏表示,类似ChatGPT的技术很火,如何用在搜索场景上并帮助用户提升效率,2023年百度在这方面会“非常有机会。”于23年1月举办的2022 “人机共创大会”百度Create大会,也多次借助AIGC创造、搭建数字化演讲场景。百度在AIGC领域已有较多布局,涵盖虚拟人、剧本创作、图片视频生成等。

类ChatGPT 产品或有望提振百度流量及搜索广告收入。据科创板日报,百度或计划推出与ChatGPT类似的人工智能聊天机器人服务,具体推出时间尚不确定。据财联社,百度CEO李彦宏对该项目的定位是“引领搜索体验的代际变革”;据澎湃新闻,百度搜索杰出架构师辜斯缪在23年1月初表示,百度搜索今年在技术上最重要的工作就是要把整个检索系统变成检索+生成双模系统。

若百度推出类 ChatGPT 产品,则或与百度搜索引擎结合,进而优化搜索体验,若结合后产生较好的使用效果,则有望提振百度的流量乃至广告收入。

百度AIGC产品版图

(3)类 ChatGPT 产品:或受益于文心Ernie系统积累

或以文心Ernie 系统为底层模型。据36氪,百度或推出的类ChatGPT产品,以大规模机器学习模型文心Ernie系统为基础,已经过多年的数据训练,会让用户获得对话式的搜索结果。我们认为,文心Ernie系统或在训练数据、AIGC运用经验上,为可能推出的类ChatGPT产品提供支持。

用于训练的数据丰富,优化搜索结果:

文心Ernie系统自2019年发布以来,在语言理解、文本生成、跨模态语义理解等领域取得了多项技术突破,已吸引超6万开发者,运用在能源、金融、传媒、社科等众多领域。据中国日报、新华网等,其在公开权威语义评测中斩获了超十项世界冠军,2020年荣获世界人工智能大会WAIC最高奖项SAIL奖。

凭借众多产业内的数据积累,文心Ernie系统或可帮助百度的类ChatGPT产品提供充分的用于训练的数据,从而优化搜索结果。

百度文心大模型

已拥有3个AIGC模型,可生成文本、图片、视频内容:

文心 ERNIE 3.0 Zeus模型可生成诗歌、剧本、小说等多类型文本创作;基于文心 ERNIE-ViLG 2.0的AI绘画应用百度文心一格,通过一段描述文本所生成的图片,将更加关注文本和图像中核心语义元素,让图片更贴近用户需求;视频内容生成与编辑技术,能基于一个视觉画面或者一段描述文本,生成高清、流畅的视频内容。

文心一格 以“ 危机和希望 ”为关键词生成的 AIGC 图片

基于文心Ernie的数字人具备相近内容生成能力。据百度AI,2022年6月,基于文心Ernie的百度AI数字人度晓晓,也已具备写作、绘画、歌曲等内容的智能生成能力,包括全国高考作文写作48分(60满分)、作画参加西安美术学院毕业展、联合龚俊数字人推出国内首个虚拟偶像 AIGC 创作歌曲、两会新闻播报等。

随着模型的进一步成熟,百度或推出的类ChatGPT 产品有望提供较好的搜索反馈。

度晓晓书写高考英语作文

(4)AI驱动数字人:优化数字人的制作、交互流程

以AI 驱动虚拟人,参与内容创作输出。百度也将AIGC运用到数字人领域,自2020年9月15日百度推出首个虚拟偶像度晓晓以来,百度已推出4位基于AI的自有数字人形象,并可完成作画、作曲、聊天互动、参加综艺等活动。

首个实现AIGC 的数字虚拟偶像希加加。百度在22年2月推出希加加,其形象包括名字、发型、妆容等均由AI生成,且可以完成AI思维创作、AI剪辑、AI作画、AI作曲。

百度输入法推出国内首款情感陪伴型虚拟博主林开开和叶悠悠。22年8月,两位博主上线百度输入法的AI侃侃功能,为用户提供24小时在线陪伴对话,可支持文字、语音、表情包聊天互动。

百度的数字人家族入驻快手。22年11月,4个百度数字人,即希加加、度晓晓、林开开、叶悠悠在快手账号发布入驻快手短视频。未来数字人家族将参与一系列活动,包括加入爱奇艺出品的闯关游戏真人秀《元音大冒险》,数字人的实时驱动、虚拟表演秀、动捕游戏均由百度智能云曦灵技术支持,也在快手进行24小时AI直播等。

百度的数字人家族演绎AIGC歌曲。23年1月,2022 百度Create大会上,百度数字人家族共同演绎了歌曲《技术有答案》,这首歌的词、曲、MV都是由百度AIGC生成。

百度数字人家族入驻快手

真人秀《元音大冒险》的虚拟人

以百度为例,AIGC 或是解决数字人发展痛点的有效工具。

百度于21年12月推出“百度智能云曦灵”数字人平台,为AIGC平台,可提供数字人生成、内容生产、业务配置服务,帮助广电、互娱、金融、政务、运营商、零售等行业开展一站式的虚拟数字人的创建与运营服务。该平台运用了四大引擎,可分别解决数字人的部分问题:

人像驱动:解决表情动作问题,缩短生成时间。借助4D扫描、智能绑定等AI技术,该引擎可驱动数字人的唇形、肢体、表情等,让数字人表情、动作更生动,将可被AI驱动的高精3D数字人生成时间,由3个月缩短为一周。

智能对话:解决语言理解力问题。拥有AI技术支持的智能对话平台UNIT,开发者能为数字人快速定制对话能力,满足各类应用场景需求,加数字人的自然语言理解能力。

语音交互:提高交互效率。据东西互娱,该引擎可让数字人自然畅通交流,音画同步准确度高,逐字口型准确率大于98.5%;也能让数字人根据输入的文本/语音信息,来生成表情丰富逼真的人像动画。例如百度智能云曦灵为央视网打造的虚拟主持人小C,已于21年3月与全国人大代表梁倩娟进行了独家实时对话。

智能推荐:赋予面向用户的场景服务能力。借助百度的大规模机器学习、个性化推荐技术和丰富的素材库,让数字人在不同应用场景内,具备对客户进行内容、产品的智能服务能力。例如通过识别2D动画的舞蹈动作,让3D数字人学会跳舞。

据IDC预计,到2026年国内AI数字人市场规模将达到102.4亿元。我们认为,随着百度等在AI领域布局的深入,AIGC有望持续提升数字人的服务、交互能力,通过拓宽应用场景,来实现市场规模的增长。

国内AI数字人市场规模预测(亿元)

04 科大讯飞

AI 语音行业领导者科大讯飞在预训练模型方面技术积累深厚。

科大讯飞面向认知智能领域陆续开源了 6 大类、超过 40 个通用领域的系列中文预训练语言模型,开源 3 年模型库月均调用量超 1000 万,成为业界最广泛流行的中文预训练模型之一,在Github平台的中文预训练模型的星标数达 13346 位列第一。

2022 年科大讯飞进一步发布了面向多模态领域的两个轻量级预训练模型,在参数量远小于业界公开模型(参数量小 20 倍以上)的情况下识别效果提升了20~30%,同时也获得全球多模态阅读理解评测冠军等优异成绩。

公司预训练模型在教育、医疗等领域已深度结合,积累了大量数据,并构建较好的垂直领域客户关系,潜在商业价值机会空间大。

公司的技术模型已经应用到教育、医疗、城市、零售、文旅、政法等各行各业,公司通过20多年的发展,积累了大量数据,并在垂直领域有足够的专业性和客户粘性,新的技术突破有望打开潜在市场空间。预计22-24年,公司归母净利润5.5/13.5/21.5亿元,同比变动-65%/145%/59%。

科大讯飞语音合成相关产品

QQ 阅读中应用科大讯飞的语音合成解决方案

05 拓尔思

NLP行业龙头

公司是国内最早从事自然语言处理(NLP)技术研发的企业。NLP是语义智能的核心技术,自2000年起,公司开始从事自然语言和文本挖掘方面的研究,并在国内推出最早的商业化文本挖掘软件TRS CKM被国内外数以千计的用户采用。

公司推出智能问答云服务系统——TRS 小思智能问答机器人,通过语法语义分析、知识推理等技术,实现问题解答与人机交互,目前已被广泛应用于政府智能问答,企业智能客服,行业知识问答等各个领域。在全国两会及北京冬奥会播报、智能风控报告及新闻写作、银行消保审核及客服清分服等方面公司有实际落地应用。

公司也正在积极推进与其他营销、电商企业的合作,主要依托拓尔思公司的智能写作以及语义识别能力,助力带货虚拟人在剧本设计、带货视频生成、直播间接入等方面的场景进化落地,还包括合作运营面向分众群体的智能问答虚拟人。公司受益云和数据服务业务的快速发展 推动公司整体业务的加速。预计22-24年公司归母净利润2.4/3.2/4.2亿元,同比变动-2.4%/33.3%/31.2%。

中文智能问答系统“ TRS 小思”

拓尔思的数星研报平台

06 海天瑞声

属于AIGC上游厂商,提供基础训练数据集

ChatGPT 是在海量数据训练中不断完善的。

从GPT-1到GPT-3参数量从1.17亿到了1750亿,预训练数据量也从5GB到45TB。GPT-1到GPT-3的算法本质上提升并不明显,最主要是参数量越来越大,神经元的层数越来越多,训练的数据量越来越大。可以看出,有效且覆盖全面的数据集是训练出一个优秀模型的核心。

海天瑞声主要提供AI训练数据的研发设计、生产及销售业务,公司通过设计数据集结构、组织数据采集、对取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业数据集,通过软件形式向客户交付。

截止2022年6月,公司客户累计达740家,涵盖了覆盖了科技互联网、社交、IoT、智能驾驶、智慧金融等领域的主流企业,教育科研机构以及部分政企机构,公司产品主要个人助手、智能音箱、语音导航等产品相关的算法模型训练过程。

公司自有知识产权的训练数据产品储备超过1,050个,全面覆盖智能语音、计算机视觉、自然语言、智能驾驶等业务线,公司已向下游客户提供了累计超4,500次/个定制或标准化训练数据集。根据wind一致预期,预计22-24年,公司归母净利润0.3/0.5/1.0亿元,同比变动-8.3%/66.7%/91.3%。

公司近两年标准化数据集产品储备情况

07 商汤

国内最大计算机视觉提供商

商汤是计算机视觉行业龙头。公司以SenseCore AI 大模型为基座,涵盖智慧商业、智慧城市、智慧生活、智能汽车四块领域业务,其中商业与城市是大头,合计营收占比超8成。公司持续引领国内AI商业规模化落地。

公司推出SenseMARS火星混合现实平台,为元宇宙业务发展提供技术支持;公司提出生成式渲染器,能够在无监督条件下的2D生成网络结合人脸模型的3D信息生成高质量渲染图像。2022年年初,商汤打造的虚拟IP数字人“小宁”上线宁波银行上海分行,化身大堂经理为客户提供各类业务咨询和服务办理。

在大模型方面,公司大模型已经达到百亿级参数,公司与之配合的视觉算法训练框架训练单个大模型时可以在一千块GPU上取得超过90%的加速效率。商汤AIDC目前和谷歌、微软已经一起排到了全球的前三,相比于传统的人工智能的标准可以提高600倍。根据wind一致预期,预计22-24年,公司归母净利润-39.1/-27.0/-13.8亿元,同比变动77.2%/31.1%/48.8%。

商汤科技虚拟IP主播“小宁”

08 云从科技

起源人脸识别,积极布局虚拟人技术

云从科技拥有世界领先、自主可控的核心技术,在人脸识别、3D 结构光、跨镜追踪ReID、3D 人体重建、语音识别、OCR 文字识别等领域领先,具备从智能感知到认知决策的技术闭环3D结构光人脸识别技术、3D人体重建技术、人脸识别、跨镜追踪Re-ID等技术,其中人脸识别市场公司份额居全球首位。

公司依靠在3D人体建模、语音识别等领域的领先AI技术,公司正着力打造AI驱动的虚拟数字人,随着未来虚拟直播、动画游戏、虚拟客服等场景的爆发,将给虚拟人带来较大的商业机会;此外, 在内容创作方面 ,公司依靠在大数据、NLP等方面的能力,对演讲视频内容进行提炼与再创作。

预计22-24年,公司归母净利润-8.6/-5.2/-0.4亿元,同比变动-36.1%/39.5%/92.3%。

云从科技数字人架构09 格灵深瞳

09 格灵深瞳

发布“大宇宙”产品,探索AI+ 元宇宙的新业态

格灵深瞳主营产品包括智源智能前端产品、灵犀数据智能平台及深瞳行业应用平台,其中智源智能前端产品包括皓目行为分析仪、边缘计算设备等;灵犀数据智能平台为计算机视觉软件产品,可以实现视频图像解析、以图搜图等功能;行业应用平台主要负责应用层功能实现。

公司把元宇宙从形态上分为小宇宙和大宇宙,小宇宙为传统的基于可穿戴式设备的形态,大宇宙则是基于环境显示材料和线下沉浸式交互的元宇宙形态。大宇宙的核心技术为公司自主研发的大规模沉浸式人机交互系统,该系统可提供在大场景中的人体动作姿态感知、六自由度游戏装备感知等能力。

公司当前在中国农业银行放量边缘智能站产品,助力银行提升合规管控与服务效率,未来有望在建行等其他银行持续拓展;同时公司发布“大宇宙”产品,积极探索AI+元宇宙新业态,加码元宇宙产业,公司业绩有望提升。

根据wind一致预期,预计22-24年,公司归母净利润0.3/0.5/0.8亿元,22年实现扭亏为盈,23-24年增速分别为66.7%/60.0%。

格灵深瞳智能引擎相关产品

10 视觉中国

AI 生成图片、NFT 实现多场景变现

目前,公司拥有基于AI 生成的图片、NFT 等数字内容。据公司公告,公司AI生成内容的业务是依托公司海量数据、AI技术,由公司旗下社区的摄影师、设计师和AI协同完成。图片方面,旗下自有摄影师社区500px已推出近20副AI生成作品,累计浏览量超38万次;NFT方面,截止11月16日,元视觉平台累计发售5份由AI生成的数字藏品,累计交易额超23万元,同样基于500px摄影师的作品。

据公司公告,AIGC相关业务尚处于初期阶段,预计短期内不会对公司财务产生较大影响, 但我们认为 , 公司在产品供给及需求侧均具备优势 , 有望受益于产业发展 。

供给侧:创作者可借助AIGC 及丰富素材提供更多内容。据公司公告,截止今年上半年,在创作者端,公司通过500px、设计师社区爱视觉拥有全球签约创作者超过50万名;素材端,公司可提供4亿张图片。丰富的素材可为AIGC提供学习的数据,创作者则可借助AIGC生成更多内容并做调优,丰富客户的选项。

需求侧:众多客户有助于开拓AIGC 丰富应用、变现场景。公司拥有图文编辑、设计师、视频制作等众多专业KA客户,其中截止2022年6月底直接签约客户数超1.4万家,同比增长6%,在政府教育、党政媒体、传媒出版、广告营销、影视制作、互联网平台等领域均有版权素材使用需求。AIGC提供的内容,有望通过丰富场景实现变现。

500px用AI生成的部分作品

元视觉AI生成数字藏品

11 昆仑万维

StarX MusicX Lab,聚焦AI作曲

上下游产业链合作:唱片公司、音乐流媒体上游素材:StarMaker与索尼、华纳和环球建立了合作,获得伴奏库,基于较大的曲库,StarX MusicX Lab音乐实验室切入AIGC领域;

下游平台:StarX MusicX Lab音乐实验室已经在Spotify、SoundCloud、QQ 音乐和网易云音乐等渠道发布了首批五首由AI作曲的作品,后续还有其他歌曲陆续发出;

行业合作:游戏、车企等。目前也与音乐、汽车、游戏等多个行业的头部 达成 AIGC 范畴的协作;比如昆仑万维每款游戏的音乐成本在50万元至100万元之间,通过AIGC,音乐成本能够降至0。

根据wind一致预期,预计22-24年,公司归母净利润10.5/13.0/14.8亿元,同比变动32.1%/+17.4%/+14.4%。

StarX MusicX Lab 作曲专辑上线流媒体平台

12 万兴科技

AI 绘画工具提升内容创作效率

公司是数字创意服务商,为创作者提供视频创意、绘图创意、文档创意、实用工具类软件产品与服务。在11月初的2022全球元宇宙大会上,公司宣布首款AIGC产品万兴AI绘画将开启公测,为图片内容生产过程降本增效。

产品模式:低门槛、快捷的图片生成工具。产品以微信小程序、网页版或H5形式提供给用户。基于用户输入的文本关键词及选择的图片比例、风格等属性,万兴AI绘画可在1分钟内快速生成无版权图片。

商业模式:基于次数收费,应用于图片创意领域。登陆用户每天享有5次免费创作机会,此外万兴AI绘画将提供5元10次、12元30次、20元100次的收费套餐。用户生成的图片,版权归用户所有,可作为设计师、游戏工作者、自媒体的图片素材。

万兴AI绘画图片生成过程

完善创作者工具矩阵,提高创作效率。

目前公司已经具备万兴喵影、万兴优转等视频创意软件,亿图图示、亿图脑图等绘图创意软件,万兴PDF等文档创意软件,万兴恢复专家等实用工具软件,据中国证券网,目前公司业务已经覆盖200多个国家和地区,全球累计用户超15亿,月活超过1亿。万兴AI绘画的推出,将进一步完善公司的产品矩阵,提升内容生产效率。

万兴创作者工具矩阵

13 中文在线

AI 文字辅助创作效率提升

公司已上线AI 文字辅助创作功能。该功能已向公司旗下17K文学平台全部作者开放,有助于提升文学作者写作效率。

产品模式:作者通过输入关键词和辅助短语,即可针对古风、都市等特定风格作品,生成对应的文字内容描写,让作者精力聚焦在内容情节的创作中,从而提高写作效率。据投资者互动平台,公司后续也将推出AI绘画功能。

合作方:公司的AIGC产品由公司与人工智能公司澜舟科技合作打造,后者提供为产品提供算法模型支持。澜舟科技成立于2021年,创始人兼 CEO 周明现任中国计算机学会副理事长,曾任国际计算语言学学会(ACL)主席、微软亚洲研究院副院长。

中文在线AIGC产品

14 蓝色光标

自动生成文案、图片,服务营销场景

具备文案、报告及图片的自动生成能力,服务营销场景。

文案方面:公司于2018年推出撰稿机器人“妙笔”,能在1秒钟内改编出数千篇分别适合微博、微信、头条、新闻网站等不同媒体平台风格的稿件,提高营销人员品牌宣传效率。

报告方面:多人协同创作平台销博特,可一键自动化生成策划案、品牌分析报告、消费者洞察等内容,据投资者互动平台,截至今年10月,销博特已累计注册用户超6万家,覆盖10多个行业,400多个品类。

图片方面:销博特于11月推出“创意画廊”功能,可基于用户输入的文本或图片,一键生成抽象画。

创新营销手段,增加变现途径。公司在创新营销手段方面,已积累了虚拟人、XR影棚、数字人直播间、数字藏品、虚拟空间等工具,AIGC有关产品也可提升客户营销活动的策划、宣传、分析效率,从而增加公司变现途径。

更多精彩内容请关注公众号:BFT机器人

本文为原创文章,版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。

本文地址:http://xiaoguoguo.dbeile.cn/news/2508.html    多贝乐 http://xiaoguoguo.dbeile.cn/ , 查看更多
 
 
更多>同类行业资讯
0相关评论

新闻列表
企业新闻
推荐企业新闻
推荐图文
推荐行业资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2023001713号