返回
快速导航关闭
当前搜索
网站分类
栏目推荐
实用工具
热门标签
子分类:
直播培训网 >无人直播 » 正文

ai数字人是什么,人工智能数字人免费,“AI造人师”:“人均一个数字人的时代”正在到来

无人直播 更新时间: 发布时间: 无人直播归档 最新发布 网站地图

数字人“希加加”展示自己绘制的画作。

日常生活里,你不经意间会遇到这样一群“人”。他们出现在博物馆展厅、银行柜台,抑或教育机构。这些“人”专业能力极强,讲解展品的时候,能对你提出的疑问应答如流;办理金融业务时,你也会发现,他们非常高效,并且鲜有出错的时候;当他们成为你孩子的老师,这些“人”不但“传道授业解惑”,更能在言语之间给予孩子鼓励。

你不禁会好奇,这些“人”到底是谁?

如果在几年前跟你说出他们的名字,你可能会感到陌生。但现在,提及数字人,人们或多或少都对其有些了解。因为这些特殊的“人”,已然介入我们的世界之中,并给一些行业带来了实质性的改变。

数字人,指的是基于CG(Computer Graphics,计算机图形学)技术与人工智能(AI)技术打造出的数字化虚拟人物。最早的数字人形象可追溯到上世纪80年代,不过,受限于技术水平,早期的数字人形象主要由手绘完成,制作周期漫长,且应用成本极高。所以在很长一段时间内,数字人行业不温不火。

近些年,随着元宇宙概念的出现,以及CG、深度学习算法、自然语言处理(NLP)等技术的发展,数字人行业迎来了一个热潮。无论是实体经济,还是传媒相关的内容生产领域,都开始频繁地使用数字人形象。虚拟偶像、虚拟主播、金融业务员……数字人变换着不同的身份,给人们的生活提供着便利。

在百度与央视新闻共同举办的“2022百度世界大会”上,多个AI数字人在会场亮相。数字人“希加加”不但担任着大会的主持人,还在现场献上了自己绘制的画作。作为国内首个可交互的虚拟偶像,数字人“度晓晓”还与撒贝宁同台互动,展现着与真实人类相似的风趣。

尽管人们和数字人建立了一定的联系,但关于它们背后的故事,人们却知之甚少。制作一个数字人,要经过哪些工序?它们有个性吗?如果有,个性从何而来?元宇宙发展至今,最先进的数字人技术是什么?这些技术又会对我们的世界带来怎样的改变?

带着这些问题,《新周刊》对百度数字人与机器人业务负责人李士岩进行了专访。以下为《新周刊》与李士岩的对谈。

数字人“希加加”展示自己绘制的画作。

想成为数字人工程师,技术与审美缺一不可

《新周刊》 :数字人迅猛发展是近几年科技领域发生的比较重大的事件,什么样的契机促使你进入了这条赛道?

李士岩:从数字人产品的发展特点上看,这是一个与AI相关的技术和艺术结合得比较紧密的赛道。我的职业背景是和它比较契合的。我最早做设计师,之后又做了两年软硬一体化的产品孵化。除此之外,我也做过一些人因工程(研究人和机器及环境的相互作用的学科)的研究工作。在这些进程中,我发现自己对这种交叉学科很感兴趣,于是,在2019年,数字人行业加速发展的时候,我开始做了相关的产品。

《新周刊》 :很多人的刻板印象里,会觉得制造数字人的工作就是埋头钻研技术,你这份职业每天的真实状态是怎样的?

李士岩:数字人行业当前还是处于比较早期的阶段,为了推动它向前发展,最核心的手段还是市场化。所以我的一部分工作是研究市场,包括市场规模、动向和趋势。技术层面上,我会规划企业内部数字人相关核心技术的发展,并组织相应的技术攻关。此外,研究客户的需求,也是日常工作中的一部分。

《新周刊》 :你觉得数字人的团队和其他技术团队有哪些区别?加入这个行业,需要具备什么特质?

李士岩:带领数字人的团队,既要考虑到技术的迭代路径,也要考虑到团队中成员的美学素养,以及对一些人体结构的了解程度。这些会直接决定我们产品做出来是不是足够生动和美观。

像我们团队中有很多人都在研究人体解剖学,研究人的三庭五眼。有些男生甚至已经把女生的各种化妆手法,比如眼线、眼影、腮红的色值,都研究得很透彻。

当然,在技术方面,它既要用到语音、语义相关的技术,也要用到CG、视觉相关的AI技术。百度是国内为数不多可以实现全链路AI能力的公司,我们在这方面有着非常丰厚的积累。所以,我们团队的人在全链路的技术上都会有一个整合。

《新周刊》 :你提到了全链路的能力,现在如果想要造一个数字人出来,需要经过哪些环节?

李士岩:我们用通俗的语言来解释,就是首先要造出来一个“人”,但这还远远不够,你要能让这个“人”做事情。有的要去当业务员,比如我们给银行做的产品,它们可以帮助客户办理业务;有的要去当主持人——我们给央视新闻提供了手语数字人;还有的,要做虚拟偶像,诸如我们熟知的“希加加”“度晓晓”。

制造的流程一般是这样的:第一阶段,传统的操作是通过扫描真人或者手雕一个三维模型来建模,但百度智能云采用AI技术的方式,上传一张照片就能自动生成一个三维的超写实数字人。第二步需要做的事情,叫“数字人的驱动”,就是让它能说话,能动起来。

在这步的设置中,我们一般会用跨模态的转化技术,给它输入文本,通过AI就能够预测它说话时的口型和发音,我们运用的相关技术是NLP、ASR(语音识别)。这样数字人就学会了表达。第三步,就是让已经做好的数字人,通过我们百度智能云的数字人平台,去生产内容。

数字人捏脸系统。

前沿的AI技术,提升了内容制作效率,也降低了成本

《新周刊》:你进入这条赛道时,数字人的发展如何?到今天,它分别历经了哪些阶段?

李士岩:数字人的1.0特征是官方发布一个虚拟形象,再发布一个声音,各个粉丝通过这种声音软件来为这个虚拟形象创造声音作品,以此来实现虚拟人的孵化。2.0则是在此基础上,引入了影视所用的动图技术——光学动图技术,让官方发布的数字人在“中之人”(指操纵虚拟主播进行直播的人)的驱动下,通过直播这种一对多的形式,与粉丝、观众进行互动。

第三个阶段,也就是我进入行业时的2019年左右。它的显著特征是无论在数字人的生产端,还是在数字人的消费端,由于AI相关技术的加入,变得效率更高,载体更丰富,覆盖的用户面也更广。它已经成了一种在AI技术驱动下实现“7×24小时N人N面”、低成本生产的互动形式。

《新周刊》 :现在数字人行业最前沿的技术有哪些?

李士岩:最前沿的技术,主要从三个方面看。

首先,在制作人像层面,目前最顶尖的技术是通过超写实人像来实现智能建模。用传统方式做一个人像的周期是1—2个月,但通过照片建模的技术,几分钟甚至几秒钟就能够完成。

在驱动和交互上,最前沿的技术有两个:AI相关的非注意力ASR模型和利用大模型相关的对话技术。前者让语音转换文本的能力变得更为精准,后者则是对数字人的理解和反馈能力有质的提升。

在内容生产赛道里,动画数据、通过3D换脸技术进行的虚拟偶像、内容的快速生产,都是比较尖端的技术。

《新周刊》 :这些前沿技术在提升内容制作效率和降低成本方面有哪些影响?

李士岩:首先,人像生产是数字人成本的最主要构成,行业里超高精的人像成本往往要50万—100万元。原来的手工方式,需要花费大量的体力劳动,外加一部分主观的创作和审美。但通过AI的训练,我们能够实现人像的自动化生产。

在对话这个维度上,随着大模型技术的不断进步,数字人在语言交互上的训练成本也能进一步降低。最近,我们发布了百度智能云的对话平台UNIT7.0,平台化的产品使得数字人这种对话配置、多模交互的能力更加易用,使用成本也更低。

就内容生产维度来说,我们现在可以采集大量的数据训练集,这些捕捉的数据,可以完成自动修复。比如,我们在做央视新闻的手语项目时,每一个手语动作都是一条数据,我们采集了上万个手语动作,并予以修复,为我们的听障用户服务。

这个成本其实是非常高的,但正是因为有了大量的数据积累,我们才能将自动化修复的时间成本缩短至少80%,预算成本能节省60%—70%。

百度智能云·曦灵AI 手语平台。

未来的元宇宙里,数字人将占据核心位置

《新周刊》 :目前数字人的市场需求如何?

李士岩:数字人的需求主要集中在两个方向,分别是多模交互方式和内容生产。在多模交互方式方向,数字人的工作主要是做业务员,也就是理财经理、教育培训领域的一对一交互教练等。在内容生产维度上,数字人做的主要是虚拟主持人、虚拟主播和虚拟偶像。

目前来看,这两个大赛道每年成长率都较高,每年可触达的市场规模几乎都是翻倍的。预测到2023年,这个市场规模接近300亿元。虚拟偶像大概占到60%,虚拟员工、虚拟主持人和带货主播,占到40%—50%的规模。

《新周刊》 :数字人的客户群体和实际应用怎样?

李士岩:在运营商行业,我们已经做了大量的案例,比如我们给银行等机构都提供过虚拟员工类的服务。以银行App为例,百度智能云的数字人能为用户提供金融服务;到了线下场景,银行的网点里,也有数字人的智能屏帮助客户办理业务,从而解决线下排队等一些问题。

在内容生产方面,也就是我们内部所说的“演艺型数字人”赛道,我们给央视做了相应的虚拟主持人或手语主持人,这在冬奥会、冬残奥会、NBA等一些赛事上,已经服务了几千万名听障用户。

《新周刊》 :你提到的用户群体,更多的是一些大企业,对于那些中小企业或机构,它们在数字人方面有哪些选择?

李士岩:现在数字人应用的行业瓶颈是应用节点较多,成本较高。针对目前这种情况,我们的做法是,通过一些标准化的SaaS产品(Software as a Service,即通过网络提供软件服务),让一些中小企业也能获得数字人服务。

现在,直播是不可或缺的运营手段,但一个小企业想要自己搭建专业的直播间,成本较高,场地、设备,外加主播,可能要花几十万元。针对类似问题,我们发布了百度智能云·曦灵数字人直播平台,它现在是市面上唯一能达到影视级的超写实数字人,也是可通过AI驱动实现24小时自动直播的产品。相较于定制化的数字人,这种平台级的SaaS软件的应用成本要低得多。

《新周刊》 :数字人兴起和最开始的元宇宙风口有较大关系,作为从业者,你觉得数字人对于我们未来在元宇宙中的生活,会有哪些影响?目前还存在哪些挑战?

李士岩:无论平台怎么进化,用户在里面做的事情是相似的——社交、获取服务和消费内容。在这些领域,用户都必须拥有一个“二分身”。“二分身”就是典型的数字人应用。所以,根据我们的判断,无论是作为进入元宇宙的通行证,还是未来在元宇宙中提供服务,数字人都占据非常核心的位置。在生活方面,我们能发现,数字人已经提供了诸多便利,它可以让银行的服务变得更有温度,让教育变得更有效率,那些虚拟偶像也通过聊天,给予了我们更多陪伴。

至于挑战,从整个行业来看,还需建立一些专业标准,比如像自动驾驶汽车那样,划分出智能化的等级。此外,数字人的智能化构造和生产需要采集的数据,投入成本也非常高,如果有可能在行业内进行更广泛、更流畅的数据互通,工程师们的研发可能会变得更方便。

转载请注明:文章转载自 http://panaseima.com/
本文地址:http://panaseima.com/wrzb/6604.html
考高分网交流群

扫一扫加入QQ交流群

和更多志同道合朋友一起交流,分享干货资料!
直播培训网客服

扫一扫加客服微信

有疑问请咨询直播培训网微信号,在线为您解答!
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 Copyright Your WebSite.Some Rights Reserved. Powered · 创奇学院

ICP备案号:浙ICP备2023008056号