DUIS (Dialogue User Interface System) 是硅基智能推出的AI数字人智能交互平台,现已全面开源。这个平台允许开发者接入多种大模型、语音识别、语音合成等功能,轻松实现实时交互,并在Android和iOS设备上快速部署。项目提供详尽的文档指南,包含个性化数字人模板、高效低成本的部署方案、流畅的用户体验及多种应用场景。开源项目旨在推动数字人技术的普及和创新,鼓励开发者深入探索和改进技术。
一. 开源数字人介绍
这个平台的核心目标是帮助开发者轻松创建和部署智能化、个性化的数字人Agent,可以应用到各行各业。DUIS集成了多种先进技术,包括语音识别(ASR)、语音合成(TTS)以及多方大模型的接入能力,让数字人可以实时与用户进行自然流畅的互动。这个平台的开源不仅为开发者提供了全面的技术资源,还配套了详尽的文档指南,帮助开发者快速上手,创造出各种应用场景下的虚拟人解决方案。DUIS的出现,标志着数字人技术进入了一个新的发展阶段,不再是高高在上的前沿科技,而是触手可及的创新工具。
开源地址:
https://github.com/GuijiAI/duix.ai
二、核心功能和优势
DUIS开源项目的核心功能丰富多样,极大地方便了开发者的使用和二次开发。首先,平台提供了14款不同风格的个性化数字人模板,用户可以根据需求随意选择,并且这些模板会不断更新,确保开发者能够紧跟潮流。
其次,DUIS在部署方面极为高效且省钱,支持在手机、大屏、平板、车机等多种终端上运行,既降低了成本,又保证了流畅的用户体验。
每秒50帧的高刷新率,让数字人的动作、唇形、微表情都能逼真地展现,几乎让人难辨真假。除了这些,DUIS还提供了多种应用场景,包括AI助手、直播带货、定制数字人短片等,助力各类内容创作和品牌宣传。这些核心功能和优势,使得DUIS在数字人技术领域拥有不可替代的地位。
部署成本低: 无需客户提供技术团队进行配合,支持低成本快速部署在多种终端及大屏。
网络依赖小: 适合地铁、银行、政务等多种场景的虚拟助理自助服务。
功能多样化: 可根据客户需求满足视频、媒体、客服、金融、广电等多个行业的多样化需求。
三、效果展示及体验
在效果展示和用户体验方面,DUIS表现出色。数字人能够聪明地理解并回应用户的每一句话,给人一种生动、逼真的互动感。虽然目前数字人的思考时间约为3到4秒,但这并不影响整体的用户体验,因为这一技术瓶颈正在迅速改进。随着模型优化和技术进步,这一等待时间将逐渐缩短,未来的互动体验将更加即时和自然。通过DUIS的演示,可以看到数字人在各种场景下的表现如何智能化和逼真,这不仅让人们对数字人技术有了更直观的认识,也极大地激发了开发者和企业的兴趣和想象力。
四、部署使用教程
(1)安卓 SDK 集成教程
该开源项目提供了详细的使用部署教程,可以移步该项目的地址去查看,我直接把重要的部分贴在了下方。
初始化SDK
获取SDK模型初始化状态
数字人形象展示
启动数字人播报
终止当前播报
播放动作区间
(2)iOS SDK 集成教程
SDK 提供了多种回调方法,包括数字人渲染报错回调、音频播放结束回调、音频播放进度回调等。 动作相关的还支持随机动作、开始动作、结束动作等。建议前往开源项目去查看详细文档。
NSString *basePath =[NSString stringWithFormat:@"%@/%@",[[NSBundle mainBundle] bundlePath],@"gj_dh_res"]; NSString *digitalPath =[NSString stringWithFormat:@"%@/%@",[[NSBundle mainBundle] bundlePath],@"lixin_a_540s"];//初始化NSInteger result= [[GJLDigitalManager manager] initBaseModel:basePath digitalModel:digitalPath showView:weakSelf.showView];if(result==1) { //开始 [[GJLDigitalManager manager] toStart:^(BOOL isSuccess, NSString *errorMsg) { if(!isSuccess) { [SVProgressHUD showInfoWithStatus:errorMsg]; } }]; }
五、项目开源背景和意义
硅基智能作为AI领域的领先企业,决定将DUIS开源,背后有着深远的意义。开源项目的推出,不仅仅是为了展示技术实力,更是为了推动整个数字人行业的发展和普及。硅基智能已经在多个行业中成功应用了数字人技术,通过开源,更多的开发者和企业将有机会接触和使用这些先进技术,从而降低技术门槛,推动技术普惠。开源还激励了技术社区的创新和合作,让更多的人能够参与到技术的改进和扩展中,共同推动数字人技术的边界。硅基智能希望通过这次开源行动,让数字人技术不仅仅停留在实验室,而是走进更多的实际应用场景,真正发挥其应有的价值。