产品概述
智能数字人融合 NLP 自然语言理解、虚拟人合成与语音交互核心技术,支持文本 、 语音双驱动,具备超拟真交互、智能语音调度、自动化讲解汇报能力,适配政务接待、企业宣讲、迎检验收等多场景,支持国产化部署与个性化指令定制,搭配精细化管理配置体系,为各行业提供高效、专业的智能虚拟人解决方案。

一、语音智能应用
系统具备强大的虚拟人合成能力,支持文本与语音双模式驱动,依托数字人 NLP 自然语言泛化理解技术,赋能超拟人人机交互体验。系统可灵活设定演示流程并进行内容配置,能够精准驱动数字人按预设逻辑有序显示页面、开展专业汇报讲解,同时适配迎检导览等场景需求,实现从内容呈现到交互响应的全流程智能化,为政务接待、企业宣讲、展厅导览等场景提供高效、自然的虚拟人服务解决方案。
二、数字人功能
数字人具备全方位、高性能的虚拟人合成服务能力,为多场景应用提供坚实技术支撑。在核心合成能力上:
(一)触发方式
支持文本驱动与语音驱动两种灵活触发方式,满足不同交互场景下的使用需求,同时虚拟人口唇同步准确率严格符合行业通用的 MOS 评分标准,形象动作呈现效果也通过 MOS 分专业评测,确保虚拟人在语音表达与肢体语言上均具备高度自然感,带来贴近真人的交互体验。
(二)背景适配
在场景适配与输出功能上,系统具备强大的背景自定义更换与合成能力,兼容图片类(jpg、png 等)及视频类(mp4、avi 等)多种主流背景格式,用户可根据政务接待、企业宣讲、展厅导览等不同应用场景,自由搭配贴合需求的背景元素,提升场景沉浸感。
(三)实时图像输出
支持输出带透明通道的视频文件及实时推流服务,完美适配离线使用与实时交互等多样化场景,其中视频文件支持 WebM、MOV 等常用格式,方便后续存储、编辑与传播,实时推流则基于自研 RTC 协议实现透明通道输出,保障推流过程的稳定性与画面传输质量。
(四)接口兼容
在技术兼容性与拓展性上,系统充分考虑多平台应用需求,支持 Android SDK、iOS SDK、Web API 等当前主流调用接口,能够无缝兼容各类应用程序的调用需求,同时为企业用户提供充足的二次开发空间,可根据自身业务场景进行个性化功能拓展与定制,大幅降低系统集成与落地成本。
(五)国产化部署
在国产化适配层面,系统全面支持国产信创环境完成部署调试,深度契合国产化替代的政策导向与市场需求,能够在国产服务器、操作系统等信创生态环境中稳定运行,确保系统部署的合规性与安全性。
三、数字人语音调度
数字人语音调度功能依托先进的数字 NLP 自然语言泛化理解技术,具备精准捕捉用户意图、灵活适配对话逻辑的核心能力,彻底打破传统手动操作的局限,赋能超拟人人机交互场景,为业务系统操控提供更智能、更高效的解决方案。该功能以语音交互为核心入口,实现业务系统全流程的语音化操控,让用户无需依赖手动操作即可完成各类复杂业务需求。
(一)调取主页
支持通过与数字人进行自然语音交互,快速调取相关业务系统主页面,省去手动查找、点击的繁琐步骤,大幅提升操作便捷性。
(二)调取子页
无需手动层级跳转,仅通过语音指令即可直接调取业务系统各层级子页面,无论是深层级的功能模块还是细分业务界面,都能实现一步直达,有效减少操作路径与时间成本。
(三)平级切换
针对系统内平级界面的切换需求,支持无需手动路径导航的语音交互操作,用户只需通过语音下达切换指令,即可实现不同平级界面的直接跳转,确保操作流程的连贯性与流畅性。
(四)数据查询反馈
支持通过语音交互快速发起数据查询请求,系统接收指令后将精准执行查询操作,及时返回查询结果并同步通过数字人完成语音播报应答,让用户实时获取所需数据信息,无需手动查看屏幕即可掌握核心内容。
(五)调取监控
针对视频监控调取场景,支持通过语音交互进行精准定位,快速调取指定单点的视频监控画面,适用于安防监控、场景巡查等需要实时可视化管控的场景。
(六)屏组交互
支持与多个屏组进行语音交互,用户可通过语音指令控制业务界面在不同大屏之间的显示切换,灵活适配多屏联动的办公场景,满足多人协作、多场景展示的业务需求。
(七)语音调取
使用拾音设备,说出唤醒词,唤醒智能语音系统,下达预设语音命令,系统对语音指令进行识别,与相关设备做好路径对接,作出相应反馈,能够进行场景切换、调取业务程序、调取视频监控、智能搜索、打开文件、打开视频等,即可调取画面显示终端上。
四、数字人讲解汇报
数字人系统专为迎检场景打造专项讲解汇报功能,以高度智能化的内容呈现与讲解能力,为各类迎检工作提供高效、专业的服务支撑。系统支持用户根据迎检主题、流程需求自定义设定演示流程与内容配置,可灵活编排汇报逻辑、筛选核心展示内容、预设页面切换节点,确保数字人讲解与迎检流程精准契合。
数字人能够严格按照预设流程,有序完成页面展示、专业汇报讲解及迎检导览全流程服务,从迎检接待开场问候,到核心业务板块逐一汇报,再到场景导览介绍,全程无需人工干预即可实现自动化、标准化呈现。
尤为突出的是,系统具备强大的页面联动介绍能力,当数字人按流程完成页面切换后,可自动识别当前页面的核心内容与功能模块,同步触发对应讲解脚本,精准解读页面中的数据指标、功能亮点、业务逻辑等关键信息,实现 “页面切换与讲解内容” 的无缝衔接,避免讲解与展示脱节的问题。
在汇报讲解过程中,数字人依托自然流畅的语音合成技术与贴合场景的肢体动作呈现,将专业内容以清晰、易懂的方式传递给迎检人员,既保证汇报的专业性与严谨性,又通过拟人化的表达增强内容的感染力与可读性。
无论是政务工作迎检、企业项目验收,还是专项工作评估等场景,数字人都能凭借标准化的演示流程、精准的内容讲解、灵活的页面联动能力,有效减轻迎检筹备压力,提升迎检展示的规范化与智能化水平。同时,用户可根据不同迎检对象、场景需求,灵活调整演示流程与讲解重点,实现 “一套系统适配多类迎检场景” 的高效应用,让迎检汇报既专业全面,又重点突出,为迎检工作增添科技感与说服力,助力用户高效完成各类迎检任务。
五、定制场景指令
数字人系统深度契合项目建设个性化需求,提供全面的语音指令定制开发服务,支持根据项目实际业务场景、流程规范及操作习惯,针对性设计并开发专属语音指令功能,实现从通用指令到专项场景指令的精准适配。
在定制开发过程中,系统充分考虑原有业务系统的架构特性,明确需协调原有 B/S 架构系统厂家提供全方位配合,通过建立高效的跨厂家协作机制,确保定制化语音指令功能与原有系统实现深度融合、顺畅对接及协同运行。
具体而言,协作过程将围绕接口适配、数据互通、流程联动三大核心维度展开:一方面,需原有 B/S 架构系统厂家开放必要的接口权限,提供详细的接口文档与技术规范,确保定制语音指令的触发信号能够精准传递至原有系统,实现指令的快速响应与执行;另一方面,通过双方技术团队的协同调试,打通数据交互通道,保障定制指令相关的业务数据在数字人系统与原有 B/S 系统之间的实时同步、准确传输,避免数据偏差导致的操作失误;同时,针对业务流程的衔接需求,将定制语音指令的执行逻辑与原有系统的业务流程进行深度适配,确保指令触发后,原有系统能够按预设流程完成对应操作,实现 “语音指令发起 - 系统响应 - 流程执行 - 结果反馈” 的全链路顺畅衔接。
无论是项目专属的业务查询指令、系统操控指令,还是场景化的多步骤联动指令,都能通过定制开发实现精准落地,且所有定制功能均需经过严格的兼容性测试、压力测试与稳定性测试,确保在复杂业务场景下仍能与原有 B/S 架构系统保持高效协同,不影响原有系统的正常运行。
该定制场景指令服务通过 “个性化开发 + 跨厂家协同 + 全流程适配” 的模式,彻底打破通用指令的应用局限,让数字人系统更贴合项目实际应用需求,为用户打造专属化、高效化的语音交互体验,同时最大限度降低系统集成风险,保障项目整体落地效果与长期稳定运行。
六、管理配置
系统具备全面且精细化的管理配置能力,从安全认证、操作便捷性到功能优化形成完整管理体系,整套管理配置功能覆盖安全认证、网络监测、唤醒控制、缓存管理、指令操作、播报配置、功能优化、技能关联及集中设置九大核心维度,通过精细化、可视化、可定制的管理设计,既保障系统运行的安全性与稳定性,又提升用户操作的便捷性与功能适配性,为各类专业场景的高效应用提供坚实支撑。
(一)身份绑定
在安全与基础保障层面,系统支持用户首次进入客户端时完成身份绑定操作,提供安全合规的身份认证入口,从源头保障账号使用安全与操作权限合规。
1. 新建用户步骤
在【用户管理】主页面,点击【新建用户】按钮;
进入新建用户参数设置页,填写用户基本信息:
参数说明 用户名(必填):支持中英文填写 姓名(必填):请输入用户真实姓名。性别(必填):请选择用户性别 职位(必填):请输入用户所属职位。 电话(必填):请输入用户手机号。 密码(非必填):请输入用户登陆密码。 确认密码(非必填):请再次输入用户登陆密码。当不填密码时,系统将使用初始密码进行登录,初始密码为:holardata2025。其他设置:是否启用账户默认为勾选,如果不勾选,则该账户不可用,处于禁用状态。
配置角色(必选)至少选择一种角色。
2. 编辑用户步骤
在【用户管理】主页面,点击【编辑】按钮;
进入新建用户参数设置页,修改用户基本信息:
参数说明 用户名(必填):支持中英文填写 姓名(必填):请输入用户真实姓名。性别(必填):请选择用户性别 职位(必填):请输入用户所属职位。 电话(必填):请输入用户手机号。 密码(非必填):请输入用户登陆密码。 确认密码(非必填):请再次输入用户登陆密码。可在此处给用户修改密码。其他设置:是否启用账户默认为勾选,如果不勾选,则该账户不可用,处于禁用状态。
配置角色(必选)至少选择一种角色。
3. 删除用户步骤
在【用户管理】主页面,点击【删除】按钮;
弹出提示框,是否确认删除此用户;
注意事项:删除用户后,该用户不可恢复。
(二)网络监测
同时具备网络状态实时监测能力,当网络突发断开时,客户端界面将即时弹出明确的网络中断信息提示,帮助用户快速定位问题,避免因网络异常导致的操作受阻。
(三)缓存清理
系统搭载缓存定时清理机制,可按用户预设规则自动执行缓存清理操作,有效释放系统存储资源,保障客户端运行流畅性,用户也可通过设置界面灵活控制缓存自动清理开关。
(四)唤醒词预设
在操作便捷性管理上,系统支持通过麦克风输入预设唤醒词的触发方式,用户无需手动操作即可快速唤醒系统,提升交互效率。
(五)指令可视化
同时支持已配置指令的可视化展示,让用户直观掌握指令配置情况,且提供指令新增、删除的操作权限,方便用户根据业务需求灵活调整。
(六)播报内容预设
播报库内置丰富的语音合成预置内容,满足日常播报需求,同时支持通过语音合成功能新增自定义播报内容,适配个性化场景应用。
(七)指令优化
系统提供指令小包优化、强制转换、热词管理等专项优化功能,通过多维度技术手段针对性提升专业场景术语的语音识别准确率,确保特殊领域指令交互的精准性。
(八)技能关联
支持技能关联功能,可针对每一条指令进行不同系统的关联配置与管理,实现指令与目标系统的精准绑定,保障指令执行的准确性。
(九)系统设置
设置界面整合账号信息管理、播报参数配置、版本信息展示等核心功能入口,用户可集中完成账号维护、播报语速、音量等参数调整、版本查看等操作,形成一站式管理体验。