一种虚拟数字人语音播报系统及方法技术方案

技术编号：44916175 阅读：18 留言：0更新日期：2025-04-08 18:58

本发明专利技术提供一种虚拟数字人语音播报系统及方法，包括：虚拟数字人生成模块、播报文本获取模块、播报文本配置模块、播报文本转语音模块和播报模块。其中，虚拟数字人生成模块用于根据目标人物图像生成虚拟数字人视频。播报文本获取模块用于根据查询结果提取指标名称和指标名称对应的数据值。播报文本配置模块用于根据查询结果从固定话术数据库中查询确定话术模板，将话术模板和指标名称对应的数据值结合，生成播报文本。播报文本转语音模块用于调用AI语音合成服务将播报文本转换为播报语音。播报模块用于播放虚拟数字人视频和播报语音。这样，可以实现通过虚拟数字人对查询结果进行语音播报，从而提高了用户的使用体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数字人，具体涉及一种虚拟数字人语音播报系统及方法。

技术介绍

1、随着电信运营商的运营管理系统逐渐完善，基本管理单元已细化至网格化单元管理。具体的，电信运营商可以按照地区对运营区域划分为多个网格区域，并对每个网格内的人口、服务用户和业务属性等信息进行统计和管理。

2、运营管理系统通过跟踪网格调度执行情况和各项业务指标的变化趋势，从网格收入、重点指标、规模等维度可以进行网格诊断。并且，运营管理系统还可以基于网格区域快速地根据用户的需求进行信息查询。

3、但是，现有的电信运营商的运营管理系统通常以文字方式呈现查询结果，用户仅能通过视觉浏览查询结果。运营管理系统对于查询结果的显示方式单一，从而导致用户的使用体验降低。

技术实现思路

1、本专利技术所要解决的技术问题是用户对于运营商的运营管理系统的体验低的问题。

2、为解决上述技术问题，本专利技术提供了一种虚拟数字人语音播报系统及方法，具体采用如下技术方案：

3、第一方面，本专利技术提供一种虚拟数字人语音播报系统，包括：虚拟数字人生成模块、播报文本获取模块、播报文本配置模块、播报文本转语音模块和播报模块。其中，虚拟数字人生成模块用于根据目标人物图像生成虚拟数字人视频。播报文本获取模块用于根据查询结果提取指标名称和指标名称对应的数据值，查询结果根据查询请求确定得到。播报文本配置模块用于根据查询结果从固定话术数据库中查询确定话术模板，将话术模板和指标名称对应的数据值结合，生成播报文本

4、该系统通过虚拟数字人生成模块采用虚拟技术可以生成虚拟数字人形象，通过播报文本转语音模块和播报模块采用文本转语音技术实现可以实现文本播报，通过java技术可以实现播报内容的配置、语音内容的获取、文本转语音能力调用，以及通过前端交互技术实现虚拟数字人交互及语音播报，这样，可以实现通过虚拟数字人对查询结果进行语音播报，从而提高了用户的使用体验。

5、结合第一方面，在一种可选择的实现方式中，上述根据目标人物图像生成虚拟数字人视频中，虚拟数字人生成模块具体用于：首先，根据目标人物图像生成预设类型形象图像。然后，将预设类型形象图像添加口型动作信息，生成添加口型的预设类型形象图像。接下来，将添加口型的预设类型形象图像进行形象抠图，生成虚拟人物无损压缩的位图图形格式(portable network graphics，png)序列。最后，将虚拟人物png序列进行动态化处理和图像压缩，生成虚拟数字人视频。

6、结合第一方面，在一种可选择的实现方式中，上述播报文本配置模块基于springcloud微服务框架,通过结构化查询语言(structured query language，sql)动态查询话术模板。

7、结合第一方面，在一种可选择的实现方式中，该系统还包括：虚拟数字人控制模块。具体的，虚拟数字人控制模块用于控制播报模块开启播放虚拟数字人视频和播报语音，还用于控制播报模块隐藏虚拟数字人视频和停止播放播报语音。

8、结合第一方面，在一种可选择的实现方式中，该系统还包括：语音内容交互模块。具体的，语音内容交互模块用于在播放虚拟数字人视频和播报语音的情况下，突出显示播报文本。

9、结合第一方面，在一种可选择的实现方式中，上述在突出显示播报文本中，语音内容交互模块具体用于：通过js元素定位和高亮渲染处理，将播报文本进行高亮显示。

10、第二方面，本专利技术提供一种虚拟数字人语音播报方法，该方法包括：首先，根据目标人物图像生成虚拟数字人视频。然后，根据查询结果提取指标名称和指标名称对应的数据值，查询结果根据查询请求确定得到。其次，根据查询结果从固定话术数据库中查询确定话术模板，将话术模板和指标名称对应的数据值结合，生成播报文本。接下来，调用ai语音合成服务将播报文本转换为播报语音。最后，播放虚拟数字人视频和播报语音。

11、结合第二方面，在一种可选择的实现方式中，该方法还包括：在播放虚拟数字人视频和播报语音的情况下，突出显示播报文本。

12、第三方面，提供一种电子设备，包括：存储器、一个或多个处理器；存储器与处理器耦合；其中，存储器中存储有计算机程序代码，计算机程序代码包括计算机指令，当计算机指令被处理器执行时，使得电子设备执行如上述第二方面及其任一种可选择的方法。

13、第四方面，提供一种计算机可读存储介质，包括计算机指令，当计算机指令在电子设备上运行时，使得电子设备执行如上述第二方面及其任一种可选择的方法。

14、可以理解地，上述第二方面提供的虚拟数字人语音播报方法、第三方面的电子设备，第四方面的计算机可读存储介质所能达到的有益效果，可参考第一方面及其任一种可能的设计方式中的有益效果，此处不再赘述。

本文档来自技高网...

【技术保护点】

1.一种虚拟数字人语音播报系统，其特征在于，包括：虚拟数字人生成模块、播报文本获取模块、播报文本配置模块、播报文本转语音模块和播报模块；

2.根据权利要求1所述的系统，其特征在于，所述根据目标人物图像生成虚拟数字人视频中，所述虚拟数字人生成模块具体用于：

3.根据权利要求1所述的系统，其特征在于，所述播报文本配置模块基于SpringCloud微服务框架,通过SQL动态查询所述话术模板。

4.根据权利要求1所述的系统，其特征在于，所述系统还包括：虚拟数字人控制模块；

5.根据权利要求1-4任一项所述的系统，其特征在于，所述系统还包括：语音内容交互模块；

6.根据权利要求5所述的系统，其特征在于，在所述突出显示所述播报文本中，所述语音内容交互模块具体用于：

7.一种虚拟数字人语音播报方法，其特征在于，包括：

8.根据权利要求7所述的方法，其特征在于，所述方法还包括：

9.一种电子设备，其特征在于，包括：存储器、一个或多个处理器；所述存储器与所述处理器耦合；其中，所述存储器中存储有计算机程序

10.一种计算机可读存储介质，其特征在于，包括计算机指令，当所述计算机指令在电子设备上运行时，使得所述电子设备执行如权利要求7或8所述的方法。

...

【技术特征摘要】

1.一种虚拟数字人语音播报系统，其特征在于，包括：虚拟数字人生成模块、播报文本获取模块、播报文本配置模块、播报文本转语音模块和播报模块；

2.根据权利要求1所述的系统，其特征在于，所述根据目标人物图像生成虚拟数字人视频中，所述虚拟数字人生成模块具体用于：

3.根据权利要求1所述的系统，其特征在于，所述播报文本配置模块基于springcloud微服务框架,通过sql动态查询所述话术模板。

4.根据权利要求1所述的系统，其特征在于，所述系统还包括：虚拟数字人控制模块；

5.根据权利要求1-4任一项所述的系统，其特征在于，所述系统还包括：语音内容交互模块；

6.根据权利要求5所...

【专利技术属性】
技术研发人员：金玉婷，
申请(专利权)人：北京思特奇信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人