基于语音识别的数字人驱动方法、设备及系统技术方案

技术编号：43552136 阅读：30 留言：0更新日期：2024-12-03 12:35

本发明专利技术涉及语音识别技术领域，具体涉及一种基于语音识别的数字人驱动方法、设备及系统，该方法包括：获取目标区域的各声源的音频数据；确定属于交互用户的语音的目标独立成分语音；确定相似语音组；根据第一目标独立成分语音的第一采集时刻、第二目标独立成分语音的第二采集时刻以及声音传播速度，确定交互用户到第一位置的第一参考位置以及交互用户到第二位置的第二参考位置之间的距离差；根据第一参考位置与第二参考位置之间的距离以及距离差确定交互用户的目标位置；利用交互用户在目标区域内的目标位置驱动数字人面向交互用户。如此，本发明专利技术提高了数字人与观众的交互灵活性，保证了观众在交互的过程中的参与感，提高了观众的互动体验感。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别，具体涉及一种基于语音识别的数字人驱动方法、设备及系统。

技术介绍

1、数字人是运用数字技术创造出来的与人类形象接近的数字化人物形象。数字人驱动指的是利用数字技术或算法驱动的方式来模拟或控制数字人的行为和交互。通过在展厅或展览等环境应用数字人技术，通过语音识别技术识别观众的提问或互动语句，并输出对应的回答语句，为观众提供智能导览，实现与观众的语音交互。在观众与数字人进行语音交互时，数字人还会有运动控制模块掌握数字人的动作和表情，在与观众的交互过程中结合动作和表情为观众提供更智能以及互动性更强的展览陪同和信息服务。

2、在一些场景下，在数字人和观众进行语音交互时，数字人还会做出动作与表情使得数字人和观众的交互过程更加生动丰富。在数字人做动作与表情时，数字人的面部始终面向于一个固定的方向，不论与其进行交互的观众处于哪个位置，数字人的面部的面向始终不变。如此，数字人与观众的交互灵活性较差，观众在交互的过程中的参与感较低，导致观众的互动体验感较差。

技术实现思路

...

【技术保护点】

1.一种基于语音识别的数字人驱动方法，其特征在于，所述基于语音识别的数字人驱动方法包括：

2.根据权利要求1所述的基于语音识别的数字人驱动方法，其特征在于，所述从各所述声源的音频数据中确定属于交互用户的语音的目标独立成分语音包括：

3.根据权利要求2所述的基于语音识别的数字人驱动方法，其特征在于，所述根据所述声音频率序列中的极值点的第一数量、相邻极大值点之间的第一时间间隔、相邻极小值点之间的第二时间间隔以及所述声音频率序列中声音频率的方差确定所述独立成分音频的有效性包括：

4.根据权利要求2所述的基于语音识别的数字人驱动方法，其特征在于，所述声音采集设...

【技术特征摘要】

1.一种基于语音识别的数字人驱动方法，其特征在于，所述基于语音识别的数字人驱动方法包括：

4.根据权利要求2所述的基于语音识别的数字人驱动方法，其特征在于，所述声音采集设备包括处于所述目标区域的第一位置的声音采集设备和处于所述目标区域的第二位置的声音采集设备，所述确定相似语音组包括：

5.根据权利要求4所述的基于语音识别的数字人驱动方法，其特征在于，所述根据处于所述目标区域的第一位置的声音采集设备和处于所述目标区域的第二位置的声音采集设备的目标独立成分语音之间的相似性，确定所述相似语音组包括：

6.根据权利要求1-5任意一项所...

【专利技术属性】
技术研发人员：鞠帆，韩清霞，栾飞，
申请(专利权)人：新之航传媒科技集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人