一种在语音交互过程中的语音活动结束预测方法、计算机程序产品及语音交互系统技术方案

技术编号：43869573 阅读：23 留言：0更新日期：2024-12-31 18:55

本发明专利技术提供一种在语音交互过程中的语音活动结束预测方法、计算机程序产品及语音交互系统，该方法应用于电话语音助手的语音交互系统，在通话过程中与来电用户进行语音交互，根据交互内容识别诈骗风险，以防用户被诈骗。该方法包括如下步骤：实时检测语音活动输入，在检测到语音活动输入结束前，获取语音活动输入频率，根据语音活动输入频率判断来电用户正在说话的概率，若来电用户正在说话的概率低于第一阈值或概率下降速率快于第二阈值，则预判语音活动输入结束并输出语音活动检测结果，这样无需等待发出讲话结束信号就可预判来电用户准备结束说话，可以节省等待发出讲话结束信号的时间，能加快语音交互系统的回应速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能，特别涉及一种在语音交互过程中的语音活动结束预测方法、计算机程序产品及语音交互系统。

技术介绍

1、随着人工智能技术的快速发展，基于人工智能的语音交互系统应运而生。电话语音助手是语音交互系统的常用场景，电话语音助手开启后能替代用户接电话，在通话过程中与来电用户进行语音交互，根据交互内容识别诈骗风险，以防用户被诈骗。

2、语音交互系统通常包括语音活动检测器、语音识别引擎、大语言模型引擎和文字转语音引擎。在语音交互过程中，传统的语音交互系统要等语音活动检测器检测到讲话结束并发出结束信号后。在语音交互过程中，传统的语音交互系统要等语音活动检测器检测到讲话结束并发出结束信号后，才将语音活动检测器与语音识别引擎连接，再把检测到的语音发送到语音识别引擎转换成语音文本，然后大语言模型引擎根据语音文本生成回应文字，文字转语音引擎将回应文本转换成回应语音。在此过程中，等待语音活动检测器发出结束信号需要一定的时间，导致语音交互系统回应速度慢。

技术实现思路

1、本专利技术要解...

【技术保护点】

1.一种在语音交互过程中的语音活动结束预测方法，该方法应用于电话语音助手的语音交互系统，其特征是，包括如下步骤：实时检测语音活动输入，在检测到语音活动输入结束前，获取语音活动输入频率，根据语音活动输入频率判断来电用户正在说话的概率，若来电用户正在说话的概率低于第一阈值或概率下降速率快于第二阈值，则预判语音活动输入结束并输出语音活动检测结果。

2.根据权利要求1所述的语音活动结束预测方法，其特征是，若来电用户正在说话的概率不低于第一阈值且概率下降速率不快于第二阈值，则维持检测语音活动输入。

3.根据权利要求1所述的语音活动结束预测方法，其特征是，语音活动输入频率越高...

【技术特征摘要】

3.根据权利要求1所述的语音活动结束预测方法，其特征是，语音活动输入频率越高，来电用户正在说话的概率越高。

4.根据权利要求1所述的语音活动结束预测方法，其特征是，获取语音活动输入频率具体地：在每段时间范围内，每隔一小段时间检测是否正在输入语音活动，...

【专利技术属性】
技术研发人员：刘志达，杨子培，
申请(专利权)人：广州壁虎信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人