语音打断方法及装置制造方法及图纸

技术编号：29940608 阅读：33 留言：0更新日期：2021-09-04 19:25

本申请公开一种语音打断方法及装置，涉及自然语言处理技术领域。本申请的方法包括：接收通话音频；基于目标人声检测模块检测通话音频中是否包含人声音频；若包含，则基于目标自动语音识别模块判断人声音频对应的文本内容是否为目标打断词，其中，目标打断词为多个预设打断词中的任意一个；若是，则根据目标打断词、目标自然语言理解模块和目标文字转语音模块生成目标打断回复语音，并向目标移动通信运营商发送目标打断回复语音，以便目标移动通信运营商停止播放目标回复语音，并播放目标打断回复语音；若否，则向目标移动通信运营商发送停止播放指令，以便目标移动通信运营商停止播放目标回复语音。放目标回复语音。放目标回复语音。

全部详细技术资料下载

【技术实现步骤摘要】
语音打断方法及装置

[0001]本申请涉及自然语言处理
，尤其涉及一种语音打断方法及装置。

技术介绍

[0002]随着人工智能技术的不断发展，智能语音技术也得到了迅速发展。应用智能语音技术的软交换智能语音交互系统能够替代移动通信运营商客服与客户进行多轮对话，其中，软交换智能语音交互系统包含软交换子系统和智能语音子系统，移动通信运营商在接收到客户发出的待回复语音后，将待回复语音发送至软交换子系统，由软交换子系统将待回复语音发送至智能语音子系统，智能语音子系统在基于自动语音识别模块、自然语言理解模块、对话管理模块、自然语言生成模块和文字转语音模块，生成待回复语音对应的回复语音后，将回复语音发送至软交换子系统，由软交换子系统将回复语音发送至移动通信运营商，再由移动通信运营商为客户播放回复语音。
[0003]为了提高客户的用户体验，软交换智能语音交互系统需要具备语音打断功能，即在移动通信运营商为客户播放回复语音的过程中，当客户发出打断语音时，软交换智能语音交互系统需要控制移动通信运营商停止播放回复语音，其中，软交换智能...

【技术保护点】

【技术特征摘要】
1.一种语音打断方法，其特征在于，所述方法应用于软交换子系统，包括：接收通话音频，其中，所述通话音频为目标移动通信运营商为目标客户播放目标回复语音过程中，所述目标移动通信运营商采集获得的音频；基于目标人声检测模块检测所述通话音频中是否包含人声音频，其中，所述目标人声检测模块为预先集成在所述软交换子系统中的功能模块；若包含，则基于目标自动语音识别模块判断所述人声音频对应的文本内容是否为目标打断词，其中，所述目标自动语音识别模块为预先集成在所述软交换子系统中的功能模块，所述目标打断词为多个预设打断词中的任意一个；若是，则根据所述目标打断词、目标自然语言理解模块和目标文字转语音模块生成目标打断回复语音，并向所述目标移动通信运营商发送所述目标打断回复语音，以便所述目标移动通信运营商停止播放所述目标回复语音，并播放所述目标打断回复语音，其中，所述目标自然语言理解模块和所述目标文字转语音模块为预先集成在所述软交换子系统中的功能模块；若否，则向所述目标移动通信运营商发送停止播放指令，以便所述目标移动通信运营商停止播放所述目标回复语音。2.根据权利要求1所述的方法，其特征在于，所述目标自动语音识别模块包含预置声学模型、预置语言模型和预置识别词网络；所述基于目标自动语音识别模块判断所述人声音频对应的文本内容是否为目标打断词，包括：将所述人声音频输入至所述目标自动语音识别模块中，以便所述目标自动语音识别模块基于所述预置声学模型、所述预置语言模型和所述预置识别词网络对所述人声音频进行语音识别；若所述目标自动语音识别模块输出所述目标打断词，则确定所述人声音频对应的文本内容为所述目标打断词；若所述目标自动语音识别模块未输出所述目标打断词，则确定所述人声音频对应的文本内容并非为所述目标打断词。3.根据权利要求1所述的方法，其特征在于，所述目标自然语言理解模块包含每个所述预设打断词与其对应的预设打断回复文本之间的第一映射关系，所述目标文字转语音模块包含每个所述预设打断回复文本与其对应的预设打断回复语音之间的第二映射关系；所述根据所述目标打断词、目标自然语言理解模块和目标文字转语音模块生成目标打断回复语音，包括：将所述目标打断词输入至所述目标自然语言理解模块中，以便所述目标自然语言理解模块根据所述目标打断词和所述第一映射关系，输出所述目标打断词对应的目标打断回复文本；将所述目标打断回复文本输入至所述目标文字转语音模块中，以便所述目标文字转语音模块根据所述目标打断回复文本和所述第二映射关系，输出所述目标打断回复语音。4.根据权利要求2所述的方法，其特征在于，在所述接收通话音频之前，所述方法还包括：获取第一训练样本集，其中，所述第一训练样本集包含多个第一训练样本和多个第二训练样本，所述第一训练样本包括：任意一个所述预设打断词和所述预设打断词对应的语
音，所述第二训练样本包括：不包含任意所述预设打断词的训练文本和所述训练文本对应的语音；使用所述第一训练样本集对第一预置模型进行训练，直至达到第一预设训练停止条件，以获得所述预置声学模型；获取第二训练样本集，其中，所述第二训练样本集包含多个所述预设打断词和多个其他词语，其中，所述其他词语为与所述预设打断词相关的词语；使用所述第二训练样本集对第二预置模型进行训练，直至达到第二预设训练停止条件，以获得所述预置语言模型；根据每个所述预设打断词对应的字间关系建立所述预置识别词网络。5.根据权利要求4所述的方法，其特征在于，所述第一预置模型具体为：GMM－HMM模型，所述第二预置模型具体为：N
‑
Gram模型。6.一种语音打断装置，其特征在于，所述装置应用于软交换子系统，包括：接收单元，用于接收通话音频，其中，所述通话音频为目标移动通信运营商为目标客户播放目标回复语音过程中，所述目标移动通信运营商采集获得的音频；检测单元，用于基于目标人声检测模块检测所述通话音频中是否包含人声音频，其中，所述目标人声检测模块为预先集成在所述软交换子系统中的功能...

【专利技术属性】
技术研发人员：冯鑫，张韶峰，
申请(专利权)人：百融云创科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人