针对语音问题的应答方法及其装置、电子设备、存储介质制造方法及图纸

技术编号:39400977 阅读:9 留言:0更新日期:2023-11-19 15:53
本发明专利技术公开了一种针对语音问题的应答方法及其装置、电子设备、存储介质,涉及人工智能技术领域、金融科技领域或其他相关技术领域,其中,该应答方法包括:接收目标语音信号,对目标语音信号进行预处理,并基于预设帧长对预处理之后的目标语音信号进行切割,得到短帧语音片段集合,将每个短帧语音片段转换成文本形式,得到语音问题文本,基于预设文本改写策略对语音问题文本进行改写,得到模型提示语句,将模型提示语句输入至应答语句生成模型,输出目标语音问题的推荐应答数据包,其中,推荐应答数据包中至少包括:推荐应答语句、语句来源跳转链接。本发明专利技术解决了相关技术中由于人工理解和搜索流程的限制导致应答服务效率低下的技术问题。技术问题。技术问题。

【技术实现步骤摘要】
针对语音问题的应答方法及其装置、电子设备、存储介质


[0001]本专利技术涉及人工智能
或其他相关
,具体而言,涉及一种针对语音问题的应答方法及其装置、电子设备、存储介质。

技术介绍

[0002]金融机构的电话客服在与客户进行语音沟通时,通常需要手动录音或者手写记录客户问题,再将人工整理的客户问题输入相应知识库中进行检索,自行理解知识库中检索到的参考知识,向客户做出应答,该应答场景下的电话客服需要手动完成记录问题、搜索知识和遣词造句等步骤,再向客户提供应答服务,这种方式应答效率很低,应答质量也依赖于电话客服自身的专业水平,无法得到保障。
[0003]相关技术中,人工应答方法受到人工理解和搜索流程的限制,容易导致应答服务的效率低下和无法保证应答服务质量的问题。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种针对语音问题的应答方法及其装置、电子设备、存储介质,以至少解决相关技术中由于人工理解和搜索流程的限制导致应答服务效率低下的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种针对语音问题的应答方法,包括:接收目标语音信号,对所述目标语音信号进行预处理,并基于预设帧长对预处理之后的所述目标语音信号进行切割,得到短帧语音片段集合,其中,所述目标语音信号至少包括:目标客户语音信号、目标客服语音信号,所述目标客户语音信号是指在目标客户与电话客服进行通话的过程中采集得到的所述目标客户对目标问题的描述性语音片段,所述目标客服语音信号是指所述电话客服对所述目标问题的总结性语音片段,所述短帧语音片段集合中包含N个短帧语音片段,所述短帧语音片段是指语音时长小于预设时长阈值的语音片段,N为大于等于1的正整数;将所述短帧语音片段集合中的每个短帧语音片段转换成文本形式,得到语音问题文本;基于预设文本改写策略对所述语音问题文本进行改写,得到模型提示语句;将所述模型提示语句输入至应答语句生成模型,输出目标语音问题的推荐应答数据包,其中,所述推荐应答数据包中至少包括:推荐应答语句、语句来源跳转链接。
[0007]可选地,在得到短帧语音片段集合之后,还包括:对所述短帧语音片段集合中的每一个所述短帧语音片段进行频谱特征提取,并将所述频谱特征映射至目标向量空间,得到频谱特征向量;整合所有所述频谱特征向量,得到所述目标语音信号对应的特征向量集合;将所述特征向量集合与所述目标客户的客户标识保存至向量数据库,其中,所述客户标识用于索引所述特征向量集合。
[0008]可选地,将所述短帧语音片段集合中的每个短帧语音片段转换成文本形式,得到语音问题文本的步骤,包括:将每个短帧语音片段转换为数字信号;对所述数字信号进行预
处理操作,其中,所述预处理操作至少包括下述之一:降噪处理、去噪处理;将预处理操作之后的所述数字信号输入至语音识别模型,输出所述语音问题文本。
[0009]可选地,基于预设文本改写策略对所述语音问题文本进行改写,得到模型提示语句的步骤,包括:对所述语音问题文本进行语法改写,其中,所述语法改写的策略包括下述至少之一:删除语气填充词、调整语序和纠正语法;基于标准提示词库查询所述语音问题文本中的同义语句,并使用标准提示词对所述同义语句进行替换;将预设前缀语句、预设后缀语句与所述语音问题文本进行拼接,得到所述模型提示语句。
[0010]可选地,基于预设文本改写策略对所述语音问题文本进行改写,得到模型提示语句的步骤,还包括:基于标准提示词库提取所述语音问题文本中的关键词;将所述关键词嵌入标准提示语句模板,得到所述模型提示语句。
[0011]可选地,将所述模型提示语句输入应答语句生成模型之前,还包括:获取所述目标客户的客户标识;基于所述客户标识在向量数据库中提取所述目标客户对应的历史特征向量集合,其中,所述历史特征向量集合是基于该目标客户的历史语音信号构建的;将所述历史特征向量集合作为所述目标客户的客户偏好信息输入至所述应答语句生成模型。
[0012]可选地,所述应答语句生成模型是通过如下步骤得到的:采集高频问题的标准问答对,其中,所述高频问题是指在指定时间段内的提问次数大于预设阈值的语音问题,所述标准问答对至少包括:标准提示语句、标准应答语句;将所述标准提示语句和模拟客户偏好信息输入初始应答语句生成模型,输出模拟应答语句;计算所述模拟应答语句与所述标准应答语句的语句相似度;在所述语句相似度小于或等于预设相似度阈值的情况下,调整所述初始应答语句生成模型的模型参数,并由调整后的所述初始应答语句生成模型重新生成所述模拟应答语句;在重新生成的所述模拟应答语句与所述标准应答语句的所述语句相似度大于所述预设相似度阈值的情况下,停止调整模型参数,得到所述应答语句生成模型。
[0013]根据本专利技术实施例的另一方面,还提供了一种针对语音问题的应答装置,包括:接收单元,用于接收目标语音信号,对所述目标语音信号进行预处理,并基于预设帧长对预处理之后的所述目标语音信号进行切割,得到短帧语音片段集合,其中,所述目标语音信号至少包括:目标客户语音信号、目标客服语音信号,所述目标客户语音信号是指在目标客户与电话客服进行通话的过程中采集得到的所述目标客户对目标问题的描述性语音片段,所述目标客服语音信号是指所述电话客服对所述目标问题的总结性语音片段,所述短帧语音片段集合中包含N个短帧语音片段,所述短帧语音片段是指语音时长小于预设时长阈值的语音片段,N为大于等于1的正整数;转换单元,用于将所述短帧语音片段集合中的每个短帧语音片段转换成文本形式,得到语音问题文本;改写单元,用于基于预设文本改写策略对所述语音问题文本进行改写,得到模型提示语句;输入单元,用于将所述模型提示语句输入至应答语句生成模型,输出目标语音问题的推荐应答数据包,其中,所述推荐应答数据包中至少包括:推荐应答语句、语句来源跳转链接。
[0014]可选地,所述针对语音问题的应答装置还包括:特征提取模块,用于对所述短帧语音片段集合中的每一个所述短帧语音片段进行频谱特征提取,并将所述频谱特征映射至目标向量空间,得到频谱特征向量;整合模块,用于整合所有所述频谱特征向量,得到所述目标语音信号对应的特征向量集合;保存模块,用于将所述特征向量集合与所述目标客户的客户标识保存至向量数据库,其中,所述客户标识用于索引所述特征向量集合。
[0015]可选地,所述转换单元包括:转换模块,用于将每个短帧语音片段转换为数字信号;预处理模块,用于对所述数字信号进行预处理操作,其中,所述预处理操作至少包括下述之一:降噪处理、去噪处理;第一输入模块,用于将预处理操作之后的所述数字信号输入至语音识别模型,输出所述语音问题文本。
[0016]可选地,所述改写单元包括:改写模块,用于对所述语音问题文本进行语法改写,其中,所述语法改写的策略包括下述至少之一:删除语气填充词、调整语序和纠正语法;查询模块,用于基于标准提示词库查询所述语音问题文本中的同义语句,并使用标准提示词对所述同义语句进行替换;拼接模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对语音问题的应答方法,其特征在于,包括:接收目标语音信号,对所述目标语音信号进行预处理,并基于预设帧长对预处理之后的所述目标语音信号进行切割,得到短帧语音片段集合,其中,所述目标语音信号至少包括:目标客户语音信号、目标客服语音信号,所述目标客户语音信号是指在目标客户与电话客服进行通话的过程中采集得到的所述目标客户对目标问题的描述性语音片段,所述目标客服语音信号是指所述电话客服对所述目标问题的总结性语音片段,所述短帧语音片段集合中包含N个短帧语音片段,所述短帧语音片段是指语音时长小于预设时长阈值的语音片段,N为大于等于1的正整数;将所述短帧语音片段集合中的每个短帧语音片段转换成文本形式,得到语音问题文本;基于预设文本改写策略对所述语音问题文本进行改写,得到模型提示语句;将所述模型提示语句输入至应答语句生成模型,输出目标语音问题的推荐应答数据包,其中,所述推荐应答数据包中至少包括:推荐应答语句、语句来源跳转链接。2.根据权利要求1所述的应答方法,其特征在于,在得到短帧语音片段集合之后,还包括:对所述短帧语音片段集合中的每一个所述短帧语音片段进行频谱特征提取,并将所述频谱特征映射至目标向量空间,得到频谱特征向量;整合所有所述频谱特征向量,得到所述目标语音信号对应的特征向量集合;将所述特征向量集合与所述目标客户的客户标识保存至向量数据库,其中,所述客户标识用于索引所述特征向量集合。3.根据权利要求1所述的应答方法,其特征在于,将所述短帧语音片段集合中的每个短帧语音片段转换成文本形式,得到语音问题文本的步骤,包括:将每个所述短帧语音片段转换为数字信号;对所述数字信号进行预处理操作,其中,所述预处理操作至少包括下述之一:降噪处理、去噪处理;将预处理操作之后的所述数字信号输入至语音识别模型,输出所述语音问题文本。4.根据权利要求1所述的应答方法,其特征在于,基于预设文本改写策略对所述语音问题文本进行改写,得到模型提示语句的步骤,包括:对所述语音问题文本进行语法改写,其中,所述语法改写的策略包括下述至少之一:删除语气填充词、调整语序和纠正语法;基于标准提示词库查询所述语音问题文本中的同义语句,并使用标准提示词对所述同义语句进行替换;将预设前缀语句、预设后缀语句与所述语音问题文本进行拼接,得到所述模型提示语句。5.根据权利要求1所述的应答方法,其特征在于,基于预设文本改写策略对所述语音问题文本进行改写,得到模型提示语句的步骤,还包括:基于标准提示词库提取所述语音问题文本中的关键词;将所述关键词嵌入标准提示语句模板,得到所述模型提示语句。6.根据权利要求1所述的应答方法,其特征在于,将所述模型提示语句输入应答语句生
...

【专利技术属性】
技术研发人员:金昕刘安平
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1