语音智能匹配方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33307548 阅读:16 留言:0更新日期:2022-05-06 12:17
本发明专利技术涉及人工智能领域,揭露一种语音智能匹配方法,包括:对至少两段通话语音进行语音识别,得到至少两段语音文本;利用文本匹配模型中编码层对每段语音文本中的文本语句进行双向编码,得到每段语音文本的双向句向量,根据每段语音文本的双向句向量,利用编码层编码每段语音文本的文本隐向量;根据双向句向量和文本隐向量,利用文本匹配模型中交互层计算语音文本之间的信息关联性,以识别语音文本中的关联信息特征;利用文本匹配模型中池化层对关联信息特征进行池化处理,得到目标信息特征;根据目标信息特征,利用文本匹配模型中全连接层计算语音文本之间的匹配类别,以识别至少两段通话语音的匹配结果。本发明专利技术可以提高语音匹配的准确性。音匹配的准确性。音匹配的准确性。

【技术实现步骤摘要】
语音智能匹配方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能领域,尤其涉及一种语音智能匹配方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]通话语音匹配是指对两段通话语音进行上下文语义是否衔接识别的过程,通过所述通话语音的匹配可以识别出第一次通话语音内容和第二次通话语音内容是否出现衔接不流畅的现象,从而可以识别通话异常的业务场景。
[0003]目前,通话语音的匹配通常是基于文本匹配算法实现,即通过文本匹配算法识别出所述通话语音之间每段语句的关联性确定所述通话语音是否匹配,但由于所述通话语音会涉及对话操作,即在通话语音中会出现上下文交互的句子,而所述文本匹配算法无法支持通话语音中上下文语句的语义信息识别,这样会影响通话语音之间的关联性计算准确性,从而会影响通话语音匹配的准确性。

技术实现思路

[0004]本专利技术提供一种语音智能匹配方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高语音匹配的准确性。
[0005]为实现上述目的,本专利技术提供的一种语音智能匹配方法,包括:
[0006]获取至少两段通话语音,对每段所述通话语音进行语音识别,得到至少两段语音文本;
[0007]利用预训练好的文本匹配模型中的编码层对每段所述语音文本中的文本语句进行双向编码,得到每段所述语音文本的双向句向量,根据每段所述语音文本的双向句向量,利用所述编码层编码每段所述语音文本的文本隐向量;
[0008]根据所述双向句向量和所述文本隐向量,利用所述文本匹配模型中的交互层计算所述语音文本之间的信息关联性,以识别所述语音文本中的关联信息特征;
[0009]利用所述文本匹配模型中的池化层对所述关联信息特征进行池化处理,得到目标信息特征;
[0010]根据所述目标信息特征,利用所述文本匹配模型中的全连接层计算所述语音文本之间的匹配类别,根据所述匹配类别,识别所述至少两段通话语音的匹配结果。
[0011]可选地,所述对每段所述通话语音进行语音识别,得到至少两段语音文本,包括:
[0012]提取每段所述通话语音的音频特征,利用声学模型计算每段所述音频特征的音素序列概率;
[0013]根据所述音素序列概率,利用语言模型计算每段所述音频特征的文字序列,根据每段所述通话语音的文字序列,得到至少两段语音文本。
[0014]可选地,所述利用预训练好的文本匹配模型中的编码层对每段所述语音文本中文本语句进行双向编码,得到每段所述语音文本的双向句向量,包括:
[0015]获取每段所述语音文本中文本语句的文本词语,对所述文本词语进行前向向量编码及后向向量编码,得到前向词向量和后向词向量;
[0016]将所述前向词向量和后向词向量进行组合,得到每段所述语音文本的双向句向量。
[0017]可选地,所述根据所述双向句向量和所述文本隐向量,利用所述文本匹配模型中的交互层检测所述语音文本之间的关联信息特征,包括:
[0018]计算所述双向句向量之间的语句相似度矩阵和所述文本隐向量之间的文本相似度矩阵;
[0019]根据所述语句相似度矩阵,计算所述双向句向量之间的语句关联性,根据所述文本相似度矩阵,计算所述文本隐向量之间的文本关联性;
[0020]根据所述语句关联性和所述文本关联性,识别所述语音文本之间的关联信息特征。
[0021]可选地,所述根据所述语句相似度矩阵,计算所述双向句向量之间的语句关联性,包括:
[0022]利用下述公式计算所述双向句向量之间的语句关联性:
[0023][0024][0025]其中,表示语音文本a中第i个双向句向量与语音文本b中第j个双向句向量的语句关联性,表示语音文本b中第j个双向句向量,表示语音文本b中第j个双向句向量与语音文本a中第i个双向句向量的语句关联性,表示语音文本a中第i个双向句向量,e
ij
表示语句相似度矩阵,exp(e
ij
)表示语句相似度矩阵的指数函数,l
b
表示语音文本b中双向句向量的数量,l
a
表示语音文本a中双向句向量的数量。
[0026]可选地,所述根据所述语句关联性和所述文本关联性,识别所述语音文本之间的关联信息特征,包括:
[0027]根据所述语句关联性,确定所述语音文本之间的关联语句特征,根据所述文本关联性,确定所述语音文本之间的关联主题特征;
[0028]根据所述关联语句特征和所述关联主题特征,生成所述语音文本之间的关联信息特征。
[0029]可选地,所述利用所述文本匹配模型中池化层对所述关联信息特征进行池化处理,得到目标信息特征,包括:
[0030]利用所述池化层中的池化算法对所述关联信息特征进行特征降维,并利用所述池化层中的激活函数激活特征降维后的所述关联信息特征,得到所述目标信息特征。
[0031]为了解决上述问题,本专利技术还提供一种语音智能匹配装置,所述装置包括:
[0032]通话语音识别模块,用于获取至少两段通话语音,对每段所述通话语音进行语音识别,得到至少两段语音文本;
[0033]语音文本编码模块,用于利用预训练好的文本匹配模型中的编码层对每段所述语音文本中的文本语句进行双向编码,得到每段所述语音文本的双向句向量,根据每段所述语音文本的双向句向量,利用所述编码层编码每段所述语音文本的文本隐向量;
[0034]信息特征提取模块,用于根据所述双向句向量和所述文本隐向量,利用所述文本匹配模型中的交互层计算所述语音文本之间的信息关联性,以识别所述语音文本中的关联信息特征;
[0035]信息特征池化模块,用于利用所述文本匹配模型中的池化层对所述关联信息特征进行池化处理,得到目标信息特征;
[0036]匹配结果识别模块,用于根据所述目标信息特征,利用所述文本匹配模型中的全连接层计算所述语音文本之间的匹配类别,根据所述匹配类别,识别所述至少两段通话语音的匹配结果。
[0037]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0038]至少一个处理器;以及,
[0039]与所述至少一个处理器通信连接的存储器;其中,
[0040]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以实现上述所述的语音智能匹配方法。
[0041]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的语音智能匹配方法。
[0042]可以看出,本专利技术实施例对至少两段通话语音进行语音识别,得到至少两段语音文本,以保障后续通话语音的匹配前提,并利用预训练好的文本匹配模型中编码层对每段所述语音文本中的文本语句进行双向编码,得到每段所述语音文本的双向句向量,及根据每段所述语音文本的双向句向量,利用所述编码层本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音智能匹配方法,其特征在于,所述方法包括:获取至少两段通话语音,对每段所述通话语音进行语音识别,得到至少两段语音文本;利用预训练好的文本匹配模型中的编码层对每段所述语音文本中的文本语句进行双向编码,得到每段所述语音文本的双向句向量,根据每段所述语音文本的双向句向量,利用所述编码层编码每段所述语音文本的文本隐向量;根据所述双向句向量和所述文本隐向量,利用所述文本匹配模型中的交互层计算所述语音文本之间的信息关联性,以识别所述语音文本中的关联信息特征;利用所述文本匹配模型中的池化层对所述关联信息特征进行池化处理,得到目标信息特征;根据所述目标信息特征,利用所述文本匹配模型中的全连接层计算所述语音文本之间的匹配类别,根据所述匹配类别,识别所述至少两段通话语音的匹配结果。2.如权利要求1所述的语音智能匹配方法,其特征在于,所述对每段所述通话语音进行语音识别,得到至少两段语音文本,包括:提取每段所述通话语音的音频特征,利用声学模型计算每段所述音频特征的音素序列概率;根据所述音素序列概率,利用语言模型计算每段所述音频特征的文字序列,根据每段所述通话语音的文字序列,得到至少两段语音文本。3.如权利要求1所述的语音智能匹配方法,其特征在于,所述利用预训练好的文本匹配模型中的编码层对每段所述语音文本中文本语句进行双向编码,得到每段所述语音文本的双向句向量,包括:获取每段所述语音文本中文本语句的文本词语,对所述文本词语进行前向向量编码及后向向量编码,得到前向词向量和后向词向量;将所述前向词向量和后向词向量进行组合,得到每段所述语音文本的双向句向量。4.如权利要求1所述的语音智能匹配方法,其特征在于,所述根据所述双向句向量和所述文本隐向量,利用所述文本匹配模型中的交互层检测所述语音文本之间的关联信息特征,包括:计算所述双向句向量之间的语句相似度矩阵和所述文本隐向量之间的文本相似度矩阵;根据所述语句相似度矩阵,计算所述双向句向量之间的语句关联性,根据所述文本相似度矩阵,计算所述文本隐向量之间的文本关联性;根据所述语句关联性和所述文本关联性,识别所述语音文本之间的关联信息特征。5.如权利要求4所述的语音智能匹配方法,其特征在于,所述根据所述语句相似度矩阵,计算所述双向句向量之间的语句关联性,包括:利用下述公式计算所述双向句向量之间的语句关联性:
其中,表示语音文本a中第i个双向句向量与语音文本b中第j个双向句向量的语句关联性,表示语音文本b中第j个双向句向量,表示语音文本b中第j个双向句向量与语音文本a中第i个双向句向量的语句关联性...

【专利技术属性】
技术研发人员:罗霄
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1