用于语音文本的特征实体识别方法及系统技术方案

技术编号:39418711 阅读:13 留言:0更新日期:2023-11-19 16:08
本发明专利技术提供一种用于语音文本的特征实体识别方法及系统,包括:获取语音文本;对所述语音文本进行先验知识处理,以得到文本向量;利用神经网络对所述文本向量进行激活处理,以得到特征实体。通过对语音文本进行先验知识处理,能够提高样本的特征实体识别的精准度;通过神经网络对文本向量进行激活处理,能够提高神经网络的收敛速度,从而提高了特征实体识别的效率。解决了如何对语音文本的特征实体进行高效、高准确性的识别的问题。高准确性的识别的问题。高准确性的识别的问题。

【技术实现步骤摘要】
用于语音文本的特征实体识别方法及系统


[0001]本专利技术涉及音频识别
,特别涉及一种用于语音文本的特征实体识别方法及系统。

技术介绍

[0002]随着计算机技术的发展,人工智能的应用越大越广泛。目前,人工智能主要被应用于各类人机交互系统,例如企业利用智能语音通话来实现对客户的回访或问卷调查,以此来节约人力成本。
[0003]对于智能语音外呼企业,每天都会产生大量的对话音频文件,而在将这些对话音频文件进行文本转换以及意图识别时,便会产生大量的特征实体识别的需求,这便要求转换及识别系统需要具有高速高准确度的转换及识别能力,对系统的搭建要求较高,会耗费较大的搭建成本。此外,对于流程性的智能对话中,其对话音频文件中的文本内容通常是特定的,这表明转换及识别系统需要具备先验知识,且由于对话音频文件中文本内容特定,导致样本量较少,对转换及识别系统要求收敛速度要快;而对于其他智能通话,通话内容复杂,导致特征实体识别的任务繁杂,不仅包括一般流程性的特征实体识别,还包括嵌套等复杂特征实体识别。
[0004]然而现有的对语音文本的特征实体识别系统一般仅针对流程性的智能对话进行特征实体识别,而对于其他智能通话,其识别的效率及精准性均较差,尤其是在小样本的对话文本中,现有的特征实体识别系统的收敛速度较慢,很容易出现信息偏差,导致特征实体识别错误。

技术实现思路

[0005]本专利技术的目的在于提供一种用于语音文本的特征实体识别方法及系统,以解决如何对语音文本的特征实体进行高效、高准确性的识别的问题。<br/>[0006]为解决上述技术问题,本专利技术提供一种用于语音文本的特征实体识别方法,包括:
[0007]获取语音文本;
[0008]对所述语音文本进行先验知识处理,以得到文本向量;
[0009]利用神经网络对所述文本向量进行激活处理,以得到特征实体。
[0010]可选的,在所述的用于语音文本的特征实体识别方法中,所述获取语音文本的方法包括:
[0011]获取语音音频文件;
[0012]对所述语音音频文件进行语音识别并转写,以得到语音文本。
[0013]可选的,在所述的用于语音文本的特征实体识别方法中,所述对所述语音音频文件进行语音识别并转写,以得到语音文本的方法包括:
[0014]利用自动语音识别技术对所述语音音频文件进行自动语音识别,以得到初文本文件;
[0015]对所述初文本文件进行纠错处理和正则化处理,以剔除所述初文本文件中的特殊符号和停用词,得到语音文本。
[0016]可选的,在所述的用于语音文本的特征实体识别方法中,所述对所述语音文本进行先验知识处理,以得到文本向量的方法包括:
[0017]获取特殊标志和基础模板;
[0018]对所述特殊标志、所述基础模板和所述语音文本分别进行序列化处理,以得到标志序列化向量、模板序列化向量和文本序列化向量;
[0019]将所述标志序列化向量、所述模板序列化向量和所述文本序列化向量进行拼接重构处理,以得到文本向量。
[0020]可选的,在所述的用于语音文本的特征实体识别方法中,所述获取特殊标志和基础模板,并对所述特殊标志、所述基础模板和所述语音文本分别进行序列化处理,以得到标志序列化向量、模板序列化向量和文本序列化向量的方法包括:
[0021]预设特殊标志,所述特殊标志包括首位标志和分隔标志;
[0022]使用序列化工具对所述特殊标志进行序列化处理,以得到标志序列化向量;
[0023]构建先验知识模板,并提取所述所述先验知识模板中的第一特征文本,以得到基础模板;
[0024]使用序列化工具对所述基础模板进行序列化处理,以得到模板序列化向量;
[0025]预设若干第二特征文本;
[0026]根据所述第二特征文本,使用序列化工具对所述语音文本进行序列化处理,以得到文本序列化向量。
[0027]可选的,在所述的用于语音文本的特征实体识别方法中,拼接重构处理后得到的文本向量的结构为:
[0028]{[CLS],q1,q2,
……
,q
m
,[SEP],x1,x2,
……
,x
n
}
[0029]其中,[CLS]为首位标志,q1,q2,
……
,q
m
为模板序列化向量,[SEP]为分隔标志,x1,x2,
……
,x
n
为文本序列化向量。
[0030]可选的,在所述的用于语音文本的特征实体识别方法中,所述利用神经网络对所述文本向量进行激活处理,以得到特征实体的方法包括:
[0031]将所述文本向量转换为连续分布向量,并分配向量空间;
[0032]利用编码器对所述连续分布向量进行处理,并进行线性变换运算,以得到线性变换向量;
[0033]利用神经网络的激活函数对所述线性变换向量进行非线性变换,以得到特征实体的预测位置编码;
[0034]对所述特征实体的预测位置编码进行解编码,以得到特征实体。
[0035]可选的,在所述的用于语音文本的特征实体识别方法中,所述神经网络中采用的激活函数为:
[0036][0037]其中,α和β为调节变量,取值区间为[0,1]。
[0038]为解决上述技术问题,本专利技术还提供一种用于语音文本的特征实体识别系统,包括:
[0039]获取模块,用于获取语音文本、特殊标志和基础模版;
[0040]处理模块,用于对所述语音文本、所述特殊标准和所述基础模板进行处理,以得到文本向量;
[0041]激活模块,用于利用神经网络对所述文本向量进行激活处理,以得到特征实体。
[0042]可选的,在所述的用于语音文本的特征实体识别系统中,所述处理模块包括:
[0043]语音处理单元,用于将语音音频文件转换为初文本文件,并对所述初文本文件进行纠错处理和正则化处理,以剔除所述初文本文件中的特殊符号和停用词,得到语音文本;
[0044]序列化单元,用于对所述特殊标志、所述基础模板和所述语音文本分别进行序列化处理,以得到标志序列化向量、模板序列化向量和文本序列化向量;
[0045]拼接重构单元,用于将所述标志序列化向量、所述模板序列化向量和所述文本序列化向量进行拼接重构处理,以得到文本向量。
[0046]可选的,在所述的用于语音文本的特征实体识别系统中,所述激活模块包括:
[0047]编码单元,用于对所述文本向量进行编码处理,以得到线性变换向量;
[0048]激活单元,用于利用激活函数对所述线性变换向量进行激活处理,以得到特征实体。
[0049]可选的,在所述的用于语音文本的特征实体识别系统中,所述编码单元包括:
[0050]嵌入层,用于将所述文本向量转换为连续分布向量,并分配向量空间;
[0051]编码器,用于对所述连续分布向量进行处理本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于语音文本的特征实体识别方法,其特征在于,包括:获取语音文本;对所述语音文本进行先验知识处理,以得到文本向量;利用神经网络对所述文本向量进行激活处理,以得到特征实体。2.根据权利要求1所述的用于语音文本的特征实体识别方法,其特征在于,所述获取语音文本的方法包括:获取语音音频文件;对所述语音音频文件进行语音识别并转写,以得到语音文本。3.根据权利要求2所述的用于语音文本的特征实体识别方法,其特征在于,所述对所述语音音频文件进行语音识别并转写,以得到语音文本的方法包括:利用自动语音识别技术对所述语音音频文件进行自动语音识别,以得到初文本文件;对所述初文本文件进行纠错处理和正则化处理,以剔除所述初文本文件中的特殊符号和停用词,得到语音文本。4.根据权利要求1所述的用于语音文本的特征实体识别方法,其特征在于,所述对所述语音文本进行先验知识处理,以得到文本向量的方法包括:获取特殊标志和基础模板;对所述特殊标志、所述基础模板和所述语音文本分别进行序列化处理,以得到标志序列化向量、模板序列化向量和文本序列化向量;将所述标志序列化向量、所述模板序列化向量和所述文本序列化向量进行拼接重构处理,以得到文本向量。5.根据权利要求4所述的用于语音文本的特征实体识别方法,其特征在于,所述获取特殊标志和基础模板,并对所述特殊标志、所述基础模板和所述语音文本分别进行序列化处理,以得到标志序列化向量、模板序列化向量和文本序列化向量的方法包括:预设特殊标志,所述特殊标志包括首位标志和分隔标志;使用序列化工具对所述特殊标志进行序列化处理,以得到标志序列化向量;构建先验知识模板,并提取所述所述先验知识模板中的第一特征文本,以得到基础模板;使用序列化工具对所述基础模板进行序列化处理,以得到模板序列化向量;预设若干第二特征文本;根据所述第二特征文本,使用序列化工具对所述语音文本进行序列化处理,以得到文本序列化向量。6.根据权利要求5所述的用于语音文本的特征实体识别方法,其特征在于,拼接重构处理后得到的文本向量的结构为:{[CLS],q1,q2,
……
,q
m
,...

【专利技术属性】
技术研发人员:周丽萍吕召彪赵文博
申请(专利权)人:联通广东产业互联网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1