语音信息提取方法、装置、设备及存储介质制造方法及图纸

技术编号:36690596 阅读:17 留言:0更新日期:2023-02-27 19:57
本发明专利技术涉及人工智能技术领域,公开了一种语音信息提取方法、装置、设备及存储介质。该语音信息提取方法包括:获取基于人机交互产生的音频数据,利用自动语音识别技术将所述音频数据转化为文本信息;基于信息提取模型对所述文本信息进行关键信息提取;根据所提取的关键信息确定业务类型,根据所述业务类型匹配预设的纠偏库,获得目标纠偏库;调用所述目标纠偏库对所述关键信息进行纠偏处理,得到纠偏后的目标关键信息。通过上述方式,本发明专利技术能够提高语音信息提取的准确率和纠偏效率,解决语音识别不准确的问题。不准确的问题。不准确的问题。

【技术实现步骤摘要】
语音信息提取方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,特别是涉及一种语音信息提取方法、装置、设备及存储介质。

技术介绍

[0002]目前,在一些金融保险业务场景中,如车险,需要从通话中的语音信息提取一些关键信息,比如:客户的姓名、手机号码、地址、预约时间、车型、产品信息等,使用这些信息来减少坐席在系统中操作,从而提高操作效率。而语音系统中语音内容识别的精确性,是影响语音信息提取准确率的关键制约因素,但是由于技术限制,生成的文本可能包含错误,继而导致后续的关键信息提取出现偏差,准确率低。

技术实现思路

[0003]本专利技术提供一种语音信息提取方法、装置、设备及存储介质,能够提高语音信息提取的准确率和纠偏效率,解决语音识别不准确的问题。
[0004]为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种语音信息提取方法,包括:
[0005]获取基于人机交互产生的音频数据,利用自动语音识别技术将所述音频数据转化为文本信息;
[0006]基于信息提取模型对所述文本信息进行关键信息提取;
[0007]根据所提取的关键信息确定业务类型,根据所述业务类型匹配预设的纠偏库,获得目标纠偏库;
[0008]调用所述目标纠偏库对所述关键信息进行纠偏处理,得到纠偏后的目标关键信息。
[0009]根据本专利技术的一个实施例,所述根据所述业务类型匹配预设的纠偏库,获得目标纠偏库还包括:
[0010]将所述业务类型与预设的纠偏库进行匹配,判断是否存在相匹配的纠偏库;
[0011]若是,则将相匹配的预设的纠偏库确定为所述目标纠偏库;
[0012]若否,则根据所述业务类型创建新的调用接口以增加新的纠偏库,将所述新的纠偏库确定为所述目标纠偏库。
[0013]根据本专利技术的一个实施例,所述调用所述目标纠偏库对所述关键信息进行纠偏处理,得到纠偏后的目标关键信息还包括:
[0014]调用所述目标纠偏库对所述关键信息进行纠偏处理;
[0015]根据纠偏处理结果对所述关键信息进行标注处理;
[0016]根据标注处理结果获得纠偏后的目标关键信息。
[0017]根据本专利技术的一个实施例,所述根据纠偏处理结果对所述关键信息进行标注处理还包括:
[0018]若所述纠偏处理结果为所述关键信息在所述目标纠偏库中匹配到目标关键信息,则对所述关键信息标注第一标签;
[0019]若所述纠偏处理结果为所述关键信息在所述目标纠偏库中未匹配到目标关键信息,则将所述关键信息转化为拼音信息,基于所述拼音信息和预设数据库对所述关键信息进行重新纠偏处理,根据重新纠偏结果对所述关键信息进行标注处理。
[0020]根据本专利技术的一个实施例,所述基于信息提取模型对所述文本信息进行关键信息提取之后,还包括:
[0021]自动检验所提取的关键信息的格式是否预设格式要求;
[0022]若是,则执行根据所提取的关键信息确定业务类型,根据所述业务类型匹配预设的纠偏库,获得目标纠偏库的步骤;
[0023]若否,则舍弃所述关键信息。
[0024]根据本专利技术的一个实施例,所述利用自动语音识别技术将所述音频数据转化为文本信息包括:
[0025]利用自动语音识别技术对所述音频数据进行声纹识别,获得至少一种声音特征;
[0026]获取各所述声音特征在所述音频数据中的语音时长以及声音频谱;
[0027]根据所述语音时长以及所述声音频谱从所述音频数据中确定目标语音数据,以对所述目标语音数据进行文本转换,得到所述文本信息。
[0028]根据本专利技术的一个实施例,所述基于信息提取模型对所述文本信息进行关键信息提取包括:
[0029]通过词嵌入层对所述文本信息进行向量化处理,获取与所述文本信息对应的向量序列;
[0030]通过注意力机制层对所述向量序列进行特征提取,得到包含有上下文信息的特征向量;
[0031]通过池化层和卷积层对所述特征向量进行深层特征提取,得到关键信息以及对应的信息类型标签。
[0032]为解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种语音信息提取装置,包括:
[0033]获取模块,用于获取基于人机交互产生的音频数据,利用自动语音识别技术将所述音频数据转化为文本信息;
[0034]提取模块,用于基于信息提取模型对所述文本信息进行关键信息提取;
[0035]匹配模块,用于根据所提取的关键信息确定业务类型,根据所述业务类型匹配预设的纠偏库,获得目标纠偏库;
[0036]纠偏模块,用于调用所述目标纠偏库对所述关键信息进行纠偏处理,得到纠偏后的目标关键信息。
[0037]为解决上述技术问题,本专利技术采用的再一个技术方案是:提供一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的语音信息提取方法。
[0038]为解决上述技术问题,本专利技术采用的再一个技术方案是:提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述语音信息提取方法。
[0039]本专利技术的有益效果是:通过根据所提取的关键信息确定业务类型,根据业务类型匹配预设的纠偏库,获得目标纠偏库,能够减小数据处理量,提高纠偏效率;通过调用目标纠偏库对关键信息进行纠偏处理,得到纠偏后的目标关键信息,能够提高语音信息提取的准确率,解决语音识别不准确的问题。
附图说明
[0040]图1是本专利技术一实施例的语音信息提取方法的流程示意图;
[0041]图2是本专利技术实施例的语音信息提取方法中步骤S103的流程示意图;
[0042]图3是本专利技术实施例的语音信息提取方法中步骤S104的流程示意图;
[0043]图4是本专利技术实施例的语音信息提取装置的结构示意图;
[0044]图5是本专利技术实施例的计算机设备的结构示意图;
[0045]图6是本专利技术实施例的计算机存储介质的结构示意图。
具体实施方式
[0046]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术的一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0047]本专利技术中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本专利技术的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。本专利技术实施例中所有方向性指示(诸如上、下、左、右、前、后
……
)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音信息提取方法,其特征在于,包括:获取基于人机交互产生的音频数据,利用自动语音识别技术将所述音频数据转化为文本信息;基于信息提取模型对所述文本信息进行关键信息提取;根据所提取的关键信息确定业务类型,根据所述业务类型匹配预设的纠偏库,获得目标纠偏库;调用所述目标纠偏库对所述关键信息进行纠偏处理,得到纠偏后的目标关键信息。2.根据权利要求1所述的语音信息提取方法,其特征在于,所述根据所述业务类型匹配预设的纠偏库,获得目标纠偏库还包括:将所述业务类型与预设的纠偏库进行匹配,判断是否存在相匹配的纠偏库;若是,则将相匹配的预设的纠偏库确定为所述目标纠偏库;若否,则根据所述业务类型创建新的调用接口以增加新的纠偏库,将所述新的纠偏库确定为所述目标纠偏库。3.根据权利要求1所述的语音信息提取方法,其特征在于,所述调用所述目标纠偏库对所述关键信息进行纠偏处理,得到纠偏后的目标关键信息还包括:调用所述目标纠偏库对所述关键信息进行纠偏处理;根据纠偏处理结果对所述关键信息进行标注处理;根据标注处理结果获得纠偏后的目标关键信息。4.根据权利要求3所述的语音信息提取方法,其特征在于,所述根据纠偏处理结果对所述关键信息进行标注处理还包括:若所述纠偏处理结果为所述关键信息在所述目标纠偏库中匹配到目标关键信息,则对所述关键信息标注第一标签;若所述纠偏处理结果为所述关键信息在所述目标纠偏库中未匹配到目标关键信息,则将所述关键信息转化为拼音信息,基于所述拼音信息和预设数据库对所述关键信息进行重新纠偏处理,根据重新纠偏结果对所述关键信息进行标注处理。5.根据权利要求1所述的语音信息提取方法,其特征在于,所述基于信息提取模型对所述文本信息进行关键信息提取之后,还包括:自动检验所提取的关键信息的格式是否预设格式要求;若是,则执行根据所提取的关键信息确定业务类型,根据所述业务...

【专利技术属性】
技术研发人员:姜卫宏
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1