一种基于信审场景的上下文语音识别纠错方法技术

技术编号：38711127 阅读：11 留言：0更新日期：2023-09-08 14:54

本发明专利技术公开了一种基于信审场景的上下文语音识别纠错方法，包括如下步骤：获取待纠错语句的上下文语句；将待纠错的语句及其对应的上下文语句输入到预先建立并训练的纠错模型中进行纠错后输出正确的语句文本；其中预先建立的纠错模型包括：预训练的Bert模型、双向GRU模型、错误词纠正模块；其中语序连Bert模型输入待纠错语句并将其转换成句子向量；双向GRU模型输入上下文语句并将其生成上下文向量；将句子向量和上下文向量进行信息融合后送入到错误次纠正模块中进行识别纠正并输出对应的正确语句文本。正确语句文本。正确语句文本。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于信审场景的上下文语音识别纠错方法

[0001]本专利技术涉及金融信贷审查领域，特别涉及一种基于信审场景的上下文语音识别纠错方法。

技术介绍

[0002]人工信审目前多采用电话沟通的方式，信审结束后会使用自然语言理解模块(NLU)对通话内容进行分析和内容提取，例如提取贷款申请人的各项信息，或者判断信审员是否按照要求进行提问。由于NLU模块接收文本输入，所以需要用语音转文本(ASR)将语音信号转变为文本信号。但是目前一个很大的问题就是ASR的结果因为信号或者说话人口音等问题往往会出现错误，这种存在错误的文本数据提供给NLU模块很可能导致下游应用结果的不准确。
[0003]针对一些简单的ASR错误，例如错字导致整个句子不通顺，相对还比较好解决。但是针对比较复杂的错误，例如整体ASR结果读下来是比较通顺的，但是某个词或者短语需要结合上下文，甚至用户和客服说的话都要考虑才能发现用在这里是不合适的。
[0004]自然语言理解(NLU)作为一项人工智能技术被广泛应用在各行各业需要让机器对文本进行理解的地方，特别是在客服等对话领域，不管是对客服进行质检还是对客服和用户通话沟通内容进行分析，我们都需要自然语言理解的技术。NLU的输入就是一段文本，输出就是这段文本表达的意图(分类)或者文本中的重要信息提炼(实体提取)。但是在客服等电话沟通场景，NLU模块接收到的输入是经过ASR模块的结果，因此ASR模块结果的错误就会对NLU产生较大的影响。
[0005]业界目前有很多的方案在进行语音识别的纠错，主要分为N...

【技术保护点】

【技术特征摘要】
1.一种基于信审场景的上下文语音识别纠错方法，其特征在于：获取待纠错语句的上下文语句；将待纠错的语句及其对应的上下文语句输入到预先建立并训练的纠错模型中进行纠错后输出正确的语句文本；其中预先建立的纠错模型包括：预训练的Bert模型、双向GRU模型、错误词纠正模块；其中语序连Bert模型输入待纠错语句并将其转换成句子向量；双向GRU模型输入上下文语句并将其生成上下文向量；将句子向量和上下文向量进行信息融合后送入到错误词纠正模块中进行识别纠正并输出对应的正确语句文本。2.如权利要求1所述的一种基于信审场景的上下文语音识别纠错方法，其特征在于：采用MLM方式对Bert模型进行预训练从而得到预训练的Bert模型。3.如权利要求1所述的一种基于信审场景的上下文语音识别纠错方法，其特征在于：对建立的纠错模型进行训练包括：在训练时增加错误位置检测模块至纠错模型中；建立待纠错语句及其对应的上下文语句的训练数据库；基于数据库对纠错模型进行训练：其中将数据库中的待纠错的句子及其上下文输入到纠错模型中；Bert模型将待纠错句子转换成句子向量、双向GRU模型将上下文句子转换成上下文向量；将上下文向量的信息融合到当前纠错句子中形成融合向量；将融合向量分别送入到错误位置检测模块和错误词纠正模块中并得到各自的损失值detect loss和correct loss，按照设定权重求得两者在权重系数下的最终的final loss，在纠错模型训练时以final loss最小为目标进行训练。4.如权利要求2所述的一种基于信审场景的上下文语音识别纠错方法，其...

【专利技术属性】
技术研发人员：王延松，宋青原，魏文杨，王伟玮，
申请(专利权)人：奇瑞徽银汽车金融股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人