一种催收场景下语音识别结果的纠错方法技术

技术编号:24685315 阅读:54 留言:0更新日期:2020-06-27 08:28
本发明专利技术公开了一种催收场景下语音识别结果的纠错方法,包括如下步骤:步骤1,催收领域专有词典库生成,步骤2,训练催收领域的催收员与客户通话之间语料的HMM模型:利用催收领域催收员与客户通话语料,并进行一定的人工标注整理后,作为训练样本,计算出初始发射概率、转移概率、发射概率,步骤3,待纠错文本生成,步骤4,纠错后文本集生成方法,步骤5,纠错后文本筛选方法:首先将确定的候选待纠错文本替换为对应的候选纠错后文本集合,利用训练出的HMM模型,结合算法进行解码工作,计算出最终候选纠错后文本。本发明专利技术,能够很好的对催收员的语音识别后进行纠正,很好的方便该语音识别产品大规模产品化应用。

An error correction method of speech recognition results in the scene of collection

【技术实现步骤摘要】
一种催收场景下语音识别结果的纠错方法
本专利技术涉及语音识别
,具体为一种催收场景下语音识别结果的纠错方法。
技术介绍
随着深度学习的普及,在计算机视觉、语音识别、自然语言处理等方面均取得重大突破。以语音识别为例,目前语音识别准确率已达到97%,使得语音识别的应用领域越来越广。在金融催收领域,催收员跟客户会进行大量的电话沟通。其中需要对通话音频进行语音识别(ASR)转为相应的通话文本,一方面对通话文本进行质检分析,以确保合规;另一方面,对通话文本进行文本分析及挖掘,为后续提升催收效果奠定坚实基础。在实际语音交互过程中,由于用户普通话不标准、噪音、专业领域词汇缺失等各因素影响,语音识别错误率较高。而现有技术都集中在提升语音识别准确率上,却缺乏对识别结果的纠错手段。以上,极大影响语音识别产品的大规模产品化应用。
技术实现思路
本专利技术的目的在于提供一种催收场景下语音识别结果的纠错方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种催收场景下语音识别结果的纠错方法,包括如下步骤:步骤1,催收领域专有词典库生成:统计催收领域催收员与客户通话语料,并进行一定的人工标注整理并进行脱敏,该语料作为训练语料,根据整理后的语料文本进行处理并由专门业务人员进行整理形成催收领域专有词典库;步骤2,训练催收领域的催收员与客户通话之间语料的HMM模型:利用催收领域催收员与客户通话语料,并进行一定的人工标注整理后,作为训练样本,计算出初始发射概率、转移概率、发射概率;步骤3,待纠错文本生成:对语音识别文本进行分词,检查各词是否在用户词典库中来判断是否加入待纠错文本;步骤4,纠错后文本集生成方法:首先,将候选待纠错文本转为拼音,其次,利用编辑距离算法计算候选待纠错文本与催收领域专有词典库中各词拼音之间的编辑距离来判断是否保留原候选待纠错文本;步骤5,纠错后文本筛选方法:首先将确定的候选待纠错文本替换为对应的候选纠错后文本集合,利用训练出的HMM模型,结合解码算法进行解码工作,计算出最终候选纠错后文本。优选的,是否加入所述候选待纠错文本的判断方法是各词若在所述催收领域专有词典库中,则不进行纠错,若不在所述催收领域专有词典库中,则作为所述候选待纠错文本。优选的,是否保留原所述候选待纠错文本的方法为所述若编辑距离小于阈值,则作为候选纠错后文本集,若编辑距离大于阈值,则先保留原所述候选待纠错文本。优选的,所述整理后的语料文本处理方法为文本分词、词性标注、词频统计、拼音标注、相似词检索。优选的,所述进行解码工作的解码算法为维特比算法。与现有技术相比,本专利技术的有益效果是:本专利技术,能够很好的对催收员的语音识别后进行纠正,很好的方便该语音识别产品大规模产品化应用。附图说明图1为本专利技术的流程图;图2为本专利技术的催收领域专有词典库构建流程图;图3为构建最终纠错后文本筛选的流程。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1-3,本专利技术提供一种技术方案:一种催收场景下语音识别结果的纠错方法,包括如下步骤:步骤1,催收领域专有词典库生成:统计催收领域催收员与客户通话语料,并进行一定的人工标注整理并进行脱敏,该语料作为训练语料,根据整理后的语料文本进行处理并由专门业务人员进行整理形成催收领域专有词典库;步骤2,训练催收领域的催收员与客户通话之间语料的HMM模型(隐马尔可夫模型):利用催收领域催收员与客户通话语料,并进行一定的人工标注整理后,作为训练样本,计算出初始发射概率、转移概率、发射概率;步骤3,待纠错文本生成:对语音识别文本进行分词,检查各词是否在用户词典库中来判断是否加入待纠错文本;步骤4,纠错后文本集生成方法:首先,将候选待纠错文本转为拼音,其次,利用编辑距离算法计算候选待纠错文本与催收领域专有词典库中各词拼音之间的编辑距离来判断是否保留原候选待纠错文本;步骤5,纠错后文本筛选方法:首先将确定的候选待纠错文本替换为对应的候选纠错后文本集合,利用训练出的HMM模型(隐马尔可夫模型),结合解码算法进行解码工作,计算出最终候选纠错后文本。具体的,是否加入候选待纠错文本的判断方法是各词若在催收领域专有词典库中,则不进行纠错,若不在催收领域专有词典库中,则作为候选待纠错文本。具体的,是否保留原候选待纠错文本的方法为若编辑距离小于阈值,则作为候选纠错后文本集,若编辑距离大于阈值,则先保留原候选待纠错文本,首先,计算全拼音与首拼的编辑距离,若各编辑距离分别小于各自阈值,则将该词作为候选纠错后文本,若大于阈值则将其自身与编辑距离排名前三的词作为候选纠错后文本。经过该步骤,每个候选待纠错文本会有一到多个候选纠错后文本,则需要继续进行候选纠错后文本筛选。具体的,整理后的语料文本处理方法为文本分词、词性标注、词频统计、拼音标注、相似词检索,分词、去除停用词,并按照词频进行倒序排序,并在每个词的后面标识出该词的词性、拼音,以上步骤为一个词的完整索引,根据以上步骤,构建催收领域专业词典库,其中各拼音用分割符分割。具体的,进行解码工作的解码算法为维特比算法,搜索效率高。尽管已经示出和描述了本专利技术的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本专利技术的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本专利技术的范围由所附权利要求及其等同物限定。本文档来自技高网...

【技术保护点】
1.一种催收场景下语音识别结果的纠错方法,其特征在于包括如下步骤:/n步骤1,催收领域专有词典库生成:统计催收领域催收员与客户通话语料,并进行一定的人工标注整理并进行脱敏,该语料作为训练语料,根据整理后的语料文本进行处理并由专门业务人员进行整理形成催收领域专有词典库;/n步骤2,训练催收领域的催收员与客户通话之间语料的HMM模型:利用催收领域催收员与客户通话语料,并进行一定的人工标注整理后,作为训练样本,计算出初始发射概率、转移概率、发射概率;/n步骤3,待纠错文本生成:对语音识别文本进行分词,检查各词是否在用户词典库中来判断是否加入待纠错文本;/n步骤4,纠错后文本集生成方法:首先,将候选待纠错文本转为拼音,其次,利用编辑距离算法计算候选待纠错文本与催收领域专有词典库中各词拼音之间的编辑距离来判断是否保留原候选待纠错文本;/n步骤5,纠错后文本筛选方法:首先将确定的候选待纠错文本替换为对应的候选纠错后文本集合,利用训练出的HMM模型,结合解码算法进行解码工作,计算出最终候选纠错后文本。/n

【技术特征摘要】
1.一种催收场景下语音识别结果的纠错方法,其特征在于包括如下步骤:
步骤1,催收领域专有词典库生成:统计催收领域催收员与客户通话语料,并进行一定的人工标注整理并进行脱敏,该语料作为训练语料,根据整理后的语料文本进行处理并由专门业务人员进行整理形成催收领域专有词典库;
步骤2,训练催收领域的催收员与客户通话之间语料的HMM模型:利用催收领域催收员与客户通话语料,并进行一定的人工标注整理后,作为训练样本,计算出初始发射概率、转移概率、发射概率;
步骤3,待纠错文本生成:对语音识别文本进行分词,检查各词是否在用户词典库中来判断是否加入待纠错文本;
步骤4,纠错后文本集生成方法:首先,将候选待纠错文本转为拼音,其次,利用编辑距离算法计算候选待纠错文本与催收领域专有词典库中各词拼音之间的编辑距离来判断是否保留原候选待纠错文本;
步骤5,纠错后文本筛选方法:首先将确定的候选待纠错文本替换为对应的候选纠错后文本集合,利用训练出的...

【专利技术属性】
技术研发人员:鲁进
申请(专利权)人:上海凯岸信息科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1