【技术实现步骤摘要】
一种催收场景下语音识别结果的纠错方法
本专利技术涉及语音识别
,具体为一种催收场景下语音识别结果的纠错方法。
技术介绍
随着深度学习的普及,在计算机视觉、语音识别、自然语言处理等方面均取得重大突破。以语音识别为例,目前语音识别准确率已达到97%,使得语音识别的应用领域越来越广。在金融催收领域,催收员跟客户会进行大量的电话沟通。其中需要对通话音频进行语音识别(ASR)转为相应的通话文本,一方面对通话文本进行质检分析,以确保合规;另一方面,对通话文本进行文本分析及挖掘,为后续提升催收效果奠定坚实基础。在实际语音交互过程中,由于用户普通话不标准、噪音、专业领域词汇缺失等各因素影响,语音识别错误率较高。而现有技术都集中在提升语音识别准确率上,却缺乏对识别结果的纠错手段。以上,极大影响语音识别产品的大规模产品化应用。
技术实现思路
本专利技术的目的在于提供一种催收场景下语音识别结果的纠错方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种催收场景下语音识别结果的纠错方法,包括如下步骤:步骤1,催收领域专有词典库生成:统计催收领域催收员与客户通话语料,并进行一定的人工标注整理并进行脱敏,该语料作为训练语料,根据整理后的语料文本进行处理并由专门业务人员进行整理形成催收领域专有词典库;步骤2,训练催收领域的催收员与客户通话之间语料的HMM模型:利用催收领域催收员与客户通话语料,并进行一定的人工标注整理后,作为训练样本,计算出初始发射概率、转移 ...
【技术保护点】
1.一种催收场景下语音识别结果的纠错方法,其特征在于包括如下步骤:/n步骤1,催收领域专有词典库生成:统计催收领域催收员与客户通话语料,并进行一定的人工标注整理并进行脱敏,该语料作为训练语料,根据整理后的语料文本进行处理并由专门业务人员进行整理形成催收领域专有词典库;/n步骤2,训练催收领域的催收员与客户通话之间语料的HMM模型:利用催收领域催收员与客户通话语料,并进行一定的人工标注整理后,作为训练样本,计算出初始发射概率、转移概率、发射概率;/n步骤3,待纠错文本生成:对语音识别文本进行分词,检查各词是否在用户词典库中来判断是否加入待纠错文本;/n步骤4,纠错后文本集生成方法:首先,将候选待纠错文本转为拼音,其次,利用编辑距离算法计算候选待纠错文本与催收领域专有词典库中各词拼音之间的编辑距离来判断是否保留原候选待纠错文本;/n步骤5,纠错后文本筛选方法:首先将确定的候选待纠错文本替换为对应的候选纠错后文本集合,利用训练出的HMM模型,结合解码算法进行解码工作,计算出最终候选纠错后文本。/n
【技术特征摘要】
1.一种催收场景下语音识别结果的纠错方法,其特征在于包括如下步骤:
步骤1,催收领域专有词典库生成:统计催收领域催收员与客户通话语料,并进行一定的人工标注整理并进行脱敏,该语料作为训练语料,根据整理后的语料文本进行处理并由专门业务人员进行整理形成催收领域专有词典库;
步骤2,训练催收领域的催收员与客户通话之间语料的HMM模型:利用催收领域催收员与客户通话语料,并进行一定的人工标注整理后,作为训练样本,计算出初始发射概率、转移概率、发射概率;
步骤3,待纠错文本生成:对语音识别文本进行分词,检查各词是否在用户词典库中来判断是否加入待纠错文本;
步骤4,纠错后文本集生成方法:首先,将候选待纠错文本转为拼音,其次,利用编辑距离算法计算候选待纠错文本与催收领域专有词典库中各词拼音之间的编辑距离来判断是否保留原候选待纠错文本;
步骤5,纠错后文本筛选方法:首先将确定的候选待纠错文本替换为对应的候选纠错后文本集合,利用训练出的...
【专利技术属性】
技术研发人员:鲁进,
申请(专利权)人:上海凯岸信息科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。