一种基于fasttest模型的识别纠错及训练方法技术

技术编号:24689970 阅读:67 留言:0更新日期:2020-06-27 09:50
本发明专利技术公开了一种基于fasttest模型的识别纠错方法,包括:获取待识别的语音对话流;将待识别的语音对话流输入声纹识别模型中进行二聚类获得第一聚类音频和第二聚类音频;将第一聚类音频输入ASR模型中进行语音识别获得第一聚类音频的第一语音识别结果,将第二聚类音频输入ASR模型中进行语音识别获得第二聚类音频的第二语音识别结果;将第一语音识别结果输入fasttest模型进行二分类判断,获得第一语音识别结果的第一最终标签,将第二语音识别结果输入fasttest模型进行二分类判断,获得第二语音识别结果的第二最终标签。

A recognition, error correction and training method based on fasttest model

【技术实现步骤摘要】
一种基于fasttest模型的识别纠错及训练方法
本专利技术涉及语音分类领域,尤其涉及一种基于fasttest模型的识别纠错及训练方法。
技术介绍
目前,在语音质检的场景中,大部分的厂商均不支持双声道来存储,而单声道存储涉及到声纹分离的工作。如果仅仅通过听录音进行质检,不仅费时费力,而且会遗漏掉badcase,不及时处理这类问题,很容易对公司未来的收益造成隐患。而声纹识别将一段录音拆分成qa(question,问题;answer,答案)的方式,并通过ASR语音识别转化为文字的形式,大幅度降低单通电话的质检时间,不仅提高了效率并且大大增加了badcase的召回率。此外,由于目前大部分的厂商的客服都不是固定的,人员流动大,基于声纹库进行识别分类,不仅维护困难,而且成本较大。而基于聚类方法进行无监督识别,又容易受到噪声、人的情绪干扰,使得准确率低下,难以符合预期达到商用的效果。
技术实现思路
本专利技术要解决的技术问题,在于提供一种基于fasttest模型的识别纠错及训练方法,对声纹识别的二聚类结果通过fasttest模型本文档来自技高网...

【技术保护点】
1.一种基于fasttest模型的识别纠错方法,其特征是,所述方法包括:/n获取待识别的语音对话流;将所述待识别的语音对话流输入声纹识别模型中进行二聚类获得第一聚类音频和第二聚类音频,其中,所述第一聚类音频为带有第一初始标签的音频集合,所述第二聚类音频为带有第二初始标签的音频集合;将所述第一聚类音频输入ASR模型中进行语音识别获得所述第一聚类音频的第一语音识别结果,将所述第二聚类音频输入ASR模型中进行语音识别获得所述第二聚类音频的第二语音识别结果,其中,所述第一语音识别结果为第一聚类音频的文本集合,所述第二语音识别结果为第二聚类音频的文本集合;将所述第一语音识别结果输入fasttest模型进...

【技术特征摘要】
1.一种基于fasttest模型的识别纠错方法,其特征是,所述方法包括:
获取待识别的语音对话流;将所述待识别的语音对话流输入声纹识别模型中进行二聚类获得第一聚类音频和第二聚类音频,其中,所述第一聚类音频为带有第一初始标签的音频集合,所述第二聚类音频为带有第二初始标签的音频集合;将所述第一聚类音频输入ASR模型中进行语音识别获得所述第一聚类音频的第一语音识别结果,将所述第二聚类音频输入ASR模型中进行语音识别获得所述第二聚类音频的第二语音识别结果,其中,所述第一语音识别结果为第一聚类音频的文本集合,所述第二语音识别结果为第二聚类音频的文本集合;将所述第一语音识别结果输入fasttest模型进行二分类判断,获得所述第一语音识别结果的第一最终标签,将所述第二语音识别结果输入fasttest模型进行二分类判断,获得所述第二语音识别结果的第二最终标签。


2.根据权利要求1所述的一种基于fasttest模型的识别纠错方法,其特征是,
所述方法还包括:
将所述第一语音识别结果中的每一个文本分别输入fasttest模型进行二分类获得所述第一语音识别结果中每一个文本的标签,将每一个文本的标签与第一最终标签进行比对,其中某个文本的标签与第一最终标签不一致时,通过人工设定的阈值判...

【专利技术属性】
技术研发人员:王磊
申请(专利权)人:浙江百应科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1