文本检测方法及装置、电子设备、可读介质制造方法及图纸

技术编号:42780003 阅读:19 留言:0更新日期:2024-09-21 00:41
本公开提供了一种文本检测方法及装置、电子设备、可读介质,属于自然语言处理技术领域,该方法包括:获取语音转写结果,语音转写结果包含待检测文本以及待检测文本的识别概率;对待检测文本进行特征提取,获得待检测文本的文本特征;根据待检测文本的识别概率进行分数特征提取,获得待检测文本的分数特征;基于文本特征和分数特征确定语音转写结果的检测分数,检测分数用于表征语音转写结果的准确性。该文本检测方法可以提高检测语音转写结果的准确性。

【技术实现步骤摘要】

本公开涉及自然语言处理,特别涉及一种文本检测方法及装置、电子设备、可读介质


技术介绍

1、自动语音识别(automatic speech recognition,asr)是一种将语音转写成文本的技术。在通过asr模型对语音进行转写时,往往会出现语音转写错误。为提高asr模型的转写质量,需要对语音转写结果进行检测,并基于检测后的语音转写结果对asr模型进行优化调整。然而,目前的检测方式对语音转写结果的检测准确率较低。


技术实现思路

1、本公开提供一种文本检测方法及装置、电子设备、可读介质,可以提高语音转写结果检测的准确率。

2、第一方面,本公开提供了一种文本检测方法,包括:

3、获取语音转写结果,所述语音转写结果包含待检测文本以及所述待检测文本的识别概率;

4、对所述待检测文本进行特征提取,获得所述待检测文本的文本特征;

5、根据所述待检测文本的识别概率进行分数特征提取,获得所述待检测文本的分数特征;

6、基于所述文本特征和所述分数特征确定所述语音转本文档来自技高网...

【技术保护点】

1.一种文本检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述待检测文本进行特征提取是检测模型的文本特征提取层执行的;所述文本特征包括词向量特征、位置特征以及分割向量特征中至少一个;所述文本特征提取层包括词向量特征提取层、位置特征提取层和分割向量特征提取层至少之一;

3.根据权利要求1所述的方法,其特征在于,所述基于所述文本特征和所述分数特征确定所述语音转写结果的检测分数,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述特征编码进行解码处理,获得所述语音转写结果的检测分数,包括:

<p>5.根据权利要求...

【技术特征摘要】

1.一种文本检测方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述待检测文本进行特征提取是检测模型的文本特征提取层执行的;所述文本特征包括词向量特征、位置特征以及分割向量特征中至少一个;所述文本特征提取层包括词向量特征提取层、位置特征提取层和分割向量特征提取层至少之一;

3.根据权利要求1所述的方法,其特征在于,所述基于所述文本特征和所述分数特征确定所述语音转写结果的检测分数,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述特征编码进行解码处理,获得所述语音转写结果的检测分数,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述待检测文本的识别概率进行分数特征提取,包括:...

【专利技术属性】
技术研发人员:杨森
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1