【技术实现步骤摘要】
本申请涉及机器学习,尤其涉及一种模型识别结果的置信度估计方法、装置、设备及介质。
技术介绍
1、置信度值是识别模型(例如,自动语音识别(automatic speech recognition,asr))系统的重要部分,显示了系统对识别结果的信心程度,在许多与识别相关的上下游任务中发挥着关键作用,例如半监督训练、口语评估和反馈等。
2、在传统识别模型中,词后验概率是一种获得可靠置信度值的流行方法。然而,针对现有的端到端识别模型,特别是以transformer或conformer为代表的自注意力模型中,由于自回归解码器依赖于完整的解码历史,因此难以生成与解码图相类似的、能够代表大量识别假设的紧凑形式。这一特性导致在识别空间中计算词后验概率的成本极为高昂,不具有实际可行性。鉴于此,一种替代性的方法是利用解码器的输出,即softmax概率值,来作为置信度值的参考。然而,由于端到端模型普遍对softmax概率值表现出过高的自信度,因此将其作为置信度值来使用,其质量往往难以保证,效果不佳。
技术实现思路
1本文档来自技高网...
【技术保护点】
1.一种模型识别结果的置信度估计方法,其特征在于,所述方法包括:
2.根据权利要求1所述的模型识别结果的置信度估计方法,其特征在于,在所述将所述待识别数据输入至预设的正向识别模型之前,所述方法还包括:
3.根据权利要求1所述的模型识别结果的置信度估计方法,其特征在于,所述方法还包括:
4.根据权利要求3所述的模型识别结果的置信度估计方法,其特征在于,所述通过所述正向识别模型对所述训练数据进行识别后获取正向训练序列包括:
5.根据权利要求3所述的模型识别结果的置信度估计方法,其特征在于,所述通过所述反向识别模型输出所述正向
...【技术特征摘要】
1.一种模型识别结果的置信度估计方法,其特征在于,所述方法包括:
2.根据权利要求1所述的模型识别结果的置信度估计方法,其特征在于,在所述将所述待识别数据输入至预设的正向识别模型之前,所述方法还包括:
3.根据权利要求1所述的模型识别结果的置信度估计方法,其特征在于,所述方法还包括:
4.根据权利要求3所述的模型识别结果的置信度估计方法,其特征在于,所述通过所述正向识别模型对所述训练数据进行识别后获取正向训练序列包括:
5.根据权利要求3所述的模型识别结果的置信度估计方法,其特征在于,所述通过所述反向识别模型输出所述正向训练序列对应的反向训练序列,包括:
6.根据权利要求3所...
【专利技术属性】
技术研发人员:刘轶,王轩,黄石磊,程刚,蒋琳,
申请(专利权)人:深圳市北科瑞声科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。