【技术实现步骤摘要】
一种动态反向解码的方法、装置及可读存储介质
本专利技术涉及自然语言处理
,具体地涉及一种动态反向解码的方法、装置及可读存储介质。
技术介绍
目前,大部分数据都会被转化为文本供用户使用或储存,相关解码技术应运而生。在很多场景下,用户希望得到实时的文字转写,这就是所谓的低延时应用场景。为了在低延时场景中提高解码的精度,随着解码进行而不断修正结果的技术被相继提出,即延迟更新技术。目前比较成熟的延迟更新技术主要有三种,第一种方法是随着解码的进行,不断保留原有的候选结果及其每个解码单元的评分,一直显示输出评分总和最佳的结果。第二种方法是等待整个解码结束后,根据整个生成结果,利用反向语言模型,对所有的候选结果重新评价,输出最佳结果。第三种方法是随着解码的进行,只保留最佳结果的路径,然后利用反向模型对这些路径进行重新评价,输出最佳结果。第一种方法解码的精度不高,第二种方法耗时较长,有悖于低延迟的应用场景,第三种方法删除信息过多,对精度改善有限制。
技术实现思路
本专利技术提供了一种动态反向解码的方法、装置、及可读存储介质,以实现在低延时条件下完成实时解码的工作。本专利技术实施例第一方面提供了一种动态反向解码的方法,所述方法包括:读入n元正向语言模型和m元反向语言模型;读入待处理数据;在H个预设时间段中的第1个预设时段内,通过所述n元正向语言模型对所述待处理数据进行处理,得到候选结果;在所述第1个预设时间段结束时,遍历在该预设时间段内得到的候选结果,从中确定权重评分较大的多个候选结果,并添加到词网格的首部;依次取h为从2至H的整数,执行以下步骤:在所述H个预设时间段中的 ...
【技术保护点】
1.一种动态反向解码的方法,其特征在于,所述方法包括:读入n元正向语言模型和m元反向语言模型;读入待处理数据;在H个预设时间段中的第1个预设时段内,通过所述n元正向语言模型对所述待处理数据进行处理,得到候选结果;在所述第1个预设时间段结束时,遍历在该预设时间段内得到的候选结果,从中确定权重评分较大的多个候选结果,并添加到词网格的首部;依次取h为从2至H的整数,执行以下步骤:在所述H个预设时间段中的第h个预设时间段内,通过所述n元正向语言模型继续对所述待处理数据进行处理,得到候选结果;在所述第h个所述预设时间段结束时,遍历在该预设时间段内得到的候选结果,从中确定权重评分较大的多个候选结果,并添加到词网格首部;通过所述m元反向语言模型对在第h‑1个预设时间段结束时添加到词网格的首部的多个候选结果的权重评分进行更新,得到更新后的结果;遍历所述更新后的结果所对应的路径和所述权重评分较大的多个候选结果所对应的路径,并从中确定最佳路径;根据所述最佳路径输出解码结果,其中,n、m、h、H分别为大于等于1的整数。
【技术特征摘要】
1.一种动态反向解码的方法,其特征在于,所述方法包括:读入n元正向语言模型和m元反向语言模型;读入待处理数据;在H个预设时间段中的第1个预设时段内,通过所述n元正向语言模型对所述待处理数据进行处理,得到候选结果;在所述第1个预设时间段结束时,遍历在该预设时间段内得到的候选结果,从中确定权重评分较大的多个候选结果,并添加到词网格的首部;依次取h为从2至H的整数,执行以下步骤:在所述H个预设时间段中的第h个预设时间段内,通过所述n元正向语言模型继续对所述待处理数据进行处理,得到候选结果;在所述第h个所述预设时间段结束时,遍历在该预设时间段内得到的候选结果,从中确定权重评分较大的多个候选结果,并添加到词网格首部;通过所述m元反向语言模型对在第h-1个预设时间段结束时添加到词网格的首部的多个候选结果的权重评分进行更新,得到更新后的结果;遍历所述更新后的结果所对应的路径和所述权重评分较大的多个候选结果所对应的路径,并从中确定最佳路径;根据所述最佳路径输出解码结果,其中,n、m、h、H分别为大于等于1的整数。2.根据权利要求1所述的方法,其特征在于,在H个预设时间段中的第1个预设时间段内,通过所述n元正向语言模型对所述待处理数据进行处理,得到候选结果,包括:将所述H个预设时间段设置为符合低延时条件的多个长度相等的时间段,所述预设时间段以帧为时间单位;在所述多个长度相等的时间段中的第1个时间段内,通过所述n元正向语言模型接收所述待处理数据,根据该待处理数据的前文信息计算解码每个词汇的概率,并将概率不为零的词汇确定为所述候选结果。3.如权利要求1所述的方法,其特征在于,在所述第1个预设时间段结束时,遍历在该预设时间段内得到的候选结果,从中确定权重评分较大的多个候选结果,并添加到词网格的首部,包括:设置权重评分阈值;在所述第1个预设时间段结束时,遍历所述候选结果,将权重评分大于所述权重评分阈值的候选结果确定为有效候选结果;将所述有效候选结果添加到词网格的首部。4.如权利要求1所述的方法,其特征在于,通过所述m元反向语言模型对在第h-1个预设时间段结束时添加到词网格的首部的多个候选结果的权重评分进行更新,得到更新后的结果,包括:通过所述m元反向语言模型计算在第h-1个时间段结束时添加到词网格的首部的多个候选结果的概率值;通过所述m元反向语言模型利用所述概率值计算所述多个候选结果的权重分数。5.如权利要求1所述的方法,其特征在于,遍历所述更新后的结果所对应的路径和所述权重评分较大的多个候选结果所对应的路径,并从中确定最佳路径,包括:遍历所述更新后的结果所对应的路径的第一权重评分和所述多个候选结果所对应的路径的第二权重评分;对比所述第一权重评分和所述第二权重评分,得到最大权重评分;将所述最大权重评分对应的路径确定为最佳路径。6.如权利要求1所述的方法,其特征在于,在根据所述最佳路径输出解码结果的同时,所述方法还包括:检测所述词网格的长度,并判断该词网格的长度是否大于n;将长度大于n的所述词网格从尾部裁剪一单元长度;在下一次生成解码结...
【专利技术属性】
技术研发人员:吴帅,李健,张连毅,武卫东,
申请(专利权)人:北京捷通华声科技股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。