【技术实现步骤摘要】
字幕制作方法及装置、计算机可读存储介质
[0001]本申请涉及自然语言处理
,特别是涉及一种字幕制作方法及装置、计算机可读存储介质。
技术介绍
[0002]现有的字幕制作系统大多是先通过对音频文件中的语音句进行音频转写得到文字,再结合后处理,对转写出的文字进行断句及语气词过滤等操作,获得转写文本,然后对转写文本进行字幕校正。音频转写的准确率很大程度上决定了字幕校正的工作量。
[0003]随着自然语言处理技术的发展,基于深度学习的端到端的语音转写技术被应用于字幕制作。但当前的语音转写系统缺陷也非常突出,比如在人名、地名、机构名等专有名词,以及特定领域的专业词汇上转写准确率仍与期望有较大的距离。这主要是因为训练数据对专有词汇以及领域术语覆盖度较差,导致模型对这些词汇的学习能力不足,导致转写准确率较低,从而增加了字幕校正过程的工作量,降低了字幕制作的效率。
技术实现思路
[0004]本申请主要解决的技术问题是提供一种字幕制作方法及装置、计算机可读存储介质,能够提高语音转写的准确率,并减少字幕校正的工作 ...
【技术保护点】
【技术特征摘要】
1.一种字幕制作方法,其特征在于,包括:获得音频文件对应的第一转写文本;对所述第一转写文本中对应当前时刻之前的部分进行文本校正,以获得第一校正文本;利用所述第一校正文本获得历史校正信息;利用所述历史校正信息更新所述第一转写文本中对应所述当前时刻之后的部分,以获得字幕校正文本。2.根据权利要求1所述的字幕制作方法,其特征在于,所述利用所述第一校正文本获得历史校正信息的步骤,包括:对所述第一校正文本进行预处理以获得第一分词文本、以及对所述第一转写文本中对应所述第一校正文本的部分进行预处理以获得第二分词文本;所述第一分词文本包括多个分立的第一词语,所述第二分词文本包括多个分立的第二词语;将所述第一分词文本和所述第二分词文本对齐,以使其中对应的所述第一词语和所述第二词语对齐形成词对;遍历所有所述词对,响应于当前词对中的所述第一词语和所述第二词语不相同,响应于所述当前词对满足预设条件,根据所述当前词对生成三元组;所述三元组包括一个词对及其出现的次数;利用所有所述三元组组成的三元组列表获得所述历史校正信息。3.根据权利要求2所述的字幕制作方法,其特征在于,所述第一校正文本包括至少一个校正候选句,所述响应于所述当前词对满足预设条件的步骤,包括:响应于所述当前词对中的所述第一词语为多字词;或者,响应于所述当前词对中的所述第一词语位于对应的所述校正候选句的句首,且其后的第一个词语非预设停用词;或者,响应于所述当前词对中的所述第一词语位于对应的所述校正候选句的句尾,且其前的第一个词语非预设停用词;或者,响应于所述当前词对中的所述第一词语位于对应的所述校正候选句的句中,判定所述当前词对满足所述预设条件。4.根据权利要求3所述的字幕制作方法,其特征在于,所述根据所述当前词对生成三元组的步骤,包括:响应于所述当前对中的所述第一词语是多字词,将所述当前词对和对应的累计出现次数组成所述三元组;响应于所述当前对中的所述第一词语不是多字词,根据所述第一词语和其相邻词语获得当前扩展词对,并将所述当前扩展词对和对应累的计出现次数组成所述三元组。5.根据权利要求2所述的字幕制作方法,其特征在于,所述第一分词文本还包括与所述第一词语一一对应的第一词性标签,所述第二分词文本还包括与所述第二词语一一对应的第二词性标签,所述利用所有所述三元组组成的三元组列表获得所述历史校正信息的步骤,包括:从所述三元组列表中筛选出所述第一词性标签或者所述第二词性标签属于预设词性列表的所述三元组;
将筛选出的所述三元组中的所述第一词语作为热词,并将所有所述热词组成的热词列表作为所述历史校正信息。6.根据权利要求5所述的字幕制作方法,其特征在于,所述第一转写文本包括多个第一候选句组,所述获得音频文件对应的第一转写文本的步骤之前,还包括:获得第二转写文本;所述第二转写文本包括多个第二候选句组,一个所述第一候选句组、一个所述第二候选句组和一个所述音频文件中的语音句对应,且所述第一转写文本是对所述第二转写文本中每个所述第二候选句组中的多个第二候选句重排序获得的;所述利用所述历史校正信息更新所述第一转写文本中对应所述当前时刻之后的部分,以获得字幕校正文本的步骤,包括:利用所述热词列表和所述第二转写文本中对应所述当前时刻之后的第二候选句组创建新候选句,并将所述新候选句加入对应的所述第二候选句组中,以获得第三候选句组;对所述第三候选句组包括的第三候选句重排序,以获得第二校正文本;所述第三候选句与对应的所述第二候选句或者所述新候选句相同;将所述第一转写文本中对应所述当前时刻之后的第一候选句组替换为所述第二校正文本,以获得所述字幕校正文本。7.根据权利要求6所述的字幕制作方法,其特征在于,所述利用所述热词列表和所述第二转写文本中对应所述当前时刻之后的第二候选句组创建新候选句的步骤,包括:利用所述热词列表构建至少一个第一映射网络,并利用所述第二转写文本中对应所述当前时刻之后的第二候选句组构建至少一个第二映射网络;其中,所述第一映射网络与所述热词的类别一一对应,所述第一映射网络包括至少一条第一映射路径,所述第一映射路径表征所述热词及其第一拼音序列的映射关系,且所述第一映射路径的输入为所述第一拼音序列,输出为所述热词;所述第二映射网络与所述第二候选句一一对应,所述第二映射网络包括多条第二映射路径,所述第二映射路径表征所述第二候选句及其第二...
【专利技术属性】
技术研发人员:朱菊霞,万根顺,高建清,刘聪,王智国,胡国平,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。