文本时间轴信息生成方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:36556029 阅读:24 留言:0更新日期:2023-02-04 17:10
本申请公开了一种文本时间轴信息生成方法、装置、存储介质及计算机设备。该方法包括:将语音转文本处理的识别文本和待生成时间轴的原始文本进行文本对齐处理,以得到识别对齐文本和原始对齐文本,该识别对齐文本和原始对齐文本中的文本内容的长度一致,且每个字一一对应,根据语音转文本处理的字词时间边界数据,确定识别对齐文本中的每个字的起始时间和终止时间之后,根据每个字的起始时间和终止时间、以及原始对齐文本,确定原始文本中目标文本单位所对应的第一文本内容的起始时间和终止时间,以得到原始文本所对应的时间轴信息,本申请提高了文本时间轴信息生成效率,即使原始文本和音视频文件的识别文本相差较大,也能附加时间轴信息。附加时间轴信息。附加时间轴信息。

【技术实现步骤摘要】
文本时间轴信息生成方法、装置、存储介质及计算机设备


[0001]本申请涉及音视频
,具体涉及一种文本时间轴信息生成方法、装置、计算机可读存储介质及计算机设备。

技术介绍

[0002]随着视频及多媒体技术的不断发展,字幕制作在音视频制作领域越来越得以普及,为了提高音视频制作过程中字幕制作环节的效率,通常利用语音识别和机器翻译等智能技术来辅助字幕制作。
[0003]在音视频字幕制作过程中,存在一种提前标注好文本,但缺少字幕时间轴的场景,为满足用户给文本添加时间轴的需求,且降低用户手动编辑时间轴的工作量,提高字幕制作效率,通常将音频文件所对应带有时间码信息的文本数据与标准文稿进行比对/匹配,根据比对的结果再进行增加、删除、替换等操作,再选择操作步骤最少的方案将时间码信息附加给标准文稿,得到带有时间码信息的字幕文件。
[0004]这种方案需要对用户上传的标准文稿的文稿质量要求较高,例如在纯替换场景下,当标准文稿和音频文件的文本数据存在较大差异时,可能会导致进行替换等操作后仍然无法匹配,从而无法正常附加时间码信息
专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本时间轴信息生成方法,其特征在于,包括:获取待处理的音视频文件和待生成时间轴信息的原始文本,所述音视频文件和所述原始文本相对应;对所述音视频文件进行语音转文本处理,以得到所述音视频文件的识别文本和字词时间边界数据;对所述识别文本和所述原始文本进行文本对齐处理,以得到识别对齐文本和原始对齐文本,所述识别对齐文本和所述原始对齐文本中的文本内容的长度一致,且所述识别对齐文本和所述原始对齐文本中的每个字一一对应;根据所述字词时间边界数据,确定所述识别对齐文本中每个字的起始时间和终止时间;根据每个字的起始时间和终止时间、以及所述原始对齐文本,确定所述原始文本中目标文本单位所对应的第一文本内容的起始时间和终止时间,以得到所述原始文本所对应的时间轴信息。2.根据权利要求1所述的方法,其特征在于,所述对所述识别文本和所述原始文本进行文本对齐处理,以得到识别对齐文本和原始对齐文本,包括:将所述识别文本和所述原始文本的文本内容按照文本编辑距离进行匹配对齐处理;将匹配对齐处理后的所述识别文本和所述原始文本的文本内容按照文本下标进行逐字对齐处理,以得到识别对齐文本和原始对齐文本。3.根据权利要求2所述的方法,其特征在于,所述对所述识别文本和所述原始文本的文本内容按照文本编辑距离进行匹配对齐处理,以得到匹配对齐处理后的所述识别文本和所述原始文本,包括:将所述识别文本和所述原始文本中预设文本单位所对应的文本内容进行匹配;在匹配后的所述识别文本和所述原始文本中的存在遗漏预设字符的位置上执行插入操作,所述插入操作用于插入第一预设符号;确定匹配后的所述识别文本和所述原始文本中预设文本单位所对应的文本内容之间的文本编辑距离,其中,确定所述文本编辑距离时所涉及的编辑操作包括插入操作;根据文本编辑距离在所述识别文本或所述原始文本中预设文本单位所对应的文本内容中执行所述插入操作,以得到匹配对齐处理后的所述识别文本和所述原始文本,其中,所述插入操作用于插入文本编辑距离所对应数量的第四预设符号。4.根据权利要求1所述的方法,其特征在于,所述根据每个字的起始时间和终止时间、以及所述原始对齐文本,确定所述原始文本中目标文本单位所对应的第一文本内容的起始时间和终止时间,以得到所述原始文本所对应的时间轴信息,包括:根据所述识别对齐文本、每个字的起始时间和终止时间,确定所述原始对齐文本中目标文本单位所对应的第二文本内容的起始时间和终止时间;根据所述第二文本内容的起始时间和终止时间,确定所述原始文本中目标文本单位所对应的第一文本内容的起始时间和终止时间,以得到所述原始文本所对应的时间轴信息。5.根据权利要求4所述的方法,其特征在于,所述根据所述识别对齐文本、每个字的起始时间和终止时间,确定所述原始对齐文本中目标文本单位所对应的第二文本内容的起始时间和终止时间,包括:
在所述识别对齐文本中,确定与所述原始对齐文本中目标文本单位所对应的第二文本内容对齐的第三文本内容;根据每个字的起始时间和终止时间,确定所述第三文本内容的起始时间和终止时间;将所述第三文本内容的起始时间和终止时间,作为所述原始对齐文本中目标文本单位所对应的第二文本内容的起始时间和终止时间。6.根据权利要求1所述的方法,其特征在于,所述根据每个字的起始时间和终止时间、以及所述原始对齐文本,确定所述原始文本中目标文本单位所对应的第一文本内容的起始时间和终止时间,以得到所述原始文本所对应的时间轴信息,包括:根据每个字的起始时间和终止时间、以及所述原...

【专利技术属性】
技术研发人员:丁艳燕袁华东王玮王兆育国丽
申请(专利权)人:安徽听见科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1