视频字幕处理方法、装置、电子设备和存储介质制造方法及图纸

技术编号：37392123 阅读：22 留言：0更新日期：2023-04-27 07:29

本发明专利技术公开了一种视频字幕处理方法、装置、电子设备和存储介质，其中方法包括：提取视频对应的音频内容，经识别得到字幕文本；将字幕文本进行语句切分，得到待处理的第一字幕语句以及各第一字幕语句的起止位置；将各第一字幕语句进行拆分，得到第二字幕语句以及其起止位置；根据第一字幕语句的起止位置提取对应的视频片段，将视频片段拆分为视频子片段，并确定各视频子片段的起止位置；根据各第二字幕语句的起止位置和各视频子片段的起止位置的对应关系，确定出待拆分的第二字幕语句；将待拆分的第二字幕语句拆分成至少两个第三字幕语句，并将各第三字幕语句分别显示。上述方案字幕处理方式让上下字幕条的分割更为可信，提升了用户观看体验。了用户观看体验。了用户观看体验。

全部详细技术资料下载

【技术实现步骤摘要】
视频字幕处理方法、装置、电子设备和存储介质

[0001]本专利技术涉及视频处理
，具体涉及一种视频字幕处理方法、装置、电子设备和存储介质。

技术介绍

[0002]现有智能字幕条拆分方案，主要是根据语音中出现的停顿进行断句。首先，提取视频中的音频信息，然后按照音频中识别到的语音间隔进行断句，如果停顿时长达到或超过预设的时长，就可据此进行断句，由此进行字幕的拆分。
[0003]上述技术中往往因为音频中连贯的语音过长而导致自动生成过长的字幕，此时通常会配合一些手段来限制语句的长度，例如固定单条字幕长度，限定其最大长度不超过预设的字数，但这样的限制过于机械，不能很好的与音视频内容以及语句的语义进行融合，且拆分不合理也会影响用户的观看体验。

技术实现思路

[0004]鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的视频字幕处理方法、装置、电子设备和存储介质。
[0005]根据本专利技术的一个方面，提供了一种视频字幕处理方法，所述方法包括：
[0006]提取...

【技术保护点】

【技术特征摘要】
1.一种视频字幕处理方法，所述方法包括：提取视频对应的音频内容，对所述音频内容进行识别得到字幕文本；将所述字幕文本进行语句切分，得到待处理的第一字幕语句以及各第一字幕语句的起止位置；将各第一字幕语句进行拆分，得到第二字幕语句以及各第二字幕语句的起止位置；根据第一字幕语句的起止位置提取对应的视频片段，将所述视频片段拆分为视频子片段，并确定各视频子片段的起止位置；根据各第二字幕语句的起止位置和各视频子片段的起止位置的对应关系，确定出待拆分的第二字幕语句；其中所述待拆分的第二字幕语句对应至少两个视频子片段；将所述待拆分的第二字幕语句拆分成至少两个第三字幕语句，并将各第三字幕语句随对应的所述视频子片段分别显示。2.根据权利要求1所述的方法，其特征在于，将所述字幕文本进行语句切分，得到待处理的第一字幕语句包括：将所述字幕文本进行语句切分，得到语句集合；从所述语句集合中筛选出字数大于第一阈值的第一字幕语句，作为所述待处理的第一字幕语句。3.根据权利要求1所述的方法，其特征在于，根据第一字幕语句的起止位置提取对应的视频片段，将所述视频片段拆分为视频子片段，并确定各视频子片段的起止位置包括：根据第一字幕语句的起止位置，提取出与所述第一字幕语句对应的视频片段；根据视频中的镜头、声音发出对象或画面场景中的任一种，将视频片段进行拆分，得到至少两个视频子片段；确定各个视频子片段的起止位置。4.根据权利要求1
‑
3中任一项所述的方法，其特征在于，将所述待拆分的第二字幕语句拆分成至少两个第三字幕语句包括：根据所述待拆分的第二字幕语句拆分成分词方式的不同，得到多个第三字幕语句集合；计算各第三字幕语句集合的可信度；根据可信度的大小选择一个第三字幕语句集合，作为所述待拆分的第二字幕语句的拆分结果。5.根据权利要求4所述的方法，其特征在于，将所述待拆分的第二字幕语句拆分成至少两个第三字幕语句进一步包括：将所述待拆分的第二字幕语句通过不同方式进行分割，得到多个分词集合，各所述分词集合分别与各所述第三字幕语句集合对应；选择待拆分的第二字幕语句所属领域的自然语言处理的数据集作为标准集，并以所述字幕文本为非标准集；利用非标准集确定各分词集合的第一条件概率集合，以及...

【专利技术属性】
技术研发人员：吴庆双，周效军，李琳，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人