一种针对新闻场景的标题字幕提取方法技术

技术编号：31499087 阅读：28 留言：0更新日期：2021-12-18 12:46

本发明专利技术公开了一种针对新闻场景的标题字幕提取方法，包括步骤：S1，提取待处理新闻视频中的文本并进行位置编码和内容编码；S2，基于所述位置编码和内容编码对文本进行预处理；S3，构建一致性约束并从预处理后的文本中选出部分文本作为标题字幕的候选文本；S4，对所述标题字幕的候选文本进行视觉特征和语义特征提取并将两者融合，得到文本融合特征；S5，基于所述文本融合特征，使用聚类算法对标题字幕的候选文本进行聚类，从而得到标题字幕集合；S6，对所述标题字幕集合进行后处理；本发明专利技术可用于不同的新闻栏目，可有效地提升新闻视频的编辑效率，减少人工成本。减少人工成本。减少人工成本。

全部详细技术资料下载

【技术实现步骤摘要】
一种针对新闻场景的标题字幕提取方法

[0001]本专利技术涉及电视新闻制作领域，涉及图像处理和分析，更为具体的，涉及一种针对新闻场景的标题字幕提取方法。

技术介绍

[0002]随着网络技术的发展，数字视频的普及，融媒体的兴起，视频数据的处理和分析技术变得越来越重要。
[0003]在新闻视频中，每个新闻事件展开前会有相应的标题字幕的展示，该标题字幕对整个新闻事件进行了概括，通过标题人们可以大致了解事件的内容。同时，标题字幕的内容通常非常生动形象，从而提升观众对新闻事件的兴趣。因此对新闻视频中的标题字幕进行提取，可形成对新闻视频的概括。
[0004]在电视新闻制作中，有时希望对一档新闻进行拆条，即从整档新闻视频中将每个独立的新闻事件拆分出来。在这个过程中，标题字幕可以提供很强的先验信息，通过标题字幕进行初步的切分后可显著地减少所需的工作量。
[0005]由于电视新闻制作过程中有大量的素材，若通过人工的方式对标题字幕进行提取需要很高的人力成本。因此，提供一种针对电视新闻制作过程中的标题字幕提取方法，可以大大

【技术保护点】

【技术特征摘要】
1.一种针对新闻场景的标题字幕提取方法，其特征在于，包括步骤：S1，提取待处理新闻视频中的文本并进行位置编码和内容编码；S2，基于所述位置编码和内容编码对文本进行预处理；S3，构建一致性约束并从预处理后的文本中选出部分文本作为标题字幕的候选文本；S4，对所述标题字幕的候选文本进行视觉特征和语义特征提取并将两者融合，得到文本融合特征；S5，基于所述文本融合特征，使用聚类算法对标题字幕的候选文本进行聚类，从而得到标题字幕集合；S6，对所述标题字幕集合进行后处理。2.根据权利要求1所述的针对新闻场景的标题字幕提取方法，其特征在于，步骤S1中，所述位置编码包括子步骤：使用文本检测算法对视频进行处理，检测各帧画面中的文本内容的文本位置，检测到的文本位置作为对应画面的文本位置编码：所述内容编码包括子步骤：使用文本识别算法对各帧画面中的文本位置的图像进行识别，识别出的文本内容作为文本内容编码。3.根据权利要求1所述的针对新闻场景的标题字幕提取方法，其特征在于，步骤S2中，所述预处理包括基于位置编码将相邻文本重新合成一条文本；和/或，所述预处理包括设定阈值去掉同帧中字号较标题字幕小的文本。4.根据权利要求1所述的针对新闻场景的标题字幕提取方法，其特征在于，步骤S3中包括子步骤：基于标题字幕出现在视频中时位置固定、内容固定、持续时间较长的特性构建一致性约束，通过构建的一致性约束过滤掉非标题字幕的文本，过滤掉非标题字幕文本后得到剩余的文本作为标题字幕的候选文本。5.根据权利要求1所...

【专利技术属性】
技术研发人员：陆维琛，李志强，杨瀚，
申请(专利权)人：成都索贝数码科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人