视频与字幕的匹配方法和装置制造方法及图纸

技术编号：16236654 阅读：55 留言：0更新日期：2017-09-19 16:28

本发明专利技术公开了视频与字幕的匹配方法和装置，所述方法包括：获取待匹配的视频片段和待匹配的一个或多个字幕文件；从所获取的视频片段中提取出各个语音片段的关联语音时间信息以及从所述待匹配的一个或多个字幕文件中提取出字幕时间信息；分别基于相同的规则，根据所提取的关联语音时间信息以及字幕时间信息生成所述视频片段的视频特征向量以及所述一个或多个字幕文件的字幕特征向量；基于所生成的视频特征向量和字幕特征向量，确定与所述视频片段匹配的字幕文件。本发明专利技术的技术方案，通过字幕特征向量与视频特征向量确定与视频片段匹配的字幕文件，解决了因视频字幕匹配错误给用户造成的困扰，从根本上保证了视频片段与字幕文件匹配的正确性。

Method and device for matching video and caption

The invention discloses a method and device for matching video with subtitles, the method comprises: obtaining matching video clips and matching one or more subtitle file; from the acquired video clips extracted extracted subtitles time information associated with speech and time information of each speech segment as well as from the matching one or more of the subtitle file; based on the same rules respectively, according to the caption feature vectors associated with voice time information and video feature information generating subtitles time the video segment and the one or more subtitle file; video feature vector and subtitle feature vector based on the generated. Sure, the subtitle file and the video clip. The technical scheme of the invention, determine the subtitle file matching and video clips by subtitles feature vector and video feature vector, solves the error caused to the user, because the video caption problems, fundamentally to ensure the correctness of the video clips, and subtitle file.

全部详细技术资料下载

【技术实现步骤摘要】
视频与字幕的匹配方法和装置
本专利技术实施例涉及多媒体
，尤其涉及一种视频与字幕的匹配方法和装置。
技术介绍
随着互联网技术和多媒体技术的不断发展，富有表现力及观赏性的视频作为信息的载体之一，受到众多用户的青睐。为了更好地展示视频内容，在用户观看视频的时候，通常会同步显示与视频所对应的字幕，便于用户理解视频内容，提升用户观看视频的体验。现有技术的视频与字幕匹配采用的是文件名匹配的方法，即提取出目标视频的文件名，然后在字幕文件的集合中，将目标视频的文件名和各个字幕文件的文件名进行匹配，找到文件名最匹配的字幕文件，选取这个字幕文件作为视频的字幕文件来播放。但是如果字幕文件名命名不准确或者命名错误，将会直接影响字幕文件的选取，导致所选取的字幕文件的准确性十分的不稳定，而且字幕的文件名是十分容易被修改的，如果随意一个字幕文件被改成了视频相关的名字，就可能造成错误的匹配，为用户的视频观看造成困扰。
技术实现思路
本专利技术提供一种视频与字幕的匹配方法和装置，以解决视频与字幕易匹配错误的问题，实现视频与字幕的准确匹配。第一方面，本专利技术实施例提供了一种视频与字幕的匹配方法，该方法包括：获取待匹配的视频片段和待匹配的一个或多个字幕文件；从所获取的视频片段中提取出各个语音片段的关联语音时间信息以及从所述待匹配的一个或多个字幕文件中提取出字幕时间信息；分别基于相同的规则，根据所提取的关联语音时间信息以及字幕时间信息生成所述视频片段的视频特征向量以及所述一个或多个字幕文件的字幕特征向量；基于所生成的视频特征向量和字幕特征向量，确定与所述视频片段匹配的字幕文件。第二方面，本...
视频与字幕的匹配方法和装置

【技术保护点】
一种视频与字幕匹配方法，其特征在于，包括：获取待匹配的视频片段和待匹配的一个或多个字幕文件；从所获取的视频片段中提取出各个语音片段的关联语音时间信息以及从所述待匹配的一个或多个字幕文件中提取出字幕时间信息；分别基于相同的规则，根据所提取的关联语音时间信息以及字幕时间信息生成所述视频片段的视频特征向量以及所述一个或多个字幕文件的字幕特征向量；基于所生成的视频特征向量和字幕特征向量，确定与所述视频片段匹配的字幕文件。

【技术特征摘要】
1.一种视频与字幕匹配方法，其特征在于，包括：获取待匹配的视频片段和待匹配的一个或多个字幕文件；从所获取的视频片段中提取出各个语音片段的关联语音时间信息以及从所述待匹配的一个或多个字幕文件中提取出字幕时间信息；分别基于相同的规则，根据所提取的关联语音时间信息以及字幕时间信息生成所述视频片段的视频特征向量以及所述一个或多个字幕文件的字幕特征向量；基于所生成的视频特征向量和字幕特征向量，确定与所述视频片段匹配的字幕文件。2.根据权利要求1所述的方法，其特征在于，从所获取的视频片段中提取出各个语音片段的关联语音时间信息包括：从所获取的视频片段中提取出音频数据；对所提取出的音频数据进行频谱分析，将符合语音频谱特性的音频数据作为语音数据；基于所得到的语音数据，获取各个语音片段及对应的关联语音时间信息。3.根据权利要求1或2所述的方法，其特征在于，所述关联语音时间信息是各个相邻语音片段之间的时间间隔信息，所述字幕时间信息是各个相邻字幕片段之间的时间间隔信息，以及所述分别基于相同的规则，根据所提取的关联语音时间信息以及字幕时间信息生成所述视频片段的视频特征向量以及所述一个或多个字幕文件的字幕特征向量包括：分别基于相同的规则，根据各个相邻语音片段之间的时间间隔信息生成视频片段的视频特征向量，以及根据各个相邻字幕片段之间的时间间隔信息，生成所述一个或多个字幕文件的字幕特征向量。4.根据权利要求1或2所述的方法，其特征在于，所述关联语音时间信息是各个语音片段的时长信息，所述字幕时间信息是各个字幕片段的时长信息，以及所述分别基于相同的规则，根据所提取的关联语音时间信息以及字幕时间信息生成所述视频片段的视频特征向量以及所述一个或多个字幕文件的字幕特征向量包括：分别基于相同的规则，根据各个语音片段的时长信息生成视频片段的视频特征向量，以及根据各个字幕片段的时长信息生成所述一个或多个字幕文件的字幕特征向量。5.根据权利要求1-4任一所述的方法，其特征在于，基于所生成的视频特征向量和字幕特征向量，确定与所述视频片段匹配的字幕文件包括：计算所生成的视频特征向量和字幕特征向量之间的空间相似度；以及根据所计算出的空间相似度，确定...

【专利技术属性】
技术研发人员：刘青，谢涛，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人