多媒体文件的片头和/或片尾的识别方法及装置制造方法及图纸

技术编号：10300564 阅读：322 留言：0更新日期：2014-08-07 06:17

本发明专利技术提供一种多媒体文件的片头和/或片尾的识别方法及装置。本发明专利技术实施例通过利用对象跟踪技术，对所确定的多媒体文件所包括的至少两帧图像进行识别处理，以获得目标文件片段，以及根据所确定的多媒体文件的字幕内容和字幕时间，获得目标字幕片段，使得能够根据所述目标文件片段和所述目标字幕片段，确定所述多媒体文件的片头和/或片尾，无需操作人员参与操作过程，操作简单，且正确率高，从而提高了片头和/或片尾识别的效率和可靠性。

全部详细技术资料下载

【技术实现步骤摘要】
多媒体文件的片头和/或片尾的识别方法及装置
本专利技术涉及多媒体技术，尤其涉及一种多媒体文件的片头和/或片尾的识别方法及装置。
技术介绍
多媒体文件例如，视频文件一般可以包括片头和/或片尾，对片头和/或片尾进行有效的识别，能够为多媒体文件的处理带来更多益处。例如，播放多媒体文件时，可以跳过片头和/或片尾等。现有技术中，操作人员可以逐一对多媒体文件进行人工识别，以识别该多媒体文件的片头和/或片尾。然而，现有的片头和/或片尾的识别操作复杂，且容易出错，从而导致了片头和/或片尾识别的效率和可靠性的降低。
技术实现思路
本专利技术的多个方面提供一种多媒体文件的片头和/或片尾的识别方法及装置，用以提高片头和/或片尾识别的效率和可靠性。本专利技术的一方面，提供一种多媒体文件的片头和/或片尾的识别方法，包括：获取待处理的多媒体文件，所述多媒体文件包括至少两帧图像；利用对象跟踪技术，对所述至少两帧图像进行识别处理，以获得目标文件片段；根据所述多媒体文件的字幕内容和字幕时间，获得目标字幕片段；根据所述目标文件片段和所述目标字幕片段，确定所述多媒体文件的片头和/或片尾。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述利用对象跟踪技术，对所述至少两帧图像进行识别处理，以获得目标文件片段，包括：利用对象跟踪技术，提取所述至少两帧图像中出现目标对象的图像，以获得至少两个候选文件片段；根据所述至少两个候选文件片段中相邻的候选文件片段之间的第一时间间隔和预先设置的第一时间阈值，对相邻的候选文件片段进行合并处理，以获得所述目标文件片段。如上所述的方面和任一可能的实...
多媒体文件的片头和/或片尾的识别方法及装置

【技术保护点】
一种多媒体文件的片头和/或片尾的识别方法，其特征在于，包括：获取待处理的多媒体文件，所述多媒体文件包括至少两帧图像；利用对象跟踪技术，对所述至少两帧图像进行识别处理，以获得目标文件片段；根据所述多媒体文件的字幕内容和字幕时间，获得目标字幕片段；根据所述目标文件片段和所述目标字幕片段，确定所述多媒体文件的片头和/或片尾。

【技术特征摘要】
1.一种多媒体文件的片头和/或片尾的识别方法，其特征在于，包括：获取待处理的多媒体文件，所述多媒体文件包括至少两帧图像；利用对象跟踪技术，对所述至少两帧图像进行识别处理，以获得目标文件片段；根据所述多媒体文件的字幕内容和字幕时间，获得目标字幕片段；根据所述目标文件片段和所述目标字幕片段，确定所述多媒体文件的片头和/或片尾；其中，所述利用对象跟踪技术，对所述至少两帧图像进行识别处理，以获得目标文件片段，包括：利用对象跟踪技术，提取所述至少两帧图像中出现目标对象的图像，以获得至少两个候选文件片段；根据所述至少两个候选文件片段中相邻的候选文件片段之间的第一时间间隔和预先设置的第一时间阈值，对相邻的候选文件片段进行合并处理，以获得所述目标文件片段；所述根据所述多媒体文件的字幕内容和字幕时间，获得目标字幕片段，包括：根据所述多媒体文件的字幕内容和字幕时间，获得至少两个候选字幕片段；根据所述至少两个候选字幕片段中相邻的候选字幕片段之间的第二时间间隔和预先设置的第二时间阈值，对相邻的候选字幕片段进行合并处理，以获得所述目标字幕片段；所述根据所述目标文件片段和所述目标字幕片段，确定所述多媒体文件的片头和/或片尾，包括：根据所述目标文件片段和所述目标字幕片段，获得至少两个融合文件片段；根据所述至少两个融合文件片段中第一个融合文件片段的开始时间、所述至少两个融合文件片段中最后一个融合文件片段的结束时间、所述至少两个融合文件片段中相邻的融合文件片段之间的第三时间间隔和预先设置的第三时间阈值，确定所述多媒体文件的片头和/或片尾。2.根据权利要求1所述的方法，其特...

【专利技术属性】
技术研发人员：由清圳，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人