【技术实现步骤摘要】
一种基于字幕识别的MV字幕移植方法及装置
本专利技术涉及歌曲MV领域,特别是涉及一种基于字幕识别的MV字幕移植方法及装置。
技术介绍
现有技术歌曲MV字幕添加或者字幕迁移都是基于逐字并标注时间歌词文本文件lrc(歌词)或者krc(歌词文件),如果没有这种逐字歌词文件的话,字幕将不能正确的添加或者移植。
技术实现思路
本专利技术实施例提供一种基于字幕识别的MV字幕移植方法及装置,以在没有歌词文件的前提下可以正确的将MV视频中的歌词准确的截取并贴到新MV中,可以方便的进行无逐字歌词MV的更新和转换。一方面,本专利技术实施例提供了一种基于字幕识别的MV字幕移植方法,所述方法包括:分别迭代原MV视频以及需要移植的MV中的每一帧;利用光学字符识别OCR识别是否有字幕返回:如果没有字幕返回,则迭代原MV视频以及需要移植的MV中的下一帧;如果有字幕返回,则利用OpenCV进行图片处理,筛选出符合字幕特征的字幕轮廓并计算字幕坐标;根据所述据字幕坐标,截取符合字幕特征的字幕矩形,并保存截取的字幕矩形的矩形坐标;根据截取的字幕矩形的矩形坐标,将截取的字幕矩形合并在所述需要移植的MV中对应 ...
【技术保护点】
1.一种基于字幕识别的MV字幕移植方法,其特征在于,所述方法包括:分别迭代原MV视频以及需要移植的MV中的每一帧;利用光学字符识别OCR识别是否有字幕返回:如果没有字幕返回,则迭代原MV视频以及需要移植的MV中的下一帧;如果有字幕返回,则利用OpenCV进行图片处理,筛选出符合字幕特征的字幕轮廓并计算字幕坐标;根据所述据字幕坐标,截取符合字幕特征的字幕矩形,并保存截取的字幕矩形的矩形坐标;根据截取的字幕矩形的矩形坐标,将截取的字幕矩形合并在所述需要移植的MV中对应所述矩形坐标的位置。
【技术特征摘要】
1.一种基于字幕识别的MV字幕移植方法,其特征在于,所述方法包括:分别迭代原MV视频以及需要移植的MV中的每一帧;利用光学字符识别OCR识别是否有字幕返回:如果没有字幕返回,则迭代原MV视频以及需要移植的MV中的下一帧;如果有字幕返回,则利用OpenCV进行图片处理,筛选出符合字幕特征的字幕轮廓并计算字幕坐标;根据所述据字幕坐标,截取符合字幕特征的字幕矩形,并保存截取的字幕矩形的矩形坐标;根据截取的字幕矩形的矩形坐标,将截取的字幕矩形合并在所述需要移植的MV中对应所述矩形坐标的位置。2.如权利要求1所述基于字幕识别的MV字幕移植方法,其特征在于,分别迭代截取的原MV视频中的字幕范围以及需要移植的MV中的每一帧。3.如权利要求2所述基于字幕识别的MV字幕移植方法,其特征在于,截取的原MV视频中的字幕范围的两点坐标为(0,宽/1.45)和(长,宽-20px)。4.如权利要求3所述基于字幕识别的MV字幕移植方法,其特征在于,利用OpenCV进行图片处理,筛选出符合字幕特征的字幕轮廓并计算字幕坐标,具体包括:首先将图片灰度,进行图片二值化并膨胀,之后查找图片所有轮廓,并迭代所有查找到的轮廓,获取符合字幕特征的轮廓的四顶点坐标并计算出所述四顶点坐标的最小矩形,作为符合字幕特征的字幕轮廓并计算字幕坐标。5.如权利要求4所述基于字幕识别的MV字幕移植方法,其特征在于,将不符合字幕特征的轮廓抛弃,即将所述轮廓的参数宽大于参数长的1.2倍并且计算此轮廓的面积小于预设阈值的轮廓抛弃。6.一种基于字幕识别的MV字幕移植装置,其特征在于,所述装置包括:迭代单元,用于分别迭...
【专利技术属性】
技术研发人员:马哲,
申请(专利权)人:北京雷石天地电子技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。