一种字幕区域定位方法、装置和电子设备制造方法及图纸

技术编号:23629374 阅读:17 留言:0更新日期:2020-04-01 00:03
本申请提供一种字幕区域定位方法,包括:获取初始字幕图像,并生成与初始字幕图像对应的灰度图,初始字幕图像是当前视频帧图像中包括字幕区域的图像;对灰度图依次进行第一计算、第二计算、第三计算得到目标区域;根据目标区域确定字幕区域;其中,第一计算、第二计算、第三计算分别为边缘梯度计算、像素宽度提取计算、亮度计算中互异的一种。可见,本申请通过结合边缘梯度计算、像素宽度提取计算、亮度计算的方式得到字幕区域,其中,将多种特征进行融合,对区域进行多次的限定,以便定位的字幕区域更加准确、字幕区域提取效率更高。本申请同时还提供了一种字幕区域定位装置、一种电子设备,均具有上述有益效果。

【技术实现步骤摘要】
一种字幕区域定位方法、装置和电子设备
本申请涉及字幕区域定位
,特别涉及一种字幕区域定位方法、字幕区域定位装置、电子设备。
技术介绍
相关技术中针对字幕区域进行定位的方式采用的是利用文字边缘梯度值的方式,计算投影原图的边缘信息,定位到边缘梯度一致的区域,由于文字区域的边缘梯度是一致的,因此定位得到字幕区域,但是,该方法定位得到的字幕区域精准度低。因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。
技术实现思路
本申请的目的是提供一种字幕区域定位方法、字幕区域定位装置、电子设备,能够提高字幕区域定位精度。其具体方案如下:本申请提供一种字幕区域定位方法,包括:获取初始字幕图像,并生成与所述初始字幕图像对应的灰度图,所述初始字幕图像是当前视频帧图像中包括字幕区域的图像;对所述灰度图依次进行第一计算、第二计算、第三计算得到目标区域;根据所述目标区域确定所述字幕区域;其中,所述第一计算、所述第二计算、所述第三计算分别为边缘梯度计算、像素宽度提取计算、亮度计算中互异的一种。可选的,当所述第一计算为所述边缘梯度计算,所述第二计算为所述像素宽度提取计算,所述第三计算为所述亮度计算时,所述对所述灰度图依次进行第一计算、第二计算、第三计算得到目标区域,包括:对所述灰度图进行所述边缘梯度计算,得到边缘强度图,并根据所述边缘强度图进行所述像素宽度提取计算,得到像素宽度图像;判断所述像素宽度图像中的边缘像素点的像素点值是否满足预设范围;若满足所述预设范围,则确定所述边缘像素点为目标像素点,对所述目标像素点进行所述亮度计算,提取出亮度一致的目标区域。可选的,所述对所述灰度图进行所述边缘梯度计算,得到边缘强度图,包括:对所述灰度图利用边缘算法进行计算,得到初始边缘强度图;将所述初始边缘强度图进行二值化处理,并将所述初始边缘强度图中梯度值小于预设阈值的像素点的梯度值设置为零,得到所述边缘强度图。可选的,所述根据所述边缘强度图进行像素宽度提取,得到像素宽度图像,包括:根据所述边缘强度图计算非零梯度值的目标边缘像素点沿梯度方向至另一边缘的非零梯度值的边缘像素点的长度;将所述长度确定为像素宽度,并将所述梯度方向的所有像素点的宽度设置为所述像素宽度,得到所述像素宽度图像。可选的,所述获取初始字幕图像,包括:获取视频帧图像,并将所述视频帧图像按照预设比例进行缩放,得到当前视频帧图像;将所述当前视频帧图像的预设区域对应的图像确定为所述初始字幕图像。可选的,当所述第一计算为所述边缘梯度计算,所述第二计算为所述亮度计算,所述第三计算为所述像素宽度提取计算时,所述对所述灰度图依次进行第一计算、第二计算、第三计算得到目标区域,包括:对所述灰度图进行所述边缘梯度计算,得到边缘强度图;判断所述边缘强度图中的边缘像素点的像素点值是否满足预设范围;若满足所述预设范围,则确定所述边缘像素点为目标像素点,对所述目标像素点进行所述亮度计算,提取出亮度一致的亮度区域,得到亮度图;根据所述亮度图进行所述像素宽度提取计算,得到目标区域。可选的,所述将所述当前视频帧图像的预设区域对应的图像确定为所述初始字幕图像,包括:获取连续多帧视频帧图像的字幕区域,并确定对应的水平中心位置;根据所述水平中心位置确定所述预设区域,将所述预设区域对应的图像确定为所述初始字幕图像。可选的,所述根据所述目标区域确定所述字幕区域,包括:计算所述目标区域的几何结构信息;若所述目标区域的所述几何结构信息是矩形,则确定所述目标区域为所述字幕区域。本申请提供一种字幕区域定位装置,包括:灰度图生成模块,用于获取初始字幕图像,并生成与所述初始字幕图像对应的灰度图,所述初始字幕图像是当前视频帧图像中包括字幕区域的图像;目标区域计算模块,用于对所述灰度图依次进行第一计算、第二计算、第三计算得到目标区域;字幕区域确定模块,用于根据所述目标区域确定所述字幕区域;其中,所述第一计算、所述第二计算、所述第三计算分别为边缘梯度计算、像素宽度提取计算、亮度计算中互异的一种。本申请提供一种电子设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上述字幕区域定位方法的步骤。本申请提供一种字幕区域定位方法,包括:获取初始字幕图像,并生成与初始字幕图像对应的灰度图,初始字幕图像是当前视频帧图像中包括字幕区域的图像;对灰度图依次进行第一计算、第二计算、第三计算得到目标区域;根据目标区域确定字幕区域;其中,第一计算、第二计算、第三计算分别为边缘梯度计算、像素宽度提取计算、亮度计算中互异的一种。可见,本申请通过结合边缘梯度计算、像素宽度提取计算、亮度计算的方式得到字幕区域,其中,将多种特征进行融合,对区域进行多次的限定,以便定位的字幕区域更加准确、字幕区域提取效率更高。本申请同时还提供了一种字幕区域定位装置、一种电子设备,均具有上述有益效果,在此不再赘述。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本申请实施例所提供的一种字幕区域定位方法的流程图;图2为本申请实施例提供的一种目标区域计算的流程图;图3为本申请实施例所提供的另一种字幕区域定位方法的流程图;图4为本申请实施例所提供的获取初始字幕图像的流程图;图5为本申请实施例提供的一种字幕区域定位的图像变化示意图;图6为本申请实施例所提供的一种字幕区域定位装置的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。相关技术中针对字幕区域进行定位的方式采用的是利用文字边缘梯度值的方式,计算投影原图的边缘信息,定位到边缘梯度一致的区域,由于文字区域的边缘梯度是一致的,因此定位得到字幕区域,但是,该方法定位得到的字幕区域精准度低。基于上述技术问题,本实施例提供一种字幕区域定位方法,具体请参考图1,图1为本申请实施例所提供的一种字幕区域定位方法的流程图,具体包括:S110、获取初始字幕图像,并生成与初始字幕图像对应的灰度图。初始字幕图像是当前视频帧图像中包括字幕区域的图像。其中,初始字幕图像是当前视频帧图像中的一个区域的图像,初始字幕图像是首先进行简单定位得到的初始字幕图像本文档来自技高网...

【技术保护点】
1.一种字幕区域定位方法,其特征在于,包括:/n获取初始字幕图像,并生成与所述初始字幕图像对应的灰度图,所述初始字幕图像是当前视频帧图像中包括字幕区域的图像;/n对所述灰度图依次进行第一计算、第二计算、第三计算得到目标区域;/n根据所述目标区域确定所述字幕区域;/n其中,所述第一计算、所述第二计算、所述第三计算分别为边缘梯度计算、像素宽度提取计算、亮度计算中互异的一种。/n

【技术特征摘要】
1.一种字幕区域定位方法,其特征在于,包括:
获取初始字幕图像,并生成与所述初始字幕图像对应的灰度图,所述初始字幕图像是当前视频帧图像中包括字幕区域的图像;
对所述灰度图依次进行第一计算、第二计算、第三计算得到目标区域;
根据所述目标区域确定所述字幕区域;
其中,所述第一计算、所述第二计算、所述第三计算分别为边缘梯度计算、像素宽度提取计算、亮度计算中互异的一种。


2.根据权利要求1所述的字幕区域定位方法,其特征在于,当所述第一计算为所述边缘梯度计算,所述第二计算为所述像素宽度提取计算,所述第三计算为所述亮度计算时,所述对所述灰度图依次进行第一计算、第二计算、第三计算得到目标区域,包括:
对所述灰度图进行所述边缘梯度计算,得到边缘强度图,并根据所述边缘强度图进行所述像素宽度提取计算,得到像素宽度图像;
判断所述像素宽度图像中的边缘像素点的像素点值是否满足预设范围;
若满足所述预设范围,则确定所述边缘像素点为目标像素点,对所述目标像素点进行所述亮度计算,提取出亮度一致的目标区域。


3.根据权利要求2所述的字幕区域定位方法,其特征在于,所述对所述灰度图进行所述边缘梯度计算,得到边缘强度图,包括:
对所述灰度图利用边缘算法进行计算,得到初始边缘强度图;
将所述初始边缘强度图进行二值化处理,并将所述初始边缘强度图中梯度值小于预设阈值的像素点的梯度值设置为零,得到所述边缘强度图。


4.根据权利要求2所述的字幕区域定位方法,其特征在于,所述根据所述边缘强度图进行像素宽度提取,得到像素宽度图像,包括:
根据所述边缘强度图计算非零梯度值的目标边缘像素点沿梯度方向至另一边缘的非零梯度值的边缘像素点的长度;
将所述长度确定为像素宽度,并将所述梯度方向的所有像素点的宽度设置为所述像素宽度,得到所述像素宽度图像。


5.根据权利要求1所述的字幕区域定位方法,其特征在于,所述获取初始字幕图像,包括:
获取视频帧图像,并将所述视频帧图像按照预设比例进行缩放,得到当前视频帧图像;
将所述当前视频...

【专利技术属性】
技术研发人员:钟波肖适王鑫宁仲
申请(专利权)人:成都极米科技股份有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1