一种视频中的标题检测方法、装置及电子设备制造方法及图纸

技术编号:18459069 阅读:43 留言:0更新日期:2018-07-18 12:48
本发明专利技术实施例提供了一种视频中的标题检测方法、装置及电子设备,方法包括:判断预设数量个连续视频帧的第一区域是否存在同一标题;如果存在,获得第二区域各像素在连续视频帧的每一视频帧中的像素值;利用各个像素值,从第二区域各像素中确定各个候选像素;确定像素总数以及结束视频帧;如果像素总数不小于预设阈值,则从所有第一视频帧中确定待识别视频帧,识别待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,第一视频帧为:在起始视频帧至结束视频帧范围内的视频帧。应用本发明专利技术实施例提供的技术方案进行标题检测时,实现了检测视频帧中未处于边缘框内的标题。

A title detection method, device and electronic device in video

An embodiment of the present invention provides a method, device and electronic device in the Title Detection of a video. The method includes: judging whether the first area of a predetermined number of continuous video frames is the same or not; if there is a pixel value in each of the video frames of a continuous video frame, the pixels of each pixel in the second region are obtained; and each pixel is used for each pixel. Value, determining each candidate pixel from each pixel of the second region; determining the total number of pixels and ending the video frame; if the total number of pixels is not less than a preset threshold, the recognition video frame is determined from all first video frames, the characters of the second region in the identified video frame are identified as the main title of all first video frames, A video frame is a video frame in the range from the initial video frame to the end video frame. When the technical proposal provided by the embodiment of the invention is used for heading detection, the title in the edge frame is detected in the video frame.

【技术实现步骤摘要】
一种视频中的标题检测方法、装置及电子设备
本专利技术涉及图像识别
,特别是涉及一种视频中的标题检测方法、装置及电子设备。
技术介绍
为了便于人们对视频内容的理解,属于同一视频内容的视频帧通常带有同一标题,标题可以用于概括视频的主要内容,并且标题一般位于视频帧中的固定区域,标题的字体颜色通常也是固定的。现有的视频中标题检测方法主要是:利用边缘检测技术检测视频帧中的预设矩形区域是否存在边缘直线,如果不存在,则判定该视频帧不存在标题;如果存在,则判定该视频帧存在标题,获得边缘直线,并根据边缘直线确定边缘框,从边缘框中提取字符区域;进而利用字符识别技术,识别字符区域中的字符,完成对视频中标题的检测。然而,专利技术人在实现本专利技术的过程中发现,现有技术至少存在如下问题:视频中的标题检测方法依赖于边缘检测技术,只能检测出边缘框内的标题,如果标题未处于边缘框内,则无法利用边缘检测技术检测出标题。
技术实现思路
本专利技术实施例的目的在于提供一种视频中的标题检测方法,以实现检测视频帧中未处于边缘框内的标题。具体技术方案如下:第一方面,本专利技术实施例提供了一种视频中的标题检测方法,所述方法包括:判断预设数量个连续视频帧的第一区域是否存在同一标题;其中,所述第一区域为:视频帧中预设的包含边缘框的矩形区域;如果存在,获得第二区域各像素在所述连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素;其中,所述第二区域为:视频帧中预设的不包含边缘框的矩形区域,所述候选像素为:待选的属于所述第二区域中标题字符区域的像素;基于预设的标题跟踪算法,确定像素总数以及结束视频帧,其中,所述像素总数为:从所述各个候选像素中确定的属于所述第二区域中标题字符区域的像素的总数,所述结束视频帧为:满足所述标题跟踪算法中结束条件的视频帧;判断所述像素总数是否小于预设阈值;如果不小于,从所有第一视频帧中确定待识别视频帧,识别所述待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,其中,所述第一视频帧为:在起始视频帧至所述结束视频帧范围内的视频帧;所述起始视频帧为:所述连续视频帧中帧号最小的视频帧。可选的,如果判定所述像素总数不小于所述预设阈值,所述方法还包括:识别所述待识别视频帧中第一区域的字符,作为所有第一视频帧的副标题。可选的,所述利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素,包括:针对第二区域的每一像素,利用所获得的该像素在所述连续视频帧的每一视频帧中的各个像素值,计算该像素的平均像素值和均方差像素值;获得第二区域每一像素的平均像素值和均方差像素值,并将平均像素值属于预设像素值范围且均方差像素值小于预设均方差值的像素,作为候选像素。可选的,所述基于预设的标题跟踪算法,确定像素总数以及结束视频帧,包括:将所述各个候选像素作为各个当前候选像素;将跟踪成功视频帧的下一视频帧作为第二视频帧,其中,所述跟踪成功视频帧为:所述连续视频帧中帧号最大的视频帧;判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题;如果不存在,将所述第二视频帧的上一视频帧作为结束视频帧,将所述当前候选像素的总数作为所述像素总数。可选的,如果判定所述第二视频帧和所述连续视频帧的第一区域存在同一标题,所述方法还包括:判断当前候选像素的总数是否为零;如果当前候选像素的总数为零,则获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。可选的,如果当前候选像素的总数不为零,所述方法还包括:计算每一当前候选像素的邻帧像素差,并删除邻帧像素差大于预设像素差阈值的当前候选像素;其中,一个当前候选像素的邻帧像素差为:一个当前候选像素在所述第二视频帧与第三视频帧的像素值之差的绝对值,所述第三视频帧为:所述第二视频帧的上一视频帧;判断未被删除的当前候选像素的总数是否为零;如果是,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤;如果否,则将各个未被删除的当前候选像素作为各个当前候选像素,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。可选的,在将所述各个候选像素作为各个当前候选像素的之后/之前,所述方法还包括:将所述预设数量作为当前跟踪成功视频帧总数;在所述计算每一当前候选像素的邻帧像素差的步骤之前,所述方法还包括:判断所述当前跟踪成功视频帧总数是否小于预设视频帧总数;如果小于,则执行计算每一当前候选像素的邻帧像素差的步骤,且在判定未被删除的当前候选像素的总数不为零之后,在返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤之前,所述方法还包括:将所述当前跟踪成功视频帧总数与1的和值作为当前跟踪成功视频帧总数。可选的,如果所述当前跟踪成功视频帧总数不小于预设视频帧总数,所述方法还包括:获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。第二方面,本专利技术实施例提供了一种视频中的标题检测装置,所述装置包括:第一判断模块,用于判断预设数量个连续视频帧的第一区域是否存在同一标题;其中,所述第一区域为:视频帧中预设的包含边缘框的矩形区域;第一获得模块,用于在所述第一判断模块的判断结果为是时,获得第二区域各像素在所述连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素;其中,所述第二区域为:视频帧中预设的不包含边缘框的矩形区域,所述候选像素为:待选的属于所述第二区域中标题字符区域的像素;确定模块,用于基于预设的标题跟踪算法,确定像素总数以及结束视频帧,其中,所述像素总数为:从所述各个候选像素中确定的属于所述第二区域中标题字符区域的像素的总数,所述结束视频帧为:满足所述标题跟踪算法中结束条件的视频帧;第二判断模块,用于判断所述像素总数是否小于预设阈值;第一识别模块,用于在所述第二判断模块的判断结果为否时,从所有第一视频帧中确定待识别视频帧,识别所述待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,其中,所述第一视频帧为:在起始视频帧至所述结束视频帧范围内的视频帧;所述起始视频帧为:所述连续视频帧中帧号最小的视频帧。可选的,所述装置还包括:第二识别模块,用于在所述第二判断模块的判断结果为否时,识别所述待识别视频帧中第一区域的字符,作为所有第一视频帧的副标题。可选的,所述第一获得模块利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素,具体为:针对第二区域的每一像素,利用所获得的该像素在所述连续视频帧的每一视频帧中的各个像素值,计算该像素的平均像素值和均方差像素值;获得第二区域每一像素的平均像素值和均方差像素值,并将平均像素值属于预设像素值范围且均方差像素值小于预设均方差值的像素,作为候选像素。可选的,所述确定模块,包括:第一确定子模块,用于将所述各个候选像素作为各个当前候选像素;将跟踪成功视频帧的下一视频帧本文档来自技高网...

【技术保护点】
1.一种视频中的标题检测方法,其特征在于,所述方法包括:判断预设数量个连续视频帧的第一区域是否存在同一标题;其中,所述第一区域为:视频帧中预设的包含边缘框的矩形区域;如果存在,获得第二区域各像素在所述连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素;其中,所述第二区域为:视频帧中预设的不包含边缘框的矩形区域,所述候选像素为:待选的属于所述第二区域中标题字符区域的像素;基于预设的标题跟踪算法,确定像素总数以及结束视频帧,其中,所述像素总数为:从所述各个候选像素中确定的属于所述第二区域中标题字符区域的像素的总数,所述结束视频帧为:满足所述标题跟踪算法中结束条件的视频帧;判断所述像素总数是否小于预设阈值;如果不小于,从所有第一视频帧中确定待识别视频帧,识别所述待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,其中,所述第一视频帧为:在起始视频帧至所述结束视频帧范围内的视频帧;所述起始视频帧为:所述连续视频帧中帧号最小的视频帧。

【技术特征摘要】
1.一种视频中的标题检测方法,其特征在于,所述方法包括:判断预设数量个连续视频帧的第一区域是否存在同一标题;其中,所述第一区域为:视频帧中预设的包含边缘框的矩形区域;如果存在,获得第二区域各像素在所述连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素;其中,所述第二区域为:视频帧中预设的不包含边缘框的矩形区域,所述候选像素为:待选的属于所述第二区域中标题字符区域的像素;基于预设的标题跟踪算法,确定像素总数以及结束视频帧,其中,所述像素总数为:从所述各个候选像素中确定的属于所述第二区域中标题字符区域的像素的总数,所述结束视频帧为:满足所述标题跟踪算法中结束条件的视频帧;判断所述像素总数是否小于预设阈值;如果不小于,从所有第一视频帧中确定待识别视频帧,识别所述待识别视频帧中第二区域的字符,作为所有第一视频帧的主标题,其中,所述第一视频帧为:在起始视频帧至所述结束视频帧范围内的视频帧;所述起始视频帧为:所述连续视频帧中帧号最小的视频帧。2.根据权利要求1所述的方法,其特征在于,如果判定所述像素总数不小于所述预设阈值,所述方法还包括:识别所述待识别视频帧中第一区域的字符,作为所有第一视频帧的副标题。3.根据权利要求1所述的方法,其特征在于,所述利用所获得的各个像素值,从所述第二区域各像素中确定各个候选像素,包括:针对第二区域的每一像素,利用所获得的该像素在所述连续视频帧的每一视频帧中的各个像素值,计算该像素的平均像素值和均方差像素值;获得第二区域每一像素的平均像素值和均方差像素值,并将平均像素值属于预设像素值范围且均方差像素值小于预设均方差值的像素,作为候选像素。4.根据权利要求1所述的方法,其特征在于,所述基于预设的标题跟踪算法,确定像素总数以及结束视频帧,包括:将所述各个候选像素作为各个当前候选像素;将跟踪成功视频帧的下一视频帧作为第二视频帧,其中,所述跟踪成功视频帧为:所述连续视频帧中帧号最大的视频帧;判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题;如果不存在,将所述第二视频帧的上一视频帧作为结束视频帧,将所述当前候选像素的总数作为所述像素总数。5.根据权利要求4所述的方法,其特征在于,如果判定所述第二视频帧和所述连续视频帧的第一区域存在同一标题,所述方法还包括:判断当前候选像素的总数是否为零;如果当前候选像素的总数为零,则获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。6.根据权利要求5所述的方法,其特征在于,如果当前候选像素的总数不为零,所述方法还包括:计算每一当前候选像素的邻帧像素差,并删除邻帧像素差大于预设像素差阈值的当前候选像素;其中,一个当前候选像素的邻帧像素差为:一个当前候选像素在所述第二视频帧与第三视频帧的像素值之差的绝对值,所述第三视频帧为:所述第二视频帧的上一视频帧;判断未被删除的当前候选像素的总数是否为零;如果是,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤;如果否,则将各个未被删除的当前候选像素作为各个当前候选像素,获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。7.根据权利要求6所述的方法,其特征在于,在将所述各个候选像素作为各个当前候选像素的之后/之前,所述方法还包括:将所述预设数量作为当前跟踪成功视频帧总数;在所述计算每一当前候选像素的邻帧像素差的步骤之前,所述方法还包括:判断所述当前跟踪成功视频帧总数是否小于预设视频帧总数;如果小于,则执行计算每一当前候选像素的邻帧像素差的步骤,且在判定未被删除的当前候选像素的总数不为零之后,在返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤之前,所述方法还包括:将所述当前跟踪成功视频帧总数与1的和值作为当前跟踪成功视频帧总数。8.根据权利要求7所述的方法,其特征在于,如果所述当前跟踪成功视频帧总数不小于预设视频帧总数,所述方法还包括:获得所述第二视频帧的下一视频帧,并将所述下一视频帧作为第二视频帧,返回执行判断所述第二视频帧和所述连续视频帧的第一区域是否存在同一标题的步骤。9.一种视频中的标题检测装置,其特征在于,所述装置包括:第一判断模块,用于判断预设数量个连续视频帧的第一区域是否存在同一标题;其中,所述第一区域为:视频帧中预设的包含边缘框的矩形区域;第一获得模块,用于在所述第一判断模块的判断结果为是时,获得第二区域各像素在所述连续视频帧的每一视频帧中的像素值;利用所获得的各个像素值,从所述第二区域各像素...

【专利技术属性】
技术研发人员:李冠楠
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1