【技术实现步骤摘要】
视频弹幕检测识别方法及装置
本专利技术涉及计算机
,尤其涉及一种视频弹幕检测识别方法及装置。
技术介绍
生活在互联网时代,网络与人们的生活越来越密不可分。网络给人们带来便利的同时,也埋藏着一些安全隐患,净化网络环境,维护网络安全势在必行。网络安全产业与人工智能等新技术的融合趋势正日趋明显。随着各种视频软件的普及,人们开始热衷于在观影时分享自己的感受,“弹幕”也成为各视频运营商吸引用户的一种有利手段,但与此同时,也不乏一些危害人民身心健康的言论的传播。截止到现在,人们对于视频弹幕净化的需求更加的急切,因为弹幕可以方便人们对于视频观影感受的实时分享,创造一个文明的视频弹幕环境有赖于新技术的发展。然而与一般文字检测识别相比,视频弹幕检测技术的难点在于场景中的文字方向多变、多种比例、字小。随着现在图像处理技术的进步和相关领域(人工智能和模式识别技术)慢慢发展,还有高速的数字信号处理器的开发,让自动识别成为了可能。但是在复杂背景下视频弹幕文字检测识别方面,还没有形成一个比较成熟的理论和方法,所以现在急需专利技术一种针对复 ...
【技术保护点】
1.一种视频弹幕检测识别方法,其特征在于,包括:/n将待测图像输入至预先训练好的TextBoxes++网络中进行弹幕文字的检测,获取所述待测图像中弹幕文字的坐标信息;/n基于所述弹幕文字的坐标信息对包含弹幕文字的图像区域进行切片处理,并将切片图像输入至预先训练好的卷积循环神经网络CRNN网络中进行对弹幕文字的识别,获取所述弹幕文字的文本识别结果;/n其中,所述预先训练好的TextBoxes++网络和预先训练好的CRNN网络为预先采用带有弹幕文字位置和弹幕文字内容标注信息的视频弹幕样本图像进行训练后得到的。/n
【技术特征摘要】
1.一种视频弹幕检测识别方法,其特征在于,包括:
将待测图像输入至预先训练好的TextBoxes++网络中进行弹幕文字的检测,获取所述待测图像中弹幕文字的坐标信息;
基于所述弹幕文字的坐标信息对包含弹幕文字的图像区域进行切片处理,并将切片图像输入至预先训练好的卷积循环神经网络CRNN网络中进行对弹幕文字的识别,获取所述弹幕文字的文本识别结果;
其中,所述预先训练好的TextBoxes++网络和预先训练好的CRNN网络为预先采用带有弹幕文字位置和弹幕文字内容标注信息的视频弹幕样本图像进行训练后得到的。
2.根据权利要求1所述的视频弹幕检测识别方法,其特征在于,所述将待测图像输入至预先训练好的TextBoxes++网络中进行弹幕文字的检测,获取所述待测图像中弹幕文字的坐标信息,具体包括:
修改TextBoxes++网络的长宽比约束条件,使得修改后的TextBoxes++网络适用检测各种长宽比条件下的文本信息;
利用预先准备的带有弹幕文字位置和弹幕文字内容标注信息的视频弹幕样本图像对修改后的TextBoxes++网络进行训练,得到训练好的TextBoxes++网络;
将待测图像输入至训练好的TextBoxes++网络进行弹幕文字的检测,得到弹幕文字检测框,并获取所述弹幕文字检测框中弹幕文字的坐标信息。
3.根据权利要求2所述的视频弹幕检测识别方法,其特征在于,所述修改TextBoxes++网络的长宽比约束条件,具体包括:
将TextBoxes++网络的aspectratio修改为{2,5,7,9,10}。
4.根据权利要求2所述的视频弹幕检测识别方法,其特征在于,所述将待测图像输入至训练好的TextBoxes++网络进行弹幕文字的检测,具体包括:
将待测图像使用滑窗方式切分成多个图像块,将多个图像块依次输入至训练好的TextBoxes++网络进行弹幕文字的检测。
5.根据权利要求2或4所述的视频弹幕检测识别方法,其特征在于,在得到弹幕文字检测框之后,所述方法还包括:
设置检测框置信度评分阈值,将得到的弹幕文字检测框利用非极大值抑制的算法,过滤掉重叠度不满足所述置信度评分阈值约束条件的弹幕...
【专利技术属性】
技术研发人员:毕福昆,冯素婷,韩健鸿,
申请(专利权)人:北方工业大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。