The present invention discloses an advertisement location method based on advertisement word detection, which includes the following steps: collecting initial training sample data containing advertising words, expanding training set, generating expanded training samples, training deep convolution neural network, generating an advertisement word test model and drawing frames for broadcast video. In addition, the video frame set is broadcast, and the initial single frame detection results are obtained for each frame, and the final single frame detection results are obtained by using prior knowledge filtering, and the result of the single frame detection is integrated to get the final result of the advertisement fragment location. The invention has the characteristics of accurate positioning of advertising clips, meeting application requirements, ensuring recognition accuracy and speed, and improving efficiency.
【技术实现步骤摘要】
一种基于广告字样检测的广告定位方法
本专利技术属于图像视频处理领域,特别是涉及一种基于广告字样检测的广告定位方法。
技术介绍
视频数据是我们所接触的数据中最重要的种类之一,因其直观性和生动性而受到广泛欢迎。电视节目和网络视频通常会因其趣味性而吸引大量的观众去观看,因此节目前后和节目中间成为了插播广告的绝佳之地,吸引了很多厂商的关注。其中,很多广告内容具有一定的引导性,若不标明其为广告,容易造成消费者的误解。因此,在最新的电视和网络节目视频中,广告片段的画面角落都会印有“广告”两字的水印。正因如此,我们可以通过视频画面中的“广告”字样快速分辨其是否为广告片段。然而,视频数量和体积的庞大使得人工验证几乎没有实施的可能,若能采用技术手段自动检测视频画面中有无“广告”字样,则能自动判别当前帧是否为广告,从而实现广告片段的定位。对于视频中的广告字样检测问题,通常需先对视频进行关键帧提取,然后将其转化为图像中的文字识别问题。传统的文字识别技术首先对图像进行预处理,包括灰度化、降噪、二值化、字符切分、归一化等,对校正后的单个文字图像进行识别;然后,进行特征提取和降维;接着通过分类器识别出特征对应的文字;最后进行后处理,得到最终的识别结果。然而,对于广告字样检测问题,一方面,“广告”字样通常在画面中只占较小的部分,采用传统识别方法会浪费大量资源,且只有两个字,进行字符切分的意义也不大;另一方面,人工设计的特征具有一定的局限性,难以同时保障识别精度和速度。
技术实现思路
专利技术目的:本专利技术的目的是为了解决现有技术中的不足,提供一种可实现广告片段的准确定位,满足应用需求,保 ...
【技术保护点】
1.一种基于广告字样检测的广告定位方法,其特征在于:包括以下步骤:(1)收集包含广告字样的初始训练样本数据,通过自动化样本生成模块扩充训练集,生成扩充后训练样本;(2)将步骤(1)中生成的扩充后训练样本进行深度卷积神经网络训练,生成广告字样检测模型;(3)对播出视频进行抽帧处理,提取视频中的图像帧,得到播出视频帧集合;(4)对步骤(3)中得到的播出视频帧集合中的每一帧进行广告字样检测,得到初始的单帧检测结果;(5)利用先验知识滤除误检,得到最终的单帧检测结果;(6)整合单帧检测结果,同时加入生存周期时序约束,得到最终的广告片段定位结果。
【技术特征摘要】
1.一种基于广告字样检测的广告定位方法,其特征在于:包括以下步骤:(1)收集包含广告字样的初始训练样本数据,通过自动化样本生成模块扩充训练集,生成扩充后训练样本;(2)将步骤(1)中生成的扩充后训练样本进行深度卷积神经网络训练,生成广告字样检测模型;(3)对播出视频进行抽帧处理,提取视频中的图像帧,得到播出视频帧集合;(4)对步骤(3)中得到的播出视频帧集合中的每一帧进行广告字样检测,得到初始的单帧检测结果;(5)利用先验知识滤除误检,得到最终的单帧检测结果;(6)整合单帧检测结果,同时加入生存周期时序约束,得到最终的广告片段定位结果。2...
【专利技术属性】
技术研发人员:陈孟孟,
申请(专利权)人:北京中科火眼科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。