一种用于识别媒体内容中标识图案的相关方法及装置制造方法及图纸

技术编号:24093636 阅读:16 留言:0更新日期:2020-05-09 09:13
本申请实施例公开了一种基于人工智能的、用于识别媒体内容中标识图案的识别模型训练方法、媒体内容识别方法和相关装置,针对待识别对象的标识图案,可以通过添加形式进行训练样本的构建,由于添加形式可以标识在图像中添加该标识图案的添加位置,或者在添加该标识图案时,对该标识图案的内容改变方式,由此构建得到的训练样本中,可以囊括各种在图像中添加该标识图案的可能形式。训练样本的生成对网络爬取、人工标识的依赖性降低,能够依据添加形式快速生成大量的高质量训练样本,且均包括准确的标签,从而在以此训练样本进行监督训练得到的识别模型,即使针对网络中新产生的标识图案,也能够准确识别媒体内容中各种变化形式的该标识图案。

A method and device for identifying logo patterns in media content

【技术实现步骤摘要】
一种用于识别媒体内容中标识图案的相关方法及装置
本申请涉及数据处理领域,特别是涉及一种用于识别媒体内容中标识图案的识别模型训练方法、媒体内容识别方法和相关装置。
技术介绍
在互联网时代,大量的媒体内容通过不同途径被上传到网络上进行传播。由于媒体内容所具有的传播性,在一些情况下媒体内容的生成方或上传方会通过媒体内容对一些对象例如营销号、产品、软件等进行宣传,以提高对象的曝光度。一种常见的对象宣传方式是在媒体内容中添加用于宣传的对象的标识图案,例如指向该对象的二维码、软件图标、营销号标识等。通过不同的添加形式,使得媒体内容在播放、展示过程中,显示该标识图案。为了避免通过标识图案散播不良内容,需要对网络中的媒体内容进行准确的标识图案识别,以识别出携带了标识图案的媒体内容。然而,由于标识图案的变化形式非常多,对标识图案的识别带来了很大难度。
技术实现思路
为了解决上述技术问题,本申请提供了一种用于识别媒体内容中标识图案的相关方法及装置,使得训练样本中尽可能涵盖标识图案以各种各样变形形式存在的训练样本,以及标识图案处于各种各样添加位置处的训练样本,提高经训练样本训练得到的识别模型识别媒体内容中标识图案的准确性。本申请实施例公开了如下技术方案:一方面,本申请实施例提供了一种用于识别媒体内容中标识图案的识别模型训练方法,所述方法包括:获取待识别对象的标识图案;采用不同的添加形式在图像中添加所述标识图案,作为训练样本;通过所述训练样本训练识别模型,所述识别模型用于识别媒体内容中的标识图案;所述添加形式用于标识以下任意一种或多种的组合:在图像中添加所述标识图案的添加位置;所述标识图案的内容改变方式。另一方面,本申请实施例提供了一种媒体内容识别方法,所述方法包括:从待识别的媒体内容中选取多个图像帧作为帧序列;分别确定所述多个图像帧中标识图案的位置信息;根据所述帧序列中相邻图像帧的位置信息,确定所述相邻图像帧中的标识图案是否部分重叠;若目标相邻图像帧的标识图案的部分重叠比例满足阈值,确定所述媒体内容中所述目标相邻图像帧对应的图像帧区间具有动态的标识图案。另一方面,本申请实施例提供了一种用于识别媒体内容中标识图案的识别模型训练装置,所述装置包括获取单元、添加单元和训练单元:所述获取单元,用于获取待识别对象的标识图案;所述添加单元,用于采用不同的添加形式在图像中添加所述标识图案,作为训练样本;所述训练单元,用于通过所述训练样本训练识别模型,所述识别模型用于识别媒体内容中的标识图案;所述添加形式用于标识以下任意一种或多种的组合:在图像中添加所述标识图案的添加位置;所述标识图案的内容改变方式。另一方面,本申请实施例提供了一种媒体内容识别装置,所述装置包括选取单元、第一确定单元、第二确定单元和第三确定单元:所述选取单元,用于从待识别的媒体内容中选取多个图像帧作为帧序列;所述第一确定单元,用于分别确定所述多个图像帧中标识图案的位置信息;所述第二确定单元,用于根据所述帧序列中相邻图像帧的位置信息,确定所述相邻图像帧中的标识图案是否部分重叠;所述第三确定单元,用于若目标相邻图像帧的标识图案的部分重叠比例满足阈值,确定所述媒体内容中所述目标相邻图像帧对应的图像帧区间具有动态的标识图案。另一方面,本申请实施例提供了一种设备,所述设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行上述所述的识别模型训练方法或所述的媒体内容识别方法。另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述所述的识别模型训练方法或上述所述的媒体内容识别方法。由上述技术方案可以看出,针对待识别对象的标识图案,可以通过添加形式进行训练样本的构建,由于添加形式可以标识在图像中添加该标识图案的添加位置,或者在添加该标识图案时,对该标识图案的内容改变方式,由此构建得到的训练样本中,可以囊括各种在图像中添加该标识图案的可能形式。训练样本的生成对网络爬取、人工标识的依赖性降低,能够依据添加形式快速生成大量的高质量训练样本,且均包括准确的标签,从而在以此训练样本进行监督训练得到的识别模型,即使针对网络中新产生的标识图案,也能够准确识别媒体内容中各种变化形式的该标识图案。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为一种为媒体内容添加了对象为“AA视频软件”的标识图案的展示示意图;图2为本申请实施例提供的一种识别模型训练方法的应用场景示意图;图3为本申请实施例提供的一种用于识别媒体内容中标识图案的识别模型训练方法流程图;图4为本申请实施例提供的一种基于内容改变方式生成训练样本的训练样本示例图;图5为本申请实施例提供的一种媒体内容识别方法流程图;图6为本申请实施例提供的一种识别动态的标识图案的场景示意图;图7为本申请实施例提供的一种水印识别系统结构图;图8为本申请实施例提供的一种识别模型训练装置结构图;图9为本申请实施例提供的一种媒体内容识别装置的结构图;图10为本申请实施例提供了一种数据处理设备结构图;图11为本申请实施例提供的一种服务器的结构图。具体实施方式下面结合附图,对本申请的实施例进行描述。目前,通常在媒体内容中添加对象的标识图案如二维码、软件图标、营销号标识等,以使得在媒体内容播放、展示过程中,显示该标识图案进行传播。例如图1示出的为媒体内容添加了对象为“AA视频软件”的标识图案的展示示意图。为了避免通过标识图案散播不良内容,需要对媒体内容进行标识图案识别。然而,有些媒体内容生成、上传方为了规避识别,会对所要添加的标识图案进行各种形式变化,对标识图案的识别带来了很大难度。本申请实施例所提供的识别模型训练方法和后续介绍的媒体内容识别方法可以是基于人工智能实现的,人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软本文档来自技高网...

【技术保护点】
1.一种用于识别媒体内容中标识图案的识别模型训练方法,其特征在于,所述方法包括:/n获取待识别对象的标识图案;/n采用不同的添加形式在图像中添加所述标识图案,作为训练样本;/n通过所述训练样本训练识别模型,所述识别模型用于识别媒体内容中的标识图案;/n其中,所述添加形式用于标识以下任意一种或多种的组合:/n在图像中添加所述标识图案的添加位置;/n所述标识图案的内容改变方式。/n

【技术特征摘要】
1.一种用于识别媒体内容中标识图案的识别模型训练方法,其特征在于,所述方法包括:
获取待识别对象的标识图案;
采用不同的添加形式在图像中添加所述标识图案,作为训练样本;
通过所述训练样本训练识别模型,所述识别模型用于识别媒体内容中的标识图案;
其中,所述添加形式用于标识以下任意一种或多种的组合:
在图像中添加所述标识图案的添加位置;
所述标识图案的内容改变方式。


2.根据权利要求1所述的方法,其特征在于,若所述添加形式至少用于标识在图像中添加所述标识图案的添加位置,所述识别模型包括用于识别标识图案位置的位置识别子模型和用于识别标识图案内容的内容识别子模型,所述通过所述训练样本训练识别模型,包括:
通过所述训练样本对所述位置识别子模型和所述内容识别子模型进行并行训练;或者,
通过所述训练样本对所述位置识别子模型进行训练,根据训练过程中所述位置识别子模型的模型输出和对应的训练样本,对所述内容识别子模型进行训练。


3.根据权利要求1或2所述的方法,其特征在于,所述训练样本还包括所添加的所述标识图案的信息类型。


4.根据权利要求1或2所述的方法,其特征在于,所述内容改变方式包括以下任意一种或多种的组合:
所述标识图案的清晰度改变方式;
所述标识图案的尺寸改变方式;
所述标识图案的字体改变方式;
所述标识图案的颜色改变方式。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过已识别标识图案所构建的训练样本,对所述识别模型进行训练迭代;所述已识别标识图案包括以下任意一种或多种的组合:
被识别上报的标识图案;
通过所述识别模型在媒体内容识别过程中识别出的标识图案。


6.一种媒体内容识别方法,其特征在于,所述方法包括:
从待识别的媒体内容中选取多个图像帧作为帧序列;
分别确定所述多个图像帧中标识图案的位置信息;
根据所述帧序列中相邻图像帧的位置信息,确定所述相邻图像帧中的标识图案是否部分重叠;
若目标相邻图像帧的标识图案的部分重叠比例满足阈值,确定所述媒体内容中所述目标相邻图像帧对应的图像帧区间具有动态的标识图案。


7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
分别确定所述目标相邻图像帧中标识图案的图案内容;
根据所述图案内容确定所述目标相邻图像帧中标识图案是否属于同一个目标标识图案;
所述确定所述媒体内容中所述目标相邻图像帧对应的图像帧区间具有动态的标识图案,包括:
若所述目标相邻图像帧中的标识图案属于同一个目标标识图案,且所述目标相邻图像帧的标识图案的部分重叠比例满足阈值,确定所述媒体内容中所述目标相邻图像帧对应的图像帧区间具有动态的标识图案。


8.根据权利要求7所述的方法,其特征在于,识别模型包括用于识别标识图案位置的位置识别子模型和用于识别标识图案内容的内容识别子模型,所述分别确定所述多个图像帧中标识图案的位置信息,包括:
通过所述位置识别子模型分别确定所述多个图像帧中标识图案的位置信息;
所述分别确定所述目标相邻图像帧中标识图案的图案内容,...

【专利技术属性】
技术研发人员:刘刚
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1