媒体资源的分类器训练方法及装置制造方法及图纸

技术编号:20026590 阅读:25 留言:0更新日期:2019-01-06 05:20
本发明专利技术公开了一种媒体资源的分类器训练方法及装置。其中,该方法包括:从媒体资源样本集合中获取媒体资源特征数据和媒体资源分类信息;根据预设的分布信息和媒体资源分类信息确定媒体资源特征数据中每种媒体资源特征对应的核权重;根据核权重和每种媒体资源特征对应的核函数获取合成核函数;根据合成核函数对媒体资源的分类器进行训练。本发明专利技术解决了相关技术中对媒体资源的分类器进行训练时的训练效率低的技术问题。

【技术实现步骤摘要】
媒体资源的分类器训练方法及装置
本专利技术涉及计算机领域,具体而言,涉及一种媒体资源的分类器训练方法及装置。
技术介绍
随着互联网媒体的快速发展,媒体资源越来越丰富,海量的媒体资源如何清晰有条理的呈现在用户的面前就成为了一个热门的研究课题。在媒体资源分类的过程中利用媒体资源样本对分类器进行训练,这样就可以利用分类器对媒体资源进行分类。在对媒体资源的分类器进行训练的过程中,需要使用媒体资源的特征对分类器进行训练,以往的媒体资源分类系统中多特征融合方式通常可以分为两类:特征层融合与决策层融合。特征层融合将多种特征拼接为一种特征,不能充分利用不同特征对语义类别的区分性。决策层融合指首先单独利用每种特征进行识别,然后综合所有识别结果进行最终判定。考虑到不同特征对于各种语义类别的视频具有不同强弱的区分能力,如何有效地组合各类视频特征对于提高视频分类的性能具有十分重要的意义。目前对于将多种特征进行融合采取的方法都较为简单,并不能很好地利用多种特征的优势,也不能保证进行特征融合后的效果比单特征要好。这就导致了对媒体资源的分类器进行训练时的训练效率低。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种媒体资源的分类器训练方法及装置,以至少解决相关技术中对媒体资源的分类器进行训练时的训练效率低的技术问题。根据本专利技术实施例的一个方面,提供了一种媒体资源的分类器训练方法,包括:从媒体资源样本集合中获取媒体资源特征数据和媒体资源分类信息,其中,所述媒体资源样本集合包括多个媒体资源样本,所述媒体资源特征数据中携带有媒体资源样本对应的多种媒体资源特征,所述媒体资源分类信息用于指示所述媒体资源样本集合中每个媒体资源样本的分类;根据预设的分布信息和所述媒体资源分类信息确定所述媒体资源特征数据中每种媒体资源特征对应的核权重,其中,所述预设的分布信息用于指示所述核权重服从的预设的分布;根据所述核权重和所述每种媒体资源特征对应的核函数获取合成核函数,其中,所述每种媒体资源特征对应的核函数用于指示所述每种媒体资源特征在所述媒体资源样本集合的特征空间中的映射关系;根据所述合成核函数对媒体资源的分类器进行训练。根据本专利技术实施例的另一方面,还提供了一种媒体资源的分类器训练装置,包括:第一获取模块,用于从媒体资源样本集合中获取媒体资源特征数据和媒体资源分类信息,其中,所述媒体资源样本集合包括多个媒体资源样本,所述媒体资源特征数据中携带有媒体资源样本对应的多种媒体资源特征,所述媒体资源分类信息用于指示所述媒体资源样本集合中每个媒体资源样本的分类;确定模块,用于根据预设的分布信息和所述媒体资源分类信息确定所述媒体资源特征数据中每种媒体资源特征对应的核权重,其中,所述预设的分布信息用于指示所述核权重服从的预设的分布;第二获取模块,用于根据所述核权重和所述每种媒体资源特征对应的核函数获取合成核函数,其中,所述每种媒体资源特征对应的核函数用于指示所述每种媒体资源特征在所述媒体资源样本集合的特征空间中的映射关系;训练模块,用于根据所述合成核函数对媒体资源的分类器进行训练。在本专利技术实施例中,从媒体资源样本集合中获取媒体资源特征数据和媒体资源分类信息,其中,媒体资源样本集合包括多个媒体资源样本,媒体资源特征数据中携带有媒体资源样本对应的多种媒体资源特征,媒体资源分类信息用于指示媒体资源样本集合中每个媒体资源样本的分类;根据预设的分布信息和媒体资源分类信息确定媒体资源特征数据中每种媒体资源特征对应的核权重,其中,预设的分布信息用于指示核权重服从的预设的分布;根据核权重和每种媒体资源特征对应的核函数获取合成核函数,其中,每种媒体资源特征对应的核函数用于指示每种媒体资源特征在媒体资源样本集合的特征空间中的映射关系;根据合成核函数对媒体资源的分类器进行训练。也就是说,利用预设的分布信息以及从媒体资源样本集合中获取的媒体资源分类信息为每种媒体资源特征确定核权重,能够自动的衡量每一种媒体资源特征的重要性,针对每种媒体资源特征的重要性分配不同的核权重,从而使得根据核权重和核函数获取到的合成核函数中能够体现出每种媒体资源特征对于合成核函数的不同的贡献,在利用该合成核函数训练媒体资源的分类器,从而提高对媒体资源的分类器进行训练时的训练效率,获得更高的分类精度,进而克服相关技术中对媒体资源的分类器进行训练时的训练效率低的问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种可选的媒体资源的分类器训练方法的应用环境示意图;图2是根据本专利技术实施例的一种可选的媒体资源的分类器训练方法的示意图;图3是根据本专利技术实施例的一种可选的媒体资源的分类器训练方法中多核学习参数的概率的示意图;图4是根据本专利技术可选示例的一种可选的媒体资源的分类器训练方法中获取合成核权重的示意图;图5是根据本专利技术实施例的一种可选的媒体资源的分类器训练装置的示意图;图6是根据本专利技术实施例的一种可选的媒体资源的分类器训练方法的应用场景示意图;以及图7是根据本专利技术实施例的一种可选的媒体资源的分类器训练设备的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1在本专利技术实施例中,提供了一种上述媒体资源的分类器训练方法的实施例。作为一种可选的实施方式,该媒体资源的分类器训练方法可以但不限于应用于如图1所示的应用环境中,服务器102,用于从媒体资源样本集合中获取媒体资源特征数据和媒体资源分类信息,根据预设的分布信息和媒体资源分类信息确定媒体资源特征数据中每种媒体资源特征对应的核权重,根据核权重和每种媒体资源特征对应的核函数获取合成核函数,根据合成核函数对媒体资源的分类器进行训练;其中,媒体资源样本集合包括多个媒体资源样本,媒体资源特征数据中携带有媒体资源样本对应的多种媒体资源特征,媒体资源分类信息用于指示媒体资源样本集合中每个媒体资源样本的分类,预设的分布信息用于指示核权重服从的预设的分布,每种媒体资源特征对应的核函数用于指示每种媒体资源特征在媒体资源样本集合的特征空间中的映射关系。在本实施例中,服务器102利用预设的分布信息以及从媒体资源样本集合中获取的媒体资源分类信息为每种媒体资源特征确本文档来自技高网
...

【技术保护点】
1.一种媒体资源的分类器训练方法,其特征在于,包括:从媒体资源样本集合中获取媒体资源特征数据和媒体资源分类信息,其中,所述媒体资源样本集合包括多个媒体资源样本,所述媒体资源特征数据中携带有媒体资源样本对应的多种媒体资源特征,所述媒体资源分类信息用于指示所述媒体资源样本集合中每个媒体资源样本的分类;根据预设的分布信息和所述媒体资源分类信息确定所述媒体资源特征数据中每种媒体资源特征对应的核权重,其中,所述预设的分布信息用于指示所述核权重服从的预设的分布;根据所述核权重和所述每种媒体资源特征对应的核函数获取合成核函数,其中,所述每种媒体资源特征对应的核函数用于指示所述每种媒体资源特征在所述媒体资源样本集合的特征空间中的映射关系;根据所述合成核函数对媒体资源的分类器进行训练。

【技术特征摘要】
1.一种媒体资源的分类器训练方法,其特征在于,包括:从媒体资源样本集合中获取媒体资源特征数据和媒体资源分类信息,其中,所述媒体资源样本集合包括多个媒体资源样本,所述媒体资源特征数据中携带有媒体资源样本对应的多种媒体资源特征,所述媒体资源分类信息用于指示所述媒体资源样本集合中每个媒体资源样本的分类;根据预设的分布信息和所述媒体资源分类信息确定所述媒体资源特征数据中每种媒体资源特征对应的核权重,其中,所述预设的分布信息用于指示所述核权重服从的预设的分布;根据所述核权重和所述每种媒体资源特征对应的核函数获取合成核函数,其中,所述每种媒体资源特征对应的核函数用于指示所述每种媒体资源特征在所述媒体资源样本集合的特征空间中的映射关系;根据所述合成核函数对媒体资源的分类器进行训练。2.根据权利要求1所述的方法,其特征在于,根据所述预设的分布信息和所述媒体资源分类信息确定所述媒体资源特征数据中每种媒体资源特征对应的所述核权重包括:按照所述预设的分布信息对所述媒体资源特征数据进行采样,得到采样结果;根据所述采样结果与所述媒体资源分类信息推断所述核权重的后验信息;根据所述后验信息确定所述核权重。3.根据权利要求1所述的方法,其特征在于,根据所述核权重和所述每种媒体资源特征对应的所述核函数获取所述合成核函数包括:获取所述每种媒体资源特征对应的所述核函数;根据所述核权重确定所述每种媒体资源特征对应的所述核函数的加权和,得到所述合成核函数。4.根据权利要求3所述的方法,其特征在于,获取所述每种媒体资源特征对应的所述核函数包括:从所述媒体资源样本集合中获取多个媒体资源特征集合,其中,所述媒体资源特征集合中包括所述多种媒体资源特征中的一种媒体资源特征;分别对所述多个媒体资源特征集合进行训练;根据训练结果确定所述每种媒体资源特征对应的所述核函数。5.根据权利要求1所述的方法,其特征在于,所述媒体资源样本包括视频资源样本,其中,从所述媒体资源样本集合中获取媒体资源特征数据包括:从所述视频资源样本中提取关键帧;根据预设算法从所述关键帧中获取所述媒体资源特征数据,其中,所述媒体资源特征数据包括以下至少之一:表观特征数据、运动特征数据、声音特征数据。6.根据权利要求1至5中任一项所述的方法,其特征在于,在根据所述合成核函数对媒体资源的分类器进行训练之后,所述方法还包括:将接收到的待分类的媒体资源输入所述媒体资源的分类器;接收所述媒体资源的分类器输出的所述待分类的媒体资源对应的类别标识,其中,所述类别标识用于指示所述待分类的媒...

【专利技术属性】
技术研发人员:原春锋
申请(专利权)人:腾讯科技深圳有限公司中国科学院自动化研究所
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1