内容分类方法、装置和计算机可读存储介质制造方法及图纸

技术编号:39304464 阅读:25 留言:0更新日期:2023-11-12 15:53
本申请实施例公开了一种内容分类方法、装置和计算机可读存储介质;通过对内容样本集合中内容样本进行数据增广处理,得到至少两种增广类型的增广后内容样本;采用内容分类模型对第一增广内容样本和第二增广内容样本进行特征提取,得到第一内容特征和第二内容特征;基于第二内容特征在候选内容样本集合中识别出关联内容样本,并在关联内容样本中提取出关联内容特征;根据第一内容特征和关联内容特征组合正样本特征对,并根据第一内容特征和关联内容特征之间的关联程度确定正样本特征对对应的正样本属性;基于正样本属性和正样本特征对,对内容分类模型进行收敛,以基于训练后的内容分类模型对待分类内容进行分类处理。以此,提高内容分类准确性。提高内容分类准确性。提高内容分类准确性。

【技术实现步骤摘要】
内容分类方法、装置和计算机可读存储介质


[0001]本申请涉及互联网
,具体涉及一种内容分类方法、装置和计算机可读存储介质。

技术介绍

[0002]随着互联网技术的快速发展,人工智能技术也得到广泛应用。例如,采用机器学习模型对图像等内容进行分类等。在现有的内容分类方法中,往往通过构建正样本和负样本来对内容分类模型进行训练,从而基于训练好的内容分类模型对内容进行分类。
[0003]在对现有技术的研究和实践过程中发现,在现有的内容分类方法中,无法准确的构建模型训练所需的正样本和负样本,使得内容分类准确性较差。

技术实现思路

[0004]本申请实施例提供一种内容分类方法、装置和计算机可读存储介质,可以提高内容分类的准确性。
[0005]本申请实施例提供一种内容分类方法,包括:
[0006]获取内容样本集合,并对所述内容样本集合中内容样本进行数据增广处理,得到所述内容样本对应的至少两种增广类型的增广后内容样本;
[0007]采用内容分类模型对第一增广内容样本和第二增广内容样本进行特征提取,得到所述第本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种内容分类方法,其特征在于,包括:获取内容样本集合,并对所述内容样本集合中内容样本进行数据增广处理,得到所述内容样本对应的至少两种增广类型的增广后内容样本;采用内容分类模型对第一增广内容样本和第二增广内容样本进行特征提取,得到所述第一增广内容样本对应的第一内容特征和所述第二增广内容样本对应的第二内容特征,所述第一增广内容样本和所述第二增广内容样本为同一内容样本对应的不同增广类型下的增广后内容样本;基于所述第二内容特征在候选内容样本集合中识别出与所述第二增广内容样本匹配的关联内容样本,并在所述关联内容样本中提取出关联内容特征;根据所述第一内容特征和所述关联内容特征组合正样本特征对,并根据所述第一内容特征和所述关联内容特征之间的关联程度确定所述正样本特征对对应的正样本属性,所述正样本属性表征所述正样本特征对中关联内容特征匹配为所述正样本特征对中第一内容特征的正样本的程度;基于所述正样本属性和所述正样本特征对,对所述内容分类模型进行收敛,得到训练后的内容分类模型,以基于所述训练后的内容分类模型对待分类内容进行分类处理。2.如权利要求1所述的内容分类方法,其特征在于,所述根据所述第一内容特征和所述关联内容特征之间的关联程度确定所述正样本特征对对应的正样本属性,包括:对所述第一内容特征和所述关联内容特征进行交叉特征提取,得到所述第一内容特征和所述关联内容特征之间的内容关联特征;在所述内容关联特征中提取出所述正样本特征对对应的正样本属性。3.如权利要求2所述的内容分类方法,其特征在于,所述对所述第一内容特征和所述关联内容特征进行交叉特征提取,得到所述第一内容特征和所述关联内容特征之间的内容关联特征,包括:分别对所述第一内容特征和所述关联内容特征进行特征提取,得到所述第一内容特征对应的第一关联特征,以及所述关联内容特征对应的第二关联特征;基于所述第一关联特征以及所述第二关联特征,确定所述关联内容特征对应的关联权重;根据所述关联权重对所述关联内容特征进行特征融合,得到所述第一内容特征和所述关联内容特征之间的内容关联特征。4.如权利要求1所述的内容分类方法,其特征在于,所述基于所述正样本属性和所述正样本特征对,对所述内容分类模型进行收敛,包括:获取所述内容样本集合中每一内容样本对应的内容样本特征,并基于所述第一内容特征和所述内容样本特征组合负样本特征对;根据所述负样本特征对、所述正样本特征对以及所述正样本属性确定所述内容分类模型对应的对比损失信息;基于所述对比损失信息对所述内容分类模型进行收敛。5.如权利要求4所述的内容分类方法,其特征在于,所述根据所述负样本特征对、所述正样本特征对以及所述正样本属性确定所述内容分类模型对应的对比损失信息,包括:计算所述正样本特征对中特征之间的相似度,得到所述正样本特征对对应的正样本相
似度,并计算所述负样本特征对中特征之间的相似度,得到所...

【专利技术属性】
技术研发人员:宋奕兵
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1