分类方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:39259568 阅读:18 留言:0更新日期:2023-10-30 12:11
本申请提供了一种分类方法、装置、设备及计算机可读存储介质;包括:获取多个待分类对象的历史社交数据;对各个待分类对象的历史社交数据进行特征提取,得到所述各个待分类对象的社交网络特征和社交属性特征;对所述各个待分类对象的社交属性特征和对应的社交网络特征进行拼接处理,得到所述各个待分类对象的隐向量;对所述各个待分类对象的隐向量进行分类处理,得到所述各个待分类对象的分类结果。通过本申请,能够提升分类准确性。能够提升分类准确性。能够提升分类准确性。

【技术实现步骤摘要】
分类方法、装置、设备及计算机可读存储介质


[0001]本申请涉及识别分类技术,尤其涉及一种分类方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]随着科学技术的发展与进步,娱乐活动越来越丰富多彩,但在娱乐过程中,黑产通常会传播不良信息,来破坏健康文明的娱乐坏境,以达到自身利益变现的目的。
[0003]在相关技术中,针对黑产的识别是从内容出发,是以文本内容来建模,通过关键词或者正常匹配等无监督方式识别出平台中的黑产;或者是对黑产发言进行标注,以有监督的机器学习或者神经网络等模型进行黑产发言的分类。
[0004]由于黑产发言的文本内容隐晦,接近正常发言的文本内容,很难从内容上直接识别出黑产发言。并且黑产能够感知内容对抗识别,并会做出内容上的变化,从而绕过识别。

技术实现思路

[0005]本申请实施例提供一种分类方法、装置、计算机设备、计算机程序产品及计算机可读存储介质,能够提升分类准确性。
[0006]本申请实施例的技术方案是这样实现的:
[0007]本申请实施例提供一种分类方法,所述方法包本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种分类方法,其特征在于,所述方法包括:获取多个待分类对象的历史社交数据;对各个待分类对象的历史社交数据进行特征提取,得到所述各个待分类对象的社交网络特征和社交属性特征;对所述各个待分类对象的社交属性特征和对应的社交网络特征进行拼接处理,得到所述各个待分类对象的隐向量;对所述各个待分类对象的隐向量进行分类处理,得到所述各个待分类对象的分类结果。2.根据权利要求1中所述的方法,其特征在于,所述对所述各个待分类对象的隐向量进行分类处理,得到所述各个待分类对象的分类结果,包括:获取训练好的分类器,其中,所述训练好的分类器在训练过程中采用的损失函数能够提高置信度低于置信度阈值的训练样本对损失值的影响权重;利用所述训练好的分类器对所述各个待分类对象的隐向量进行分类处理,得到所述各个待分类对象的分类结果。3.根据权利要求2中所述的方法,其特征在于,所述方法还包括:获取分类器、预设的损失函数、训练样本和所述训练样本的标签信息;利用所述分类器对所述训练样本进行预测处理,得到所述训练样本的预测信息;基于所述损失函数确定所述标签信息与所述预测信息之间的损失值,其中,利用所述损失函数能够提高置信度低于置信度阈值的训练样本对损失值的影响权重;利用所述损失值对所述分类器进行反向传播训练,得到训练好的分类器。4.根据权利要求1中所述的方法,其特征在于,所述对各个待分类对象的历史社交数据进行特征提取,得到所述各个待分类对象的社交网络特征和社交属性特征,包括:基于所述各个待分类对象的历史社交数据构建图网络,其中,所述各个待分类对象对应所述图网络中的节点;对所述图网络中的各个节点进行图向量化处理,得到所述各个节点对应的待分类对象的初始表示向量;基于所述各个待分类对象的初始表示向量确定所述各个待分类对象的社交网络特征;从所述各个待分类对象的历史社交数据中获取目标社交数据,并基于目标社交数据确定各个待分类对象的社交属性特征。5.根据权利要求4中所述的方法,其特征在于,所述对所述图网络中的各个节点进行图向量化处理,得到所述各个节点对应的待分类对象的初始表示向量,包括:基于第i采样概率对所述图网络中的i节点进行采样处理,得到所述第i节点的近邻序列,其中,i大于或者等于1,且小于或者等于M,M为所述图网络中节点的总数量;基于所述第i节点和所述第i节点的近邻序列,确定目标概率;基于所述目标概率对所述第i节点的近邻序列中的各个节点的当前表示向量进行更新处理,直至所述目标概率取值最大,得到所述第i节点的近邻序列中的各个节点的初始表示向量;...

【专利技术属性】
技术研发人员:王梦秋王摘星丁朝江彩霞王阔毛伟陈观钦
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1