基于决策树的社交媒体虚假账号识别方法及装置制造方法及图纸

技术编号:43857891 阅读:35 留言:0更新日期:2024-12-31 18:47
本发明专利技术实施例中提供了一种基于决策树的社交媒体虚假账号识别方法、装置及电子设备,属于数据处理技术领域,该方法包括:对收集到的行为数据进行数据清洗、数据去重以及数据标准化处理,得到标准数据DB;通过特征提取函数Ft从标准数据DB中提取特征向量X,计算数据集DB的熵H(DB),以及特征Zh、Xw、Sw、Nt的条件熵;基于根节点的特征值,将所述标准数据划分为多个子集Dz;基于特征向量Xn、决策树DT以及预设的分类函数Fc,生成新用户的行为数据Dn所对应的预测结果y=Fc(DT,Xn)。本发明专利技术能够提升社交媒体虚假账号识别的准确度。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种基于决策树的社交媒体虚假账号识别方法、装置及电子设备。


技术介绍

1、随着社交媒体的广泛应用,虚假账号(包括机器人账号、假冒账号和恶意账户)的数量急剧上升,虚假账号的存在不仅干扰了正常的用户互动,还对平台的内容质量以及用户体验造成了不良影响。

2、现有技术在虚假账号识别的过程中,存在如下问题:

3、1.识别准确度不足:现有方法通常依赖简单的行为特征或单一维度,无法捕捉虚假账号的复杂特征,导致误判率较高。

4、2.实时性差:虚假账号数量庞大,现有方法在大量数据的处理上效率较低,难以实现实时检测。

5、3.缺乏对动态行为的适应:虚假账号的行为特征随着时间不断变化,现有算法无法自适应地调整参数,难以跟上新型虚假账号的行为变化。

6、4.模型复杂性高:一些复杂的识别方法需要高昂的计算资源和模型训练时间,难以快速部署和应用。

7、上述问题成为需要解决的技术问题。


技术实现思路

1、有鉴于此,本专利技术实施例提供了本文档来自技高网...

【技术保护点】

1.一种基于决策树的社交媒体虚假账号识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述从社交媒体平台上收集目标用户的多维度行为数据DY,对收集到的行为数据进行数据清洗、数据去重以及数据标准化处理,得到标准数据DB,包括:

4.根据权利要求3所述的方法,其特征在于,所述通过特征提取函数Ft从标准数据DB中提取特征向量X,包括:

5.根据权利要求4所述的方法,其特征在于,所述计算数据集DB的熵H(DB),以及特征Zh、Xw、Sw、Nt的条件熵H(DB∣Zh)、...

【技术特征摘要】

1.一种基于决策树的社交媒体虚假账号识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,所述从社交媒体平台上收集目标用户的多维度行为数据dy,对收集到的行为数据进行数据清洗、数据去重以及数据标准化处理,得到标准数据db,包括:

4.根据权利要求3所述的方法,其特征在于,所述通过特征提取函数ft从标准数据db中提取特征向量x,包括:

5.根据权利要求4所述的方法,其特征在于,所述计算数据集db的熵h(db),以及特征zh、xw、sw、nt的条件熵h(db∣zh)、h(db∣xw)、h(db∣sw)、h(db∣nt),基于熵h(db)以及条件熵h(db∣zh)、h(db∣xw)、h(db∣sw)、h(db∣nt)计算特征向量x的信息增益ig(db,x),包括:

6.根据权利要求5所述...

【专利技术属性】
技术研发人员:彭浩寇振芳李蕾苗宇纪啸峥
申请(专利权)人:一网互通北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1