【技术实现步骤摘要】
本专利技术涉及数据处理,尤其涉及一种基于决策树的社交媒体虚假账号识别方法、装置及电子设备。
技术介绍
1、随着社交媒体的广泛应用,虚假账号(包括机器人账号、假冒账号和恶意账户)的数量急剧上升,虚假账号的存在不仅干扰了正常的用户互动,还对平台的内容质量以及用户体验造成了不良影响。
2、现有技术在虚假账号识别的过程中,存在如下问题:
3、1.识别准确度不足:现有方法通常依赖简单的行为特征或单一维度,无法捕捉虚假账号的复杂特征,导致误判率较高。
4、2.实时性差:虚假账号数量庞大,现有方法在大量数据的处理上效率较低,难以实现实时检测。
5、3.缺乏对动态行为的适应:虚假账号的行为特征随着时间不断变化,现有算法无法自适应地调整参数,难以跟上新型虚假账号的行为变化。
6、4.模型复杂性高:一些复杂的识别方法需要高昂的计算资源和模型训练时间,难以快速部署和应用。
7、上述问题成为需要解决的技术问题。
技术实现思路
1、有鉴于此,本
...【技术保护点】
1.一种基于决策树的社交媒体虚假账号识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述从社交媒体平台上收集目标用户的多维度行为数据DY,对收集到的行为数据进行数据清洗、数据去重以及数据标准化处理,得到标准数据DB,包括:
4.根据权利要求3所述的方法,其特征在于,所述通过特征提取函数Ft从标准数据DB中提取特征向量X,包括:
5.根据权利要求4所述的方法,其特征在于,所述计算数据集DB的熵H(DB),以及特征Zh、Xw、Sw、Nt的条件
...【技术特征摘要】
1.一种基于决策树的社交媒体虚假账号识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述从社交媒体平台上收集目标用户的多维度行为数据dy,对收集到的行为数据进行数据清洗、数据去重以及数据标准化处理,得到标准数据db,包括:
4.根据权利要求3所述的方法,其特征在于,所述通过特征提取函数ft从标准数据db中提取特征向量x,包括:
5.根据权利要求4所述的方法,其特征在于,所述计算数据集db的熵h(db),以及特征zh、xw、sw、nt的条件熵h(db∣zh)、h(db∣xw)、h(db∣sw)、h(db∣nt),基于熵h(db)以及条件熵h(db∣zh)、h(db∣xw)、h(db∣sw)、h(db∣nt)计算特征向量x的信息增益ig(db,x),包括:
6.根据权利要求5所述...
【专利技术属性】
技术研发人员:彭浩,寇振芳,李蕾,苗宇,纪啸峥,
申请(专利权)人:一网互通北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。