一种基于评分卡模型的多平台虚假信息识别方法及装置制造方法及图纸

技术编号:38508234 阅读:13 留言:0更新日期:2023-08-19 16:54
本发明专利技术提出了一种基于评分卡模型的多平台虚假信息识别方法及装置,方法包括:获取各自表征一主题的多组数据信息;基于数据信息与预先标记的数据信息的比对情况进行筛选;对当前数据信息进行排序以及填充处理;利用当前数据信息,构建评分卡模型,并确认每一主题对应的数据信息中,各个维度信息对数据信息危险程度的影响情况;利用当前构建的评分卡模型,对再次获取的表征一主题的数据信息进行识别处理。本发明专利技术应用评分卡模型,可基于同一主题的虚假信息识别,并且可以根据影响主题信息的多种因素,在不同的周期内,识别不同维度数据的影响因素权重。影响因素权重。影响因素权重。

【技术实现步骤摘要】
一种基于评分卡模型的多平台虚假信息识别方法及装置


[0001]本专利技术涉及网络虚假信息识别
,尤其涉一种基于评分卡模型的多平台虚假信息识别方法及装置。

技术介绍

[0002]当前,随着人工智能技术的长足进步和广泛应用,智能算法、社交机器人已经被用于信息的生成和传播,使得信息传播方式发生了重大变革,在进一步加快信息传播速度和加深信息传播影响的同时,也给虚假信息的制造和传播提供了温床。
[0003]近年来,以算法自动生成内容为手段,通过智能过滤分析向特定用户开展“靶向”锁定,传播具有诱导性的虚假信息,从而使社交媒体的跨国传播成为操纵他国国内社会舆论的“影响力机器”的事件层出不穷,逐渐意识到虚假信息对政治、经济和社会带来的恶劣影响。从海量信息中快速、精准识别诱导性强、隐蔽性高、传播速度快的虚假信息,是防止虚假信息带来恶劣影响的重要前提,近年来成为学术界和产业界关注的热点。而智能创作、信息茧房、定向认知诱导等手段的出现,使得虚假信息内容向多模态、定制化的模式转变,给虚假信息识别提出巨大挑战。
[0004]因此在现有方法机器学习方本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于评分卡模型的多平台虚假信息识别方法,其特征在于,包括:获取各自表征一主题的多组数据信息,其中,所述数据信息是从至少一外部数据平台所采集的;基于所述数据信息与预先标记的表征同一主题的数据信息的比对情况,对未标记的所述数据信息进行筛选;基于所述数据信息中的时间信息,对当前所述数据信息进行排序;对当前所述数据信息中的缺失值进行填充处理;利用当前所述数据信息,构建评分卡模型,并确认每一主题对应的所述数据信息中,各个维度信息对所述数据信息危险程度的影响情况;利用当前构建的评分卡模型,对再次获取的表征一主题的数据信息进行识别处理。2.根据权利要求1所述的基于评分卡模型的多平台虚假信息识别方法,其特征在于,所述数据信息,包括:序号、主题信息内容、发布者账号名称、发布时间、发布平台、采集时间、主题信息内容转发量、主体信息内容评论量。3.根据权利要求1所述的基于评分卡模型的多平台虚假信息识别方法,其特征在于,所述基于所述数据信息与预先标记的表征同一主题的数据信息的比对情况,对未标记的所述数据信息进行筛选,包括:基于所述数据信息与预先标记的表征同一主题的数据信息进行相似度对比;当所述相似度大于预先配置的相似度阈值时,保留当前的所述数据信息。4.根据权利要求2所述的基于评分卡模型的多平台虚假信息识别方法,其特征在于,所述时间信息,包括:发布时间和采集时间中的至少一种。5.根据权利要求1所述的基于评分卡模型的多平台虚假信息识别方法,其特征在于,所述对当前所述数据信息中的缺失值进行填充处理,包括:根据所述数据信息中的缺失值所对应的同维度数据的平均值、众数、最小值与最大值的差值,确定所述缺失值的取值范围,并对所述缺失值进行填充。6.根据权利要求1所述的基于评分卡模型的多平台虚假信息识别方法,其特征在于,所述利用当前所述数据信息,构建评分卡模型,并确认每一主题对应的所述数据信息中,各个维度信息对所述数据信息危险程度的影响情况,包括:利用当前的所述数据信息中的各维度作为待筛选变量,基于预设的变量筛选算法,对所述待筛选变量进行筛选,并确定所述待筛选变量对应的IV值;利用筛选后的当前...

【专利技术属性】
技术研发人员:吕东王立强李艺涛段东圣段运强井雅琪王媛媛王子涵任博雅佟玲玲李鹏霄侯炜王红兵艾政阳
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1