协同舆论欺诈检测方法和装置制造方法及图纸

技术编号:22166793 阅读:23 留言:0更新日期:2019-09-21 10:31
本申请涉及一种协同舆论欺诈检测方法、装置、计算机设备和存储介质。所述方法包括:提取用户信息和舆论事件对应事件信息,根据用户信息和事件信息,利用预先设置的节点框架,构建二部网络,根据用户节点以及事件节点,确定用于描述用户的显式向量表示,根据二部网络中通过随机游走提取的事件路径集合和用户路径集合,确定用于描述用户的隐式向量表示,根据显式向量表示、隐式向量表示以及预先设置的分类模型,对用户进行分类,根据分类结果确定协同舆论欺诈用户。采用本方法能够准确检测协同舆论欺诈。

Detection Method and Device of Cooperative Public Opinion Fraud

【技术实现步骤摘要】
协同舆论欺诈检测方法和装置
本申请涉及计算机
,特别是涉及一种协同舆论欺诈检测方法和装置。
技术介绍
随着社交媒体的日益发展壮大,人们越来越多的受到社交媒体上的舆论影响。因此,社交媒体内容的可靠性也变得非常重要,并受到了越来越多的关注。然而,社交媒体中往往存在一些群体,合作发布虚假的社会舆论,以期获得巨大的利益和名誉。这些虚假舆论严重的影响着人们的决策和社交媒体的安全性。因此,如何有效地检测出这些合作发布虚假舆论的欺诈者十分重要。现有的欺诈者检测方法主要是基于内容和行为的,但检测协同欺诈者存在如下问题:(1)、欺诈者群体往往会合作发布一些内容,以此来主导社会舆论的方向,因此这些内容相比正常舆论而言,并不一定具有明显的异常性。从用户发布的内容出发分析欺诈者特点很可能会失效,甚至导致错误的分析结果。(2)、专业的协同欺诈者经常会通过模仿正常用户的行为来发布评论,以此逃避审查。因此,现有的协同欺诈者检测也不能准确的对协同欺诈者进行检测。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够解决先有协同欺诈检测不准确问题的协同舆论欺诈检测方法、装置、计算机设备和存储介质。一种协同舆论欺诈检测方法,所述方法包括:提取用户信息和舆论事件对应事件信息,根据所述用户信息和所述事件信息,利用预先设置的节点框架,构建二部网络;所述二部网络中包括用于表示用户信息的用户节点以及表示事件信息的事件节点;所述用户节点与所述事件节点相连构成二部网络中的交互边;根据所述用户节点以及所述事件节点,确定用于描述用户的显式向量表示;根据所述二部网络中通过随机游走提取的事件路径集合和用户路径集合,确定用于描述用户的隐式向量表示;根据所述显式向量表示、所述隐式向量表示以及预先设置的分类模型,对用户进行分类,根据分类结果确定协同舆论欺诈用户。在其中一个实施例中,还包括:获取用户节点对应的交互边,根据所述交互边确定描述所述用户对所述舆论事件关联度的第一关联模型;获取用户节点的用户空间向量和事件节点对应的事件空间向量,将所述用户空间向量和所述事件空间向量输入预先设置阈值函数,得到描述所述用户对所述舆论事件关联度的第二关联模型;根据所述第一关联模型和所述第二关联模型,确定用于描述用户的显式向量表示。在其中一个实施例中,还包括:通过预先设置的优化算法,计算所述第一关联模型和所述第二关联函数的差异信息;以所述差异信息最小为约束条件,对所述用户空间向量以及所述事件空间向量进行优化,得到用于描述用户的显式向量表示。在其中一个实施例中,还包括:采用随机游走方式对所述二部网络进行节点提取,得到事件节点序列和用户节点序列;根据所述事件节点序列确定事件路径集合,根据所述用户节点序列得到用户路径集合;以给定用户节点存在隐式用户节点概率最大为约束条件,在所述用户路径集合中进行概率计算得到第一隐式向量表示;以给定事件节点存在隐式事件节点概率最大为约束条件,在所述事件路径集合中进行概率计算得到第二隐式向量表示;根据所述第一隐式向量表示和所述第二隐式向量表示,得到隐式向量表示。在其中一个实施例中,还包括:根据任意两个用户节点存在连接到同一事件节点的交互边,建立两个用户节点之间的用户边,根据所述用户边建立用户网络;根据任意两个事件节点存在连接到同一用户节点的交互边,建立两个事件节点之间的事件边,根据所述事件边建立事件网络;所述用户网络和所述事件网络中节点的随机游走时对所述二部网络进行节点提取。在其中一个实施例中,还包括:根据所述显式向量表示和所述隐式向量表示的差值,得到将二部网络中用户信息嵌入到用户向量表示空间中的嵌入函数;根据所述嵌入函数,构建用户的表示集合;将所述用户表示集合输入预先设置的二叉树模型中,得到所述二叉树模型输出的每个用户预设范围内的第一用户集合;根据所述第一用户集合,得到用户的邻域密度和每个用户对应的所述第一用户集合组成的第二用户集合;其中,第一用户集合为第二用户集合中的元素。在其中一个实施例中,还包括:获取预先设置的第一权值和第二权值,用第一权值对所述显式向量表示进行加权,以及用第二权值对所述隐式向量表示进行加权;根据加权后的所述显式向量表示和加权后的所述隐式向量表示的差值,得到将二部网络中用户信息嵌入到用户向量表示空间中的嵌入函数。在其中一个实施例中,还包括:获取预先设置的异常密度阈值,依次检测所述第二用户集合中所述第一用户集合中每个用户对应的所述邻域密度是否大于所述异常密度阈值;若是,则确定所述第一用户集合中的用户为协同舆论欺诈用户。一种协同舆论欺诈检测装置,所述装置包括:网络构建模块,用于提取用户信息和舆论事件对应事件信息,根据所述用户信息和所述事件信息,利用预先设置的节点框架,构建二部网络;所述二部网络中包括用于表示用户信息的用户节点以及表示事件信息的事件节点;所述用户节点与所述事件节点相连构成二部网络中的交互边;显式表示确定模块,用于根据所述用户节点以及所述事件节点,确定用于描述用户的显式向量表示;隐式表示确定模块,用于根据所述二部网络中通过随机游走提取的事件路径集合和用户路径集合,确定用于描述用户的隐式向量表示;检测模块,用于根据所述显式向量表示、所述隐式向量表示以及预先设置的分类模型,对用户进行分类,根据分类结果确定协同舆论欺诈用户。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:提取用户信息和舆论事件对应事件信息,根据所述用户信息和所述事件信息,利用预先设置的节点框架,构建二部网络;所述二部网络中包括用于表示用户信息的用户节点以及表示事件信息的事件节点;所述用户节点与所述事件节点相连构成二部网络中的交互边;根据所述用户节点以及所述事件节点,确定用于描述用户的显式向量表示;根据所述二部网络中通过随机游走提取的事件路径集合和用户路径集合,确定用于描述用户的隐式向量表示;根据所述显式向量表示、所述隐式向量表示以及预先设置的分类模型,对用户进行分类,根据分类结果确定协同舆论欺诈用户。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:提取用户信息和舆论事件对应事件信息,根据所述用户信息和所述事件信息,利用预先设置的节点框架,构建二部网络;所述二部网络中包括用于表示用户信息的用户节点以及表示事件信息的事件节点;所述用户节点与所述事件节点相连构成二部网络中的交互边;根据所述用户节点以及所述事件节点,确定用于描述用户的显式向量表示;根据所述二部网络中通过随机游走提取的事件路径集合和用户路径集合,确定用于描述用户的隐式向量表示;根据所述显式向量表示、所述隐式向量表示以及预先设置的分类模型,对用户进行分类,根据分类结果确定协同舆论欺诈用户。上述协同舆论欺诈检测方法、装置、计算机设备和存储介质,通过节点框架对用户信息和事件信息进行提取,从而构建了二部网络,然后在二部网络中提取可以反映用户之间相互关系的显式向量表示和隐式向量表示,采用向量表示来表示用户,即增强了用户之前的联系,在进行最终分类时,可以得到准确的分类结果,从而提高协同舆论欺诈的准确性。附图说明图1为一个实施例中协同舆论欺诈检测方法的应用场景图;图2为一个实施例中协同舆论欺诈检测方法的流本文档来自技高网...

【技术保护点】
1.一种协同舆论欺诈检测方法,所述方法包括:提取用户信息和舆论事件对应事件信息,根据所述用户信息和所述事件信息,利用预先设置的节点框架,构建二部网络;所述二部网络中包括用于表示用户信息的用户节点以及表示事件信息的事件节点;所述用户节点与所述事件节点相连构成二部网络中的交互边;根据所述用户节点以及所述事件节点,确定用于描述用户的显式向量表示;根据所述二部网络中通过随机游走提取的事件路径集合和用户路径集合,确定用于描述用户的隐式向量表示;根据所述显式向量表示、所述隐式向量表示以及预先设置的分类模型,对用户进行分类,根据分类结果确定协同舆论欺诈用户。

【技术特征摘要】
1.一种协同舆论欺诈检测方法,所述方法包括:提取用户信息和舆论事件对应事件信息,根据所述用户信息和所述事件信息,利用预先设置的节点框架,构建二部网络;所述二部网络中包括用于表示用户信息的用户节点以及表示事件信息的事件节点;所述用户节点与所述事件节点相连构成二部网络中的交互边;根据所述用户节点以及所述事件节点,确定用于描述用户的显式向量表示;根据所述二部网络中通过随机游走提取的事件路径集合和用户路径集合,确定用于描述用户的隐式向量表示;根据所述显式向量表示、所述隐式向量表示以及预先设置的分类模型,对用户进行分类,根据分类结果确定协同舆论欺诈用户。2.根据权利要求1所述的方法,其特征在于,根据所述用户节点与事件节点,确定用于描述用户的显式向量表示,包括:获取用户节点对应的交互边,根据所述交互边确定描述所述用户对所述舆论事件关联度的第一关联模型;获取用户节点的用户空间向量和事件节点对应的事件空间向量,将所述用户空间向量和所述事件空间向量输入预先设置阈值函数,得到描述所述用户对所述舆论事件关联度的第二关联模型;根据所述第一关联模型和所述第二关联模型,确定用于描述用户的显式向量表示。3.根据权利要求2所述的方法,其特征在于,根据所述第一关联模型和所述第二关联模型,确定用于描述用户的显式向量表示,包括:通过预先设置的优化算法,计算所述第一关联模型和所述第二关联函数的差异信息;以所述差异信息最小为约束条件,对所述用户空间向量以及所述事件空间向量进行优化,得到用于描述用户的显式向量表示。4.根据权利要求1所述的方法,其特征在于,根据所述二部网络中通过随机游走提取的事件路径集合和用户路径集合,确定用于描述用户的隐式向量表示,包括:采用随机游走方式对所述二部网络进行节点提取,得到事件节点序列和用户节点序列;根据所述事件节点序列确定事件路径集合,根据所述用户节点序列得到用户路径集合;以给定用户节点存在隐式用户节点概率最大为约束条件,在所述用户路径集合中进行概率计算得到第一隐式向量表示;以给定事件节点存在隐式事件节点概率最大为约束条件,在所述事件路径集合中进行概率计算得到第二隐式向量表示;根据所述第一隐式向量表示和所述第二隐式向量表示,得到用于描述用户的隐式向量表示。5.根据权利要求4所述的方法,其特征在于,在采用随机游走方式对所述二部网络进行节点提取,得到事件节点序列和用户节点序列之前,还包括:根据任意两个用户节点存在连接到同一事件节点的交互边,建立两个用户节点之间的用户边,根据所述用户边建立用户网络;根据任意两个事件节点存在连接到同一用户节点的交互边,建立两个事件节点之间的事件边,根据所述事件...

【专利技术属性】
技术研发人员:赵文涛朱成璋刘丹李倩李盼
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1