The present invention discloses a social media platform to identify false information, false information: sample set generation module against network using twin generative (SGAN:Siamese Generative Adversarial Network) model to construct and generate scale based on false information samples, and then through the unsupervised learning and supervised learning method combining the false level on the basis of the generated samples were labeled with false information. The learning module of false information off-line recognition is based on the depth learning technology to train the false information recognition and iteratively optimize the parameters of the depth recognition model. False information online identification module firstly used to explore use strategies to obtain new release candidate false information in information collection and real-time false identification and rating the false information on the candidate set information. Compared with the existing technology, the invention has the advantages of high accuracy, generalization ability and fast speed, and can be effectively applied to the fields of e-commerce, medical health, network information security and public opinion monitoring.
【技术实现步骤摘要】
一种社交媒体平台虚假信息识别方法
本专利技术涉及计算机应用
,尤其是涉及一种网络虚假信息的识别方法。
技术介绍
进入Web2.0时代,社交网络(SNS)的崛起为人们提供了高度自由分析信息和交流观点的重要平台-社交媒体平台,如Twitter、Facebook、YouTube、新浪微博和腾讯微博等。借助基于社交媒体平台上用户社交网络关系的信息分享、传播以及获取技术,可以使用户通过WEB、WAP以及各种客户端组建、加入不同的社区群组,从而较之传统的平面媒体、网络媒体等,获得更大程度和规模的信息,同时产生更为丰富的互动交流体验,增进用户的实际使用感受。正是凭借这种社交关系产生的特有的裂变式信息传播分享模式,社交媒体平台迅速席卷整个互联网,从政府、名人、明星,到普通民众,已经成为特有的用户群体网络汇集重要平台。社交媒体平台给我们工作和日常生活带来方便的同时,也产生了很多负面问题,特别是谣言和虚假信息众多,而且通过社交媒体平台,新鲜的消息不再以口耳相传的方式进行传播,通过网络传播的成本大大降低,很多媒体为了造成高影响力而雇佣水军进行转发,这样的转发不仅没有质量,而且容易 ...
【技术保护点】
一种社交媒体平台虚假信息识别方法,其特征在于,包括虚假信息样本集生成、虚假信息离线识别学习以及虚假信息在线识别三大步骤;一、虚假信息样本集生成步骤(1)主要包含两个阶段:第一阶段:基础虚假信息样本集构造;以现有带标签数据集中的真实信息样本集为输入,训练孪生生成式对抗网络(SGAN:Siamese Generative Adversarial Network)模型结构来构造并生成大规模的基础虚假信息样本集,基础虚假信息样本集中的数据样本是不带虚假等级标签的;SGAN模型结构由两个绝大部分参数共享的GAN模型部件构成,其中第一个GAN模型部件用来训练生成基础虚假信息样本,而第二 ...
【技术特征摘要】
1.一种社交媒体平台虚假信息识别方法,其特征在于,包括虚假信息样本集生成、虚假信息离线识别学习以及虚假信息在线识别三大步骤;一、虚假信息样本集生成步骤(1)主要包含两个阶段:第一阶段:基础虚假信息样本集构造;以现有带标签数据集中的真实信息样本集为输入,训练孪生生成式对抗网络(SGAN:SiameseGenerativeAdversarialNetwork)模型结构来构造并生成大规模的基础虚假信息样本集,基础虚假信息样本集中的数据样本是不带虚假等级标签的;SGAN模型结构由两个绝大部分参数共享的GAN模型部件构成,其中第一个GAN模型部件用来训练生成基础虚假信息样本,而第二个GAN模型部件用来训练识别基础虚假信息样本的主题类别;当SGAN模型结构训练完毕之后,最终只需要第一个GAN模型部件来生成大规模基础虚假信息样本集,而删除掉第二个GAN模型部件;第二阶段:基础虚假信息样本集评级;首先以社交媒体平台无标签数据为输入,通过无监督学习的方式来训练学习无标签数据的特征表示,在此基础上,以现有带标签数据集中带虚假级别的虚假信息样本集为输入,通过有监督学习的方式训练学习虚假信息样本的等级标记,然后利用该模型对所述虚假信...
【专利技术属性】
技术研发人员:黄震华,黄安忆,张银,庞一统,程久军,
申请(专利权)人:同济大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。