一种自媒体文章隐患识别方法及系统技术方案

技术编号：21453956 阅读：16 留言：0更新日期：2019-06-26 04:47

本发明专利技术公开了一种自媒体文章隐患识别方法及系统。其方法包括以下步骤：识别自媒体文章的类型及设置敏感词；统计自媒体文章中敏感词出现次数；判断自媒体文章内容是否存在隐患。本发明专利技术的方法及系统解决了不能识别自媒体文章的隐患的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种自媒体文章隐患识别方法及系统
本专利技术属于即时通信
，特别是涉及一种自媒体文章隐患识别方法及系统。
技术介绍
在自媒体时代，自媒体文章不受审核，可以随意发布，很容易造成虚假信息、反动信息、造谣煽动信息的传播，不仅给社会带来危害，而且容易误导阅读者。需要一种能够识别自媒体文章的隐患的技术方案，为此提出一种自媒体文章隐患识别方法及系统。
技术实现思路
本专利技术所要解决的技术问题是不能识别自媒体文章的隐患的问题，提出一种自媒体文章隐患识别方法及系统。本专利技术依托即时通信软件系统，所述即时通信软件系统是指具有自媒体发布文章渠道的app或网页或小程序的任一项。本专利技术的自媒体文章隐患识别方法，包括以下步骤：识别自媒体文章的类型及设置敏感词：根据自媒体文章的发布方账号及文章格式识别该自媒体文章的文章类型；根据文章类型设置与文章类型对应的敏感词，统计敏感词数量，记为N，对敏感词进行编号，记为i，1≤i≤N，设置敏感词的权重值，记为pi。所述文章类型包括广告文章、新闻文章、励志文章、公共生活文章、健康保健文章、科普文章。所述与文章类型对应的敏感词是指使文章具有反动性质或造谣煽动性质或广告性质或虚假药品保健性质或骗点击性质的任一项或多项的字、词、句。统计自媒体文章中敏感词出现次数：识别自媒体文章的内容中出现的敏感词，计算敏感词出现的次数，用变量ni表示。判断自媒体文章内容是否存在隐患：根据即时通信数据中敏感词出现的次数ni及敏感词的权重值pi计算自媒体文章隐患参考值x；判断x是否大于事先设置的隐患参考阈值X，若是，则判定该自媒体文章内容存在隐患。所述自媒体文章...

【技术保护点】
1.一种自媒体文章隐患识别方法，其特征在于包括以下步骤：识别自媒体文章的类型及设置敏感词：根据自媒体文章的发布方账号及文章格式识别该自媒体文章的文章类型；根据文章类型设置与文章类型对应的敏感词，统计敏感词数量，记为N，对敏感词进行编号，记为i，1≤i≤N，设置敏感词的权重值，记为pi；统计自媒体文章中敏感词出现次数：识别自媒体文章的内容中出现的敏感词，计算敏感词出现的次数，用变量ni表示；判断自媒体文章内容是否存在隐患：根据自媒体文章中敏感词出现的次数ni及敏感词的权重值pi计算自媒体文章隐患参考值x；判断x是否大于事先设置的隐患参考阈值X，若是，则判定该自媒体文章内容存在隐患。

【技术特征摘要】
1.一种自媒体文章隐患识别方法，其特征在于包括以下步骤：识别自媒体文章的类型及设置敏感词：根据自媒体文章的发布方账号及文章格式识别该自媒体文章的文章类型；根据文章类型设置与文章类型对应的敏感词，统计敏感词数量，记为N，对敏感词进行编号，记为i，1≤i≤N，设置敏感词的权重值，记为pi；统计自媒体文章中敏感词出现次数：识别自媒体文章的内容中出现的敏感词，计算敏感词出现的次数，用变量ni表示；判断自媒体文章内容是否存在隐患：根据自媒体文章中敏感词出现的次数ni及敏感词的权重值pi计算自媒体文章隐患参考值x；判断x是否大于事先设置的隐患参考阈值X，若是，则判定该自媒体文章内容存在隐患。2.根据权利要求1所述的自媒体文章隐患识别方法，其特征在于，还包括步骤：判断自媒体账号与文章是否匹配；查询自媒体账号的历史文章类型，判断该自媒体文章类型是否属于发布量排名前M的文章类型，其中M值事先设置，若是，则判定自媒体账号与文章匹配，否则判定自媒体账号与文章不匹配，增大自媒体文章隐患参考值x。3.根据权利要求1所述的自媒体文章隐患识别方法，其特征在于，所述文章类型包括广告文章、新闻文章、励志文章、公共生活文章、健康保健文章、科普文章。4.根据权利要求1所述的自媒体文章隐患识别方法，其特征在于，所述与文章类型对应的敏感词是指使文章具有反动性质或造谣煽动性质或广告性质或虚假药品保健性质或骗点击性质的任一项或多项的字、词、句。5.根据权利要求1所述的自媒体文章隐患识别方法，其特征在于，所述自媒体文章隐患参考值其中k是事先设置的计算系数。6.一种自媒体文章隐患识别系统，其特征在于包括：一个或多个处理器；存储器；...

【专利技术属性】
技术研发人员：严军荣，卢玉龙，
申请(专利权)人：杭州乾博科技有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人