当前位置: 首页 > 专利查询>国家计算机网络与信息安全管理中心河北分中心专利>正文

微博负面信息识别方法及装置制造方法及图纸

技术编号：39063249 阅读：11 留言：0更新日期：2023-10-12 19:55

本发明专利技术公开了微博负面信息识别方法及装置，涉及到信息识别方法技术领域，包括S1、识别微博信息中出现的负面关键词；S2、分析负面关键词的语义环境；S3、确定微博信息中出现的负面关键词及次数；S4、根据所述负面关键词及其次数确定负面评分；S5、若所述待识别微博信息评分达到预设阈值，将所述待识别微博信息判断为负面信息。该微博负面信息识别方法及装置，可以确定出所述待识别微博信息的负面评分，若所述待识别微博信息的负面评分大于或等于预设阈值，将所述待识别微博信息判断为负面信息，从而实现了通过负面关键词匹配的方式自动识别微博信息是否为负面信息，避免了人为因素的影响，提高了识别效率和稳定性。提高了识别效率和稳定性。提高了识别效率和稳定性。

全部详细技术资料下载

【技术实现步骤摘要】
微博负面信息识别方法及装置

[0001]本专利技术涉及信息识别方法
，特别涉及微博负面信息识别方法及装置。

技术介绍

[0002]微博是指一种基于用户关系信息分享、传播以及获取的通过关注机制分享简短实时信息的广播式的社交媒体、网络平台，微博允许用户通过Web、Wap、Mail、App、IM、SMS以及用户可以通过PC、手机等多种移动终端接入，以文字、图片、视频等多媒体形式，实现信息的即时分享、传播互动。
[0003]随着社会科技的发展，微博成为信息传递的一种重要载体，具有实时发布、传播速度快、影响面广、渠道多等特点，通过微博往往能够在第一时间获得信息，但微博信息可能是正面的也可能是负面的，因此如何进行负面信息识别成为亟需解决的问题。然而，微博新闻的数量非常巨大，很难通过简单的规则去准确判定微博信息的正负面，现有技术中，通常通过一些关键词匹配或者简单机器学习的方法来判别负面新闻，但是该方案的准确率较低，并且人工维护成本高。
[0004]因此，专利技术微博负面信息识别方法及装置来解决上述问题很有必要。

技术实现思路

[0005]本专利技术的目的在于提供微博负面信息识别方法及装置，以解决上述
技术介绍
中提出的问题。
[0006]为实现上述目的，本专利技术提供如下技术方案：微博负面信息识别方法，所述方法包括以下步骤：
[0007]S1、识别微博信息中出现的负面关键词；
[0008]S2、分析负面关键词的语义环境；
[0009]S3、确定微博信息中出现的负面关...

【技术保护点】

【技术特征摘要】
1.微博负面信息识别方法，其特征在于，所述方法包括以下步骤：S1、识别微博信息中出现的负面关键词；S2、分析负面关键词的语义环境；S3、确定微博信息中出现的负面关键词及次数；S4、根据所述负面关键词及其次数确定负面评分；S5、若所述待识别微博信息评分达到预设阈值，将所述待识别微博信息判断为负面信息。2.根据权利要求1所述的微博负面信息识别方法，其特征在于，针对所述负面关键词中任意一个目标关键词，根据所述负面关键词以及出现次的数确定所述待识别微博信息的负面评分，包括：根据所述目标关键词的负面权重分和所述目标关键词的出现次数确定所述目标关键词对所述待识别微博信息的子负面评分；根据每个负面关键词的子负面评分计算所述待识别微博信息的负面评分。3.根据权利要求2所述的微博负面信息识别方法，其特征在于，所述目标关键词的负面权重分根据如下方式确定：根据所述目标关键词与第一样本集进行匹配，所述第一样本集包括已识别的多个负面信息和多个微博非负面信息；根据所述第一样本集中出现了所述目标关键词的负面信息的后验条件概率，以及所述第一样本集中负面信息的先验概率确定所述目标关键词的负面权重分。4.根据权利要求1所述的微博负面信息识别方法，其特征在于，所述预设阈值根据如下方式确定：获取第二样本集，所述第二样本集包括已识别的多个负面信息和多个微博非负面信息，以及所述多个负面信息和多个微博非负面信息的负面评分；根据标注模型，采用不同的识别阈值对第二样本集中的微博信息进行负面信息的识别；若目标识别阈值下的识别结果与所述第二样本集的实际结果间的符合度满足预设条件，将目标识别阈值作为所述预...

【专利技术属性】
技术研发人员：桂婷，梁泽，赵杨，
申请(专利权)人：国家计算机网络与信息安全管理中心河北分中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人