【技术实现步骤摘要】
基于BERT的新冠肺炎疫情微博情感分析方法、设备、介质
本专利技术涉及舆情分析领域,具体而言,涉及基于BERT的新冠肺炎疫情微博情感分析方法、设备、介质。
技术介绍
新型冠状病毒肺炎作为一种急性呼吸道传染病,自爆发以来,一直受到国内外社会的广泛关注,也是社会舆论的焦点。新冠肺炎疫情已具有大流行特征,疫情的传播程度和严重性令人深感担忧。因此对国内疫情的整体情况以及相关的舆情发展态势进行分析有助于帮助人们更好地对当前疫情发展阶段以及对应的舆论响应有一个清晰直观的认知,并在此基础上做出决策。现有针对疫情舆情分析的研究主要集中在以下几个方面:主题挖掘、情感分析、舆情传播机制以及应对措施。针对主题挖掘方面,杨秀璋参考文献基于主题挖掘和情感分析的“新冠肺炎疫情”舆情分析研究中通过Python抓取2020年1月20日至3月22日期间共计1389篇人民网的疫情新闻,利用数据预处理、特征词提取、词云可视化展现与“新冠肺炎疫情”相关的热点主题,再采用共词分析、LDA模型、知识图谱和基于SnowNLP的情感分析算法挖掘舆情演化趋势 ...
【技术保护点】
1.一种基于BERT的新冠肺炎疫情微博情感分析方法,其特征在于,包括以下步骤:/nS1、获取与新冠肺炎疫情相关的微博舆情信息和疫情数据;/nS2、对所述微博舆情信息进行预处理,获取微博舆情数据;/nS3、通过语言模型对所述微博舆情数据进行情感分析,获取情感分析结果;/nS4、根据所述微博舆情信息和所述疫情数据对所述情感分析结果进行处理,获取新冠肺炎疫情的相关性分析。/n
【技术特征摘要】
1.一种基于BERT的新冠肺炎疫情微博情感分析方法,其特征在于,包括以下步骤:
S1、获取与新冠肺炎疫情相关的微博舆情信息和疫情数据;
S2、对所述微博舆情信息进行预处理,获取微博舆情数据;
S3、通过语言模型对所述微博舆情数据进行情感分析,获取情感分析结果;
S4、根据所述微博舆情信息和所述疫情数据对所述情感分析结果进行处理,获取新冠肺炎疫情的相关性分析。
2.根据权利要求1所述的方法,其特征在于,所述相关性分析包括疫情发展分析以及疫情情感分析;
所述疫情情感分析包括疫情爆发情况与舆情情绪变化的相关性分析。
3.根据权利要求2所述的方法,其特征在于,将所述舆情情绪变化拆解为:总评论数、积极评论数量、中性评论数量、消极评论数量,将所述疫情爆发情况拆解为:总新增病例数量、新增输入型病例数量、新增本地型病例数量;
根据所述舆情情绪变化和所述疫情爆发情况拆解的指标进行相关性检验。
4.根据权利要求3所述的方法,其特征在于,所述相关性检验具体包括:
依次对所述指标进行正态分布检验、计算相关系数、显著性检验。
5.根据权利要求1所述的方法,其特征在于,所述S1具体包括:
通过Python编写爬虫程序对互联网中的内容进行抓取,从中提取与新冠肺炎疫情有关的微博舆情信息和疫情数据;
并将所述微博舆情信息和所述疫情数据存储到数据库中。
6.根据权利要求1所述的方法,其特征在于,
所述疫情数据为区域内确诊、疑似、治愈、死亡病例数量统计,以及区域内输入病例统计;
所述微博舆情信息为在微博社交网站上与疫情相关的微博内容;
所述微博舆情信息包括评论信息,所述评论信息为网民在微博上针对新冠肺炎疫情发布的相关评论信息。
7.根据权利要求6所述的方法,其特征在于,所述评论信息带有情绪标签,根据所述情绪标签将所述评论信息分为:
积极评论信息:带有积极情感倾向的评论数据;
消极评论信息:带有消极情感倾向的评论数据;
中性评论信息:不带情感倾向的评论数据;
异常评论信息:情绪标签异常的评论数据。
8.根据权利要求1所述的方法,其特征在于,所述S2具体包括:
S21、对所述微博舆情信息进行数据感知和清洗,获取第一信息;
S22、对所述第一信息进行文本数据格式转换,获取第二信息;
S23、对所述第二信息进行分词处理,获取第三信息;
S24、对所述第三信息进行去停用词处理,获取第四信息;
S25、对所述第四信息进行特征转换处理,获取所述微博舆情数据。
9.根据权利要求8所述的方法,其特征...
【专利技术属性】
技术研发人员:蒋泓毅,刘薇,肖焯,姜青山,谭忠,陈会,
申请(专利权)人:中国科学院深圳先进技术研究院,厦门大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。