本发明专利技术提供了一种基于AIGC的舆情分析编排系统,其特征在于,包括数据采集模块、热度分析模块、情感分析模块和分析结果管理模块;所述数据采集模块用于采集网络信息数据并在网络信息数据中筛选出各关键词组和关键信息;所述热度分析模块用于根据关键信息分析所述各关键词组在网络中的影响热度;所述情感分析模块用于根据关键信息对各关键词组的舆情正负面进行分析,所述分析结果管理模块用于向用户可视化展示各关键词组热度和舆情影响;本发明专利技术采用多维度的情感分析方式,可最大程度上了解到用户的真实情感。到用户的真实情感。到用户的真实情感。
【技术实现步骤摘要】
一种基于AIGC的舆情分析编排系统
[0001]本专利技术涉及舆情分析
,尤其涉及一种基于AIGC的舆情分析编排系统。
技术介绍
[0002]随着互联网技术的不断发展,越来越多的用户在网上表达自己的观点和情感,如何高效快速的分析这些带有情感的观点和言论,已得到越来越多研究人员的关注,AIGC即AI Generated Content,是指利用人工智能技术来生成内容,AIGC技术可通过人工智能算法和训练的数据,对多模态的数据(如文本+图像+语音)进行分析处理生成所需新的内容,因而AIGC技术在舆情分析处理中具备广阔应用前景。
[0003]查阅相关已公开技术方案,如CN107016107A现有技术公开了一种舆情分析方法及系统,方法包括:每间隔预设时长从互联网获取包括第一预设特征词的文本信息;针对获取到的每一文本信息,提取该文本信息中的第二预设特征词,并统计得到一词频文档矩阵;根据所述词频文档矩阵在所述各第二预设特征词中选取合适的分类特征,并根据预设特征权重算法计算得到各分类特征的特征权重;将各分类特征的特征权重输入随机森林分类模型进行分类,得到该文本信息的情感倾向类别;在该文本信息的情感倾向类别为预设情感倾向类别时,将该文本信息推送至舆情展示终端;接收舆情展示终端发送的反馈信息,并根据反馈信息对第一预设特征词进行调整;另一种典型的公开号为CN114385890B的现有技术公开了一种互联网舆情监控系统,包括:数据采集模块,用于采集获取待监控的网络舆情信息;通信部或者传输接口,用于连接数据采集模块并将所述数据采集模块采集到的网络舆情信息发送至处理装置;处理装置具有:比较模块、分析模块、机器学习系统、主分类器、辅分类器、动态分配器、配置模块以及监测模块,通过将监控过程中所积累得到的关键词进行输出,以监控这些关键词是否能够成为热点话题的可能;上述方案均为基于互联网上单一文本信息对舆情进行分析监测,现如今随网络发展,网民在网络社交平台发表内容多样化,包括文本、图片、语音和视频等等,仅根据单一文本并不能保证分析舆情的准确性。
技术实现思路
[0004]本专利技术的目的在于,针对目前所存在的不足,提出了一种基于AIGC的舆情分析编排系统。
[0005]本专利技术采用如下技术方案:一种基于AIGC的舆情分析编排系统,其特征在于,包括数据采集模块、热度分析模块、情感分析模块和分析结果管理模块;所述数据采集模块用于采集网络信息数据并在网络信息数据中筛选出各关键词组和关键信息;所述热度分析模块用于根据关键信息分析所述各关键词组在网络中的影响热度;所述情感分析模块用于根据关键信息分析所述各关键词组的舆情正负面进行分析,所述分析结果管理模块用于根据所述影响热度和舆情正负面分析向用户可视化展示各关键词组热度和舆情影响;
所述数据采集模块包括采集子模块、预处理模块和预存储模块,所述采集子模块用于在设定的采集周期内对互联网上各数据平台上公开的网络信息数据进行采集,采集的所述网络信息数据包括通过各数据平台的搜索引擎获取的关键词组,所述预处理模块用于对网络信息数据进行清洗筛选获取关键信息,所述预存储模块用于存储关键词组和关键信息;进一步的,所述预处理模块包括数据清洗模块和分类模块,所述数据清洗模块用于去除网络信息数据中文本的无效信息,所述分类模块用于将去除无效信息后的网络信息数据根据关键词组进行分类生成关键信息,分类后生成的关键信息包括与各关键词组相关的文章文本、文章发布时间、文章评论文本、文章评论图片和文章评论点赞数量;进一步的,所述热度分析模块对各关键词组在网络中影响热度的分析包括对单数据平台上关键词组的热度分析和全网络平台上关键词组的热度分析,所述单数据平台上关键词组的热度分析如下:;其中,为某关键词组在第个数据平台上的热度值,为此关键词组相关的第篇文章的所有评论数量,设此关键词组下共有篇相关文章,满足,为此关键词组相关的第篇文章的所有评论点赞数,为该平台上所有关键词组相关评论数量,为当前时间,为第篇文章的发布时间,为第篇文章的发布时间与当前时间相差的时间,为采集周期,满足;所述全网络平台上关键词组的热度分析满足:;其中,为某关键词组在全网络平台上的热度值,设本系统共采集了个数据平台的网络信息数据,满足;为第个数据平台在全网络平台上的权重值;进一步的,所述情感分析模块包括第一分析模块、第二分析模块和分析结果融合模块,所述第一分析模块对文章文本、文章评论文本和文章评论图片进行图文融合生成融合特征,并对融合特征进行情感分析;所述第二分析模块根据文章文本和文章评论文本生成文本特征,并对文本特征进行情感分析;所述分析结果融合模块用于融合第一分析模块和第二分析模块的分析结果生成最终分析结果;进一步的,所述第一分析模块包括融合词获取单元,所述融合词获取单元用于获取文章文本和文章评论文本中的融合词,所述融合词包括程度副词及程度副词后一词汇、情感词及程度副词后一词汇、评价词及评价词后一词汇和否定词及否定词后一词汇;进一步的,所述分析结果管理模块向用户展示的各关键词组热度热度和舆情影响包括:展示各数据平台上按热度大小顺序排列的关键词组及其最终分析结果和全网络平台上按热度大小顺序排列的关键词组及其最终分析结果。
[0006]本专利技术所取得的有益效果是:本专利技术通过数据采集模块采集并筛选寻找出各数据平台上的关键词组,通过热度分析模块根据各个数据平台上关键词组相关的文本、评论和点赞数量对各个关键词组的热度进行分析,生成各关键词组在单数据平台和全网络平台上的热度排行;通过情感分析模块一方面对融合词与图片结合进行情感分析,另一方面对文本进行情感分析,并将两方面
的分析结果结合生成最终分析结果,保证了对于舆情分析的准确性;通过分析结果管理模块向用户可视化展示各关键词组热度和舆情影响,方便用户查看并做出相应举措。
附图说明
[0007]从以下结合附图的描述可以进一步理解本专利技术。图中的部件不一定按比例绘制,而是将重点放在示出实施例的原理上。在不同的视图中,相同的附图标记指定对应的部分。
[0008]图1为本专利技术整体模块示意图。
[0009]图2为本专利技术情感分析流程示意图。
具体实施方式
[0010]为了使得本专利技术的目的、技术方案及优点更加清楚明白,以下结合其实施例,对本专利技术进行进一步详细说明;应当理解,此处所描述的具体实施例仅用于解释本专利技术,并不用于限定本专利技术;对于本领域技术人员而言,在查阅以下详细描述之后,本实施例的其它系统、方法和/或特征将变得显而易见;旨在所有此类附加的系统、方法、特征和优点都包括在本说明书内;包括在本专利技术的范围内,并且受所附权利要求书的保护;在以下详细描述描述了所公开的实施例的另外的特征,并且这些特征根据以下将详细描述将是显而易见的。
[0011]本专利技术实施例的附图中相同或相似的标号对应相同或相似的部件;在本专利技术的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或组件本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于AIGC的舆情分析编排系统,其特征在于,包括数据采集模块、热度分析模块、情感分析模块和分析结果管理模块;所述数据采集模块用于采集网络信息数据并在网络信息数据中筛选出各关键词组和关键信息;所述热度分析模块用于根据关键信息分析所述各关键词组在网络中的影响热度;所述情感分析模块用于根据关键信息分析所述各关键词组的舆情正负面,所述分析结果管理模块用于根据所述影响热度和舆情正负面分析向用户可视化展示各关键词组热度和舆情影响;所述数据采集模块包括采集子模块、预处理模块和预存储模块,所述采集子模块用于在设定的采集周期内对互联网上各数据平台上公开的网络信息数据进行采集,采集的所述网络信息数据包括通过各数据平台的搜索引擎获取的关键词组,所述预处理模块用于对网络信息数据进行清洗筛选获取关键信息,所述预存储模块用于存储关键词组和关键信息。2.根据权利要求1所述的一种基于AIGC的舆情分析编排系统,其特征在于,所述预处理模块包括数据清洗模块和分类模块,所述数据清洗模块用于去除网络信息数据中文本的无效信息,所述分类模块用于将去除无效信息后的网络信息数据根据关键词组进行分类生成关键信息,分类后生成的关键信息包括与各关键词组相关的文章文本、文章发布时间、文章评论文本、文章评论图片和文章评论点赞数量。3.根据权利要求2所述的一种基于AIGC的舆情分析编排系统,其特征在于,所述热度分析模块对各关键词组在网络中影响热度的分析包括对单数据平台上关键词组的热度分析和全网络平台上关键词组的热度分析,所述单数据平台上关键词组的热度分析如下:;其中,为某关键词组在第个数据平台上的热度值,为此关键词...
【专利技术属性】
技术研发人员:张卫平,丁烨,吴茜,丁园,向荣,
申请(专利权)人:环球数科集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。