用于舆情分析的系统和方法技术方案

技术编号:28839229 阅读:37 留言:0更新日期:2021-06-11 23:37
本发明专利技术提供一种用于舆情分析的系统和方法。方法包含:取得多个情绪分析模型;接收训练数据以及舆情数据;根据训练数据产生选择模型;根据选择模型以及舆情数据而从多个情绪分析模型中选出至少一个情绪分析模型;以及使用至少一个情绪分析模型以根据舆情数据产生舆情分析结果。

【技术实现步骤摘要】
用于舆情分析的系统和方法
本专利技术涉及一种用于舆情分析的系统和方法。
技术介绍
舆情,特别是网络舆情,有数量大、来源多样等特征,通过舆情系统进行存储及分析,方能将数据进行应用,但由于舆情汇整于多来源,其内容长短及涉及情绪的叙事方式等特征也有所不同,难以通过单一情绪分析模型满足所有情绪判定的需求。
技术实现思路
本专利技术提供一种用于舆情分析的系统和方法,可提升舆情分析系统在情绪分析上的可靠度,优化舆情分析系统内舆情文本的情绪计算结果,经由集成运算一个以上情绪分析模型的舆情分析结果,优化整体舆情文本情绪分析的准确度。本专利技术的一种用于舆情分析的系统,包括处理器、存储介质以及收发器。存储介质存储多个模块。处理器耦接存储介质和收发器,并且接入和执行多个模块,其中多个模块包括数据库模块、数据收集模块以及运算模块。数据库模块存储多个情绪分析模型。数据收集模块通过收发器接收训练数据以及舆情数据。运算模块根据训练数据产生选择模型,根据选择模型以及舆情数据而从多个情绪分析模型中选出至少一个情绪分析模型,并且使用至少一个情绪分析模型以根据舆情数据产生舆情分析结果。在本专利技术的一实施例中,上述的运算模块基于多个情绪分析模型的数量而根据多元逻辑回归和二元逻辑回归中的一个建立对应于选择模型的回归模型,根据最大似然估计法产生对应于回归模型的参数,并且根据参数和回归模型建立选择模型。在本专利技术的一实施例中,上述的运算模块将舆情数据输入选择模型以产生分别对应于多个情绪分析模型的多个机率值。>在本专利技术的一实施例中,上述的运算模块响应于对应于至少一个情绪分析模型的机率值为多个机率值中的最大者而选择至少一个情绪分析模型。在本专利技术的一实施例中,上述的运算模块根据至少一个情绪分析模型产生对应于舆情数据的输出数据,并且以至少一个情绪分析模型的至少一个机率值为权重来产生舆情分析结果。在本专利技术的一实施例中,上述的舆情数据包括数据源、文本内容、文本长度、主回文类别以及用户回授信息中的至少一个。在本专利技术的一实施例中,上述的运算模块根据训练数据从情绪分析模型集合中选出多个情绪分析模型。在本专利技术的一实施例中,上述的多个情绪分析模型包括长短期记忆模型。在本专利技术的一实施例中,上述的至少一个情绪分析模型根据分支熵正规化变异从舆情资料的文本内容中取得词块,根据二项式检定判断词块的极性,并且基于最大熵模型而根据文本内容和极性产生舆情分析结果。本专利技术的一种用于舆情分析的方法,包括:取得多个情绪分析模型;接收训练数据以及舆情数据;根据训练数据产生选择模型;根据选择模型以及舆情数据而从多个情绪分析模型中选出至少一个情绪分析模型;以及使用至少一个情绪分析模型以根据舆情数据产生舆情分析结果。基于上述,本专利技术可产生用来选择的情绪分析模型的选择模型,并且基于舆情资料的不同而根据选择模型选出最适用的情绪分析模型,从而产生准确的舆情分析结果。附图说明包含附图以便进一步理解本专利技术,且附图并入本说明书中并构成本说明书的一部分。附图说明本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。图1根据本专利技术的实施例示出一种用于舆情分析的系统的示意图。图2根据本专利技术的实施例示出一种用于舆情分析的方法的流程图。具体实施方式现将详细地参考本专利技术的示范性实施例,示范性实施例的实例说明于附图中。只要有可能,相同附图标记在附图和说明书中用来表示相同或相似部分。图1根据本专利技术的实施例示出一种用于舆情分析的系统100的示意图。系统100可包括处理器110、存储介质120以及收发器130。处理器110例如是中央处理单元(centralprocessingunit,CPU),或是其他可程序化的一般用途或特殊用途的微控制单元(microcontrolunit,MCU)、微处理器(microprocessor)、数字信号处理器(digitalsignalprocessor,DSP)、可程序化控制器、特殊应用集成电路(applicationspecificintegratedcircuit,ASIC)、图形处理器(graphicsprocessingunit,GPU)、算数逻辑单元(arithmeticlogicunit,ALU)、复杂可程序逻辑装置(complexprogrammablelogicdevice,CPLD)、现场可程序化逻辑门阵列(fieldprogrammablegatearray,FPGA)或其他类似组件或上述组件的组合。处理器110可耦接至存储介质120以及收发器130,并且接入和执行存储于存储介质120中的多个模块和各种应用程序。存储介质120例如是任何型态的固定式或可移动式的随机接入内存(randomaccessmemory,RAM)、只读存储器(read-onlymemory,ROM)、闪存(flashmemory)、硬盘(harddiskdrive,HDD)、固态硬盘(solidstatedrive,SSD)或类似组件或上述组件的组合,而用于存储可由处理器110执行的多个模块或各种应用程序。在本实施例中,存储介质120可存储包括数据收集模块121、运算模块122以及数据库模块123等多个模块,其功能将于后续说明。收发器130以无线或有线的方式传送及接收信号。收发器130还可以执行例如低噪声放大、阻抗匹配、混频、向上或向下频率转换、滤波、放大以及类似的操作。系统100可接收舆情数据、对舆情数据进行分析并且产生对应舆情数据的舆情分析结果。舆情分析具有至少一个种特征,且该特征包括数据源(Xsource)、文本长度(Xlength)、主回文(Xmaintext/reply)、文本涉及的人、事、时、地、物情境特征(Xscenarios)、用户针对文本判断情绪的修正与建议(Xsystemfeedback)以及其他特征(Xotherfeatures)等,例如新闻网站内容、社群网站内容、论坛内容、APP内容及影音视频网站中的文字内容、长度(文章长度)、主文或留言类别、文本涉及的人、事、时、地、物情境(scenarios),及用户于系统的反馈因素等。为了适应具有各类型特征的舆情数据,数据库模块123可预存多个情绪分析模型,以针对不同类型的舆情数据进行分析。举例来说,长短期记忆(longshort-termmemory)模型对文本长度较长的舆情数据具有优异的分析准确率。因此,运算模块122可从可用的情绪分析模型的集合中选出长短期记忆模型,并将所选出的长短期记忆模型预存于数据库模块123之中。数据库模块123中的各个情绪分析模型例如是基于深度学习方法或基于统计学习方法所产生的,但本专利技术不限于此。举例来说,数据库模块123中的基于统计学习方法所产生的情绪分析模型可根据分支熵正规化变异(normalizedvariationofbranchingentropy,NVBE)从舆情资料的文本内容中取得词块,并且根据二项式检定(binomialtest)判断所述词块本文档来自技高网...

【技术保护点】
1.一种用于舆情分析的系统,其特征在于,包括:/n收发器;/n存储介质,存储多个模块;以及/n处理器,耦接所述存储介质和所述收发器,并且接入和执行所述多个模块,其中所述多个模块包括:/n数据库模块,存储多个情绪分析模型;/n数据收集模块,通过所述收发器接收训练数据以及舆情数据;以及/n运算模块,根据所述训练数据产生选择模型,根据所述选择模型以及所述舆情数据而从所述多个情绪分析模型中选出至少一个情绪分析模型,并且使用所述至少一个情绪分析模型以根据所述舆情资料产生舆情分析结果。/n

【技术特征摘要】
20191210 TW 1081451221.一种用于舆情分析的系统,其特征在于,包括:
收发器;
存储介质,存储多个模块;以及
处理器,耦接所述存储介质和所述收发器,并且接入和执行所述多个模块,其中所述多个模块包括:
数据库模块,存储多个情绪分析模型;
数据收集模块,通过所述收发器接收训练数据以及舆情数据;以及
运算模块,根据所述训练数据产生选择模型,根据所述选择模型以及所述舆情数据而从所述多个情绪分析模型中选出至少一个情绪分析模型,并且使用所述至少一个情绪分析模型以根据所述舆情资料产生舆情分析结果。


2.根据权利要求1所述的系统,其特征在于,所述运算模块基于所述多个情绪分析模型的数量而根据多元逻辑回归和二元逻辑回归中的一个建立对应于所述选择模型的回归模型,根据最大似然估计法产生对应于所述回归模型的参数,并且根据所述参数和所述回归模型建立所述选择模型。


3.根据权利要求2所述的系统,其特征在于,所述运算模块将所述舆情数据输入所述选择模型以产生分别对应于所述多个情绪分析模型的多个机率值。


4.根据权利要求3所述的系统,其特征在于,所述运算模块响应于对应于所述至少一个情绪分析模型的机率值为所述多个机率值中的最大者而选择所述至少一个情绪分析模型。...

【专利技术属性】
技术研发人员:杨百岳陈保清廖宜斌黄华泰
申请(专利权)人:中华电信股份有限公司
类型:发明
国别省市:中国台湾;71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1