【技术实现步骤摘要】
基于事理图谱的企业舆情分析方法
[0001]本专利技术属于舆情分析
,具体涉及一种基于事理图谱的企业舆情分析方法。
技术介绍
[0002]企业舆情事件与公共舆情事件相比,具有针对性强、出现频率高、传播源不可控的特点。企业舆情一旦产生便很难溯源,并且会对企业造成持续性的影响。因此,需要提前对历史企业舆情事件进行规律分析和梳理,把握舆情的传播路径和演化方式,对舆情走势进行精准预测,最终实现舆情早知道早预防,为企业健康发展保驾护航。
[0003]从企业舆情的分析内容来讲,传统的企业舆情分析主要是针对舆情的内容和情感进行分析,如采用LDA模型进行主题提取;或者考虑舆情的演化路径,如采用Deffuant模型进行演化仿真;很少有对舆情事件及事件的趋势进行分析,而舆情事件的态势分析又往往利于管理者借助以往经验进行决策,传统舆情事件的分析借助规则或模式匹配以及传统机器学习方法,这种方式往往依赖人工的参与,含有一定的人为主观意愿,分析精度不高。
技术实现思路
[0004]本专利技术的目的是提供一种基于事理图谱的企 ...
【技术保护点】
【技术特征摘要】
1.基于事理图谱的企业舆情分析方法,其特征在于,包括以下步骤:步骤1、构建舆情事件库,将事件库作为数据集,数据集随机划分为训练集和验证集;步骤2、通过数据集搭建事件抽取模型和事件关系抽取模型,并通过验证集对事件抽取模型和事件关系抽取模型进行验证;步骤3、将步骤1的训练集输入步骤2验证后的事件抽取模型和事件关系抽取模型中,进行训练优化;步骤4,利用步骤3训练后的事件关系模型和事件关系抽取模型对企业舆情事件进行抽取得到事件触发词、事件关系、事件属性的三元组;步骤5,计算步骤4三元组事件的相似度,通过设定阈值的方式将符合阈值的相似事件进行泛化;步骤6,对步骤5中的泛化事件通过计算权重的方式得到事件的转移概率;步骤7,以泛化事件作为节点,事件转移概率作为边,基于Neo4j图数据库搭建企业舆情抽象事理图谱;步骤8,将待分析事件元组输入到企业舆情抽象事理图谱中进行匹配和查询,得到该事件之后发展的可能性。2.根据权利要求1所述的基于事理图谱的企业舆情分析方法,其特征在于,所述步骤1中构建舆情事件库通过爬虫将现有企业相关舆情文本进行抓取汇总,然后通过人工对文本进行清晰处理,清晰处理包括去符号、去重和去无关文本,再基于ACE2005标注模板对文本进行标注得到事件库。3.根据权利要求1所述的基于事理图谱的企业舆情分析方法,其特征在于,所述训练集与验证集划分比例为训练集:验证集=7:3。4.根据权利要求1所述的基于事理图谱的企业舆情分析方法,其特征在于,所述搭建事件抽取模型分为输入层、隐藏层和输出层三部分,输入层采用数据集中的字作为基本单元,利用Bert模型对字序列进行向量化表示;隐藏层采用双向长短时记忆网络对输入层中的文本向量进行进一步编码来获得文本的语序结构信息;输出层采用CRF层对标注进行约束,并采用BIO机制得到最终的标注结果。5.根据权利要求1所述的基于事理图谱的企业舆情分析方法,其特征在于,所述事件抽取模型验证过程为,设最大字符长度max_length为128,训练集的batch_size为16,验证集的batch_size为8,学习率为0.0001,采用Adam作为优化器,dropout设为0.3;通过准确率P、召回率R和调和平均数F值的评价指标来验证事件抽取模型的性能。6.根据权利要求1所述的基于事理图谱的企业舆情分析方法,其特征在于,所述搭建事件关系抽取模型分为显式关系抽取和隐式关系抽取;显式关系抽取将数据集中事件的因果关系或顺承关系作为匹配模式,通过匹配的方式找到其他相符的同一语义;隐式关系抽取分为输入层、隐式层和输...
【专利技术属性】
技术研发人员:原泽鹏,
申请(专利权)人:中铁云网信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。