一种舆情事件的信息提取方法、设备和存储介质技术

技术编号:34246145 阅读:32 留言:0更新日期:2022-07-24 10:25
本申请提供一种舆情事件的信息提取方法、设备和存储介质,该方法可以包括:获取舆情问题和舆情文本,并分别生成所述舆情问题对应的问题句特征向量、所述舆情文本所含句子对应的文本句特征向量;通过自注意力机制对输入进行编码及特征提取,得到的输出包含优化后文本句特征向量;确定每一优化后文本句特征向量在所述舆情文本中对应的句子所含的词,并根据每一优化后文本句特征向量对相应句子所含各个文本词对应的文本词特征向量进行优化,得到优化后文本词特征向量;根据所述优化后文本词特征向量,从所述舆情文本中预测出所述舆情问题的答案。通过本申请的技术方案,可以从舆情文本中准确、高效地提取出针对舆情问题的答案。高效地提取出针对舆情问题的答案。高效地提取出针对舆情问题的答案。

An information extraction method, device and storage medium for public opinion events

【技术实现步骤摘要】
一种舆情事件的信息提取方法、设备和存储介质


[0001]本申请一个或多个实施例涉及互联网
,尤其涉及一种舆情事件的信息提取方法、设备和存储介质。

技术介绍

[0002]在大数据时代下,网络舆情的价值密度更低、传播速度更快,同时随着自媒体行业的兴起和队伍的不断扩大,舆情环境越来越复杂。舆情事件的产生一般由网民发布一个话题或者观点诱发的,而每一个网络信息的接受者又可能成为新的信息发布者,从而导致舆情事件的进一步发散。舆情事件反映着群众对社会中的各种现象和问题所表达出来的意见总和,当群众的意见得不到有效回应时,会导致事件的进一步发酵。舆情事件由于缺乏正确的引导和解决,且部门之间的信息传递的滞后,容易激化民众的情绪,演变成社会关注的热点。
[0003]在相关技术中,提取舆情事件的信息是依赖构建规则实现的。通过人为经验穷举要素,对收集到的舆情进行标签分类,从而提取到目标信息。舆情事件包含的要素越多,分类所需的标签就越多,服务器存储的数据量就越大。此外,舆情事件的描述千奇百怪,同一个规则并不适用于所有舆情事件,这使得提取的舆情信息准确性不高。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种舆情事件的信息提取方法,其特征在于,该方法包括:获取舆情问题和舆情文本,并分别生成所述舆情问题对应的问题句特征向量、所述舆情文本所含句子对应的文本句特征向量;通过自注意力机制对输入进行编码及特征提取,该输入包含所述问题句特征向量和所述文本句特征向量,且得到的输出包含优化后文本句特征向量;确定每一优化后文本句特征向量在所述舆情文本中对应的句子所含的词,并根据每一优化后文本句特征向量对相应句子所含各个文本词对应的文本词特征向量进行优化,得到优化后文本词特征向量;根据所述优化后文本词特征向量,从所述舆情文本中预测出所述舆情问题的答案。2.根据权利要求1的方法,其特征在于,所述分别生成所述舆情问题对应的问题句特征向量、所述舆情文本所含句子对应的文本句特征向量,包括:分别对所述舆情问题和所述舆情文本进行分词,并对得到的词分别进行向量转换,生成相应的问题词特征向量和文本词特征向量;根据所述问题词特征向量生成所述问题句特征向量,以及根据所述文本词特征向量生成所述文本句特征向量。3.根据权利要求2的方法,其特征在于,所述方法还包括:根据所述文本句特征向量和/或所述优化后文本句特征向量对所述文本词特征向量进行微调;所述根据每一优化后文本句特征向量对相应句子所含各个文本词对应的文本词特征向量进行优化,包括:根据每一优化后文本句特征向量对相应句子所含各个文本词对应的微调后的文本词特征向量进行优化。4.根据权利要求1的方法,其特征在于,所述方法还包括:根据所述优化后文本句特征向量预测所述舆情文本中是否存在包含所述舆情问题的答案的句子;以及,在所述输出还包含优化后问题句特征向量的情况下,根据所述优化后问题句特征向量预测针对所述舆情问题的答案类型;所述根据每一优化后句特征向量对相应句子所含各个词对应的词特征向量进行优化,包括:在预测出答案类型为详情类型且所述舆情文本中存在包含所述舆情问题的答案的句子的情况下,根据每一优化后句特征向量对相应句子所含各个词对应的词特征向量进行优化;所述方法还包括:在预测出答案类型为判断类型且所述舆情文本中存在包含所述舆情问题的答案的句子的情况下,输出预测的所述舆情文本中存在包含所述舆情问题的答案的句子并结束。5.根据权利要求1的方法,其特征在于,还包括:生成所述舆情文本所含的命名实体对应的命名实体特征向量;其中,所述输入还包含所述命名实体特征向量、输出还包含优化后命名实体特征向量,且所述优化后文本词特征向量还经由相应词在所述舆情文本中所属命名实体对应的优化后命名实体特征向量进行优化。6.根据权利要求1的方法,其特征在于,所述根据所述优化后文本词特征向量,从所述舆...

【专利技术属性】
技术研发人员:魏海巍刘凯张超华
申请(专利权)人:共道网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1