舆情事件处理方法、装置、处理设备及存储介质制造方法及图纸

技术编号:22689010 阅读:27 留言:0更新日期:2019-11-30 03:37
本申请提供一种舆情事件处理方法、装置、处理设备及存储介质,涉及数据处理技术领域。该方法包括:从舆情文本中抽取事件的元素信息;对事件的元素信息进行向量化,得到事件的单个向量化表示;根据事件的时间信息、及预设网络模型,对事件的单个向量化表示进行处理,得到事件序列的向量化表示。通过对所有单个舆情事件信息进行统一格式的向量化表示,可以降低数据的处理复杂度,然后对一系列事件的单个向量化表示按照时间顺序进行处理,得到事件序列的向量化表示,将多个高维的向量化表示转换为低维连续的向量化表示,可以提升数据的利用率,保证表达的完备性和正交性。

Handling methods, devices, processing equipment and storage media of public opinion events

The application provides a public opinion event processing method, device, processing equipment and storage medium, relating to the technical field of data processing. This method includes: extracting the element information of events from public opinion text; quantifying the element information of events to get a single vectorization representation of events; processing the single vectorization representation of events to get a vectorization representation of event sequence according to the time information of events and preset network model. It can reduce the complexity of data processing by providing a unified format of vectorization representation for all single public opinion event information. Then, it can process a series of single vectorization representations according to the time sequence to obtain the vectorization representation of event sequence. By converting multiple high-dimensional vectorization representations into low-dimensional continuous vectorization representations, it can improve the utilization rate of data and ensure the accuracy of data processing To prove the completeness and orthogonality of expression.

【技术实现步骤摘要】
舆情事件处理方法、装置、处理设备及存储介质
本专利技术涉及数据处理
,具体而言,涉及一种舆情事件处理方法、装置、处理设备及存储介质。
技术介绍
随着互联网技术的发展与网络应用的普及,互联网逐渐成为人们获得信息的最主要的渠道,各类新闻报道、专家评论、网民倾向等网络舆情可以在互联网上飞速传播,并可能对现实社会中的企业、个人造成巨大的后续影响。通常,来自于互联网的各类舆情信息往往是非结构化的文本,通过互联网爬虫获得这些信息相对容易,但如何让计算机自动的对其进行加工处理并计算得出最终想要的结论则非常困难。如果能够及时的获取并高效的处理相关的网络舆情信息,可以为很多企业带来实际的收益或减少未来的损失。现有技术中,在对舆情信息进行处理时,是基于关键词的信息检索技术,首先确定需要监控的舆情关键词集合,然后从海量的舆情文本中做信息检索,如果发现相关度较高的舆情信息,则提示给业务专家做进一步的过滤和后续处理。但是,信息检索技术筛选出来的舆情文本误报率较高,且无法梳理出多个文本之间的演进关系,从而导致舆情数据的利用率较低。
技术实现思路
本专利技术的目的在于,针对上述现有技术中的不足,提供一种舆情事件处理方法、装置、处理设备及存储介质,以便于解决现有技术中存在的舆情数据利用率低的问题。为实现上述目的,本申请实施例采用的技术方案如下:第一方面,本申请实施例提供了一种舆情事件处理方法,包括:从舆情文本中抽取事件的元素信息;对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示。可选地,所述从舆情文本中抽取事件的元素信息,包括:根据预设的事件本体结构,对所述舆情文本进行元素提取,确定所述舆情文本中各类型元素的信息;所述事件本体结构包括:所述事件的元素类型,所述事件的元素信息包括:从所述舆情文本提取的各类型元素的信息。可选地,所述对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示,包括:根据预设的向量格式,对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;所述向量格式为各元素信息在向量化表示中的排列格式。可选地,所述单个向量化表示包括如下至少一组片段:事件类型片段、时间片段、地点片段,文本内容片段;其中,所述事件类型片段包括:用于指示事件类型的元素信息;所述时间片段包括:用于指示时间的元素信息;所述地点片段包括:用于指示地点的元素信息;所述文本内容片段包括:用于指示文本内容的元素信息。可选地,所述根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的量化表示,包括:将所述事件的单个向量化表示,输入预设的第一网络模型,得到所述事件序列的向量化表示,所述事件序列的向量化表示用于指示:所述事件发生时刻之前的,所有事件。可选地,所述根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的量化表示,包括:将所述事件的单个向量化表示,输入预设的第二网络模型,得到所述事件序列的向量化表示,所述事件序列的向量化表示用于指示:事件发生时刻之前,预设时间段内的所有事件。第二方面,本申请实施例还提供了一种舆情事件处理装置,包括:抽取模块、表示模块、及转换模块;所述抽取模块,用于从舆情文本中抽取事件的元素信息;所述表示模块,用于对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;所述转换模块,用于根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示。可选地,所述抽取模块,具体用于根据预设的事件本体结构,对所述舆情文本进行元素提取,确定所述舆情文本中各类型元素的信息;所述事件本体结构包括:所述事件的元素类型,所述事件的元素信息包括:从所述舆情文本提取的各类型元素的信息。可选地,所述表示模块,具体用于根据预设的向量格式,对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;所述向量格式为各元素信息在向量化表示中的排列格式。可选地,所述单个向量化表示包括如下至少一组片段:事件类型片段、时间片段、地点片段,文本内容片段;其中,所述事件类型片段包括:用于指示事件类型的元素信息;所述时间片段包括:用于指示时间的元素信息;所述地点片段包括:用于指示地点的元素信息;所述文本内容片段包括:用于指示文本内容的元素信息。可选地,所述转换模块,具体用于将所述事件的单个向量化表示,输入预设的第一网络模型,得到所述事件序列的向量化表示,所述事件序列的向量化表示用于指示:所述事件发生时刻之前的,所有事件。可选地,所述转换模块,具体用于将所述事件的单个向量化表示,输入预设的第二网络模型,得到所述事件序列的向量化表示,所述事件序列的向量化表示用于指示:事件发生时刻之前,预设时间段内的所有事件。第三方面,本申请实施例还提供一种处理设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的程序指令,当处理设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述程序指令,以执行时执行如上述第一方面所述的舆情事件处理方法的步骤。第四方面,本申请实施例还提供一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面所述的舆情事件处理方法的步骤。本申请的有益效果是:本申请实施例提供的舆情事件处理方法、装置、处理设备及存储介质,包括:从舆情文本中抽取事件的元素信息;对事件的元素信息进行向量化,得到事件的单个向量化表示;根据事件的时间信息、及预设网络模型,对事件的单个向量化表示进行处理,得到事件序列的向量化表示。通过对所有单个舆情事件信息进行统一格式的向量化表示,可以降低数据的处理复杂度,然后对一系列事件的单个向量化表示按照时间顺序进行处理,得到事件序列的向量化表示,将多个高维的向量化表示转换为低维连续的向量化表示,可以提升数据的利用率,保证表达的完备性和正交性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例提供的一种舆情事件处理方法的流程示意图;图2为本申请实施例提供的一种事件本体结构示意图;图3为本申请实施例提供的长短期记忆网络模型示意图;图4为本申请实施例提供的一种双向长短期记忆网络模型示意图;图5为本申请实施例提供的一种舆情事件处理装置的结构示意图;图6为本申请实施例提供的另一种舆情事件处理装置的结构示意图。具体实施方式为使本专利技术实施例的本文档来自技高网...

【技术保护点】
1.一种舆情事件处理方法,其特征在于,包括:/n从舆情文本中抽取事件的元素信息;/n对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;/n根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示。/n

【技术特征摘要】
1.一种舆情事件处理方法,其特征在于,包括:
从舆情文本中抽取事件的元素信息;
对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;
根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示。


2.如权利要求1所述的方法,其特征在于,所述从舆情文本中抽取事件的元素信息,包括:
根据预设的事件本体结构,对所述舆情文本进行元素提取,确定所述舆情文本中各类型元素的信息;所述事件本体结构包括:所述事件的元素类型,所述事件的元素信息包括:从所述舆情文本提取的各类型元素的信息。


3.如权利要求1所述的方法,其特征在于,所述对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示,包括:
根据预设的向量格式,对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;所述向量格式为各元素信息在向量化表示中的排列格式。


4.如权利要求3所述的方法,其特征在于,所述单个向量化表示包括如下至少一组片段:事件类型片段、时间片段、地点片段,文本内容片段;
其中,所述事件类型片段包括:用于指示事件类型的元素信息;所述时间片段包括:用于指示时间的元素信息;所述地点片段包括:用于指示地点的元素信息;所述文本内容片段包括:用于指示文本内容的元素信息。


5.如权利要求1-4中任一所述的方法,其特征在于,所述根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示,包括:
将所述事件的单个向量化表示,输入预设的第一网络模型,得到所述事件序列的向量化表...

【专利技术属性】
技术研发人员:张杰吴信东
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1