The application provides a public opinion event processing method, device, processing equipment and storage medium, relating to the technical field of data processing. This method includes: extracting the element information of events from public opinion text; quantifying the element information of events to get a single vectorization representation of events; processing the single vectorization representation of events to get a vectorization representation of event sequence according to the time information of events and preset network model. It can reduce the complexity of data processing by providing a unified format of vectorization representation for all single public opinion event information. Then, it can process a series of single vectorization representations according to the time sequence to obtain the vectorization representation of event sequence. By converting multiple high-dimensional vectorization representations into low-dimensional continuous vectorization representations, it can improve the utilization rate of data and ensure the accuracy of data processing To prove the completeness and orthogonality of expression.
【技术实现步骤摘要】
舆情事件处理方法、装置、处理设备及存储介质
本专利技术涉及数据处理
,具体而言,涉及一种舆情事件处理方法、装置、处理设备及存储介质。
技术介绍
随着互联网技术的发展与网络应用的普及,互联网逐渐成为人们获得信息的最主要的渠道,各类新闻报道、专家评论、网民倾向等网络舆情可以在互联网上飞速传播,并可能对现实社会中的企业、个人造成巨大的后续影响。通常,来自于互联网的各类舆情信息往往是非结构化的文本,通过互联网爬虫获得这些信息相对容易,但如何让计算机自动的对其进行加工处理并计算得出最终想要的结论则非常困难。如果能够及时的获取并高效的处理相关的网络舆情信息,可以为很多企业带来实际的收益或减少未来的损失。现有技术中,在对舆情信息进行处理时,是基于关键词的信息检索技术,首先确定需要监控的舆情关键词集合,然后从海量的舆情文本中做信息检索,如果发现相关度较高的舆情信息,则提示给业务专家做进一步的过滤和后续处理。但是,信息检索技术筛选出来的舆情文本误报率较高,且无法梳理出多个文本之间的演进关系,从而导致舆情数据的利用率较低。
技术实现思路
本专利技术的目的在于,针对上述现有技术中的不足,提供一种舆情事件处理方法、装置、处理设备及存储介质,以便于解决现有技术中存在的舆情数据利用率低的问题。为实现上述目的,本申请实施例采用的技术方案如下:第一方面,本申请实施例提供了一种舆情事件处理方法,包括:从舆情文本中抽取事件的元素信息;对所述事件的元素信息进行向量化,得到所 ...
【技术保护点】
1.一种舆情事件处理方法,其特征在于,包括:/n从舆情文本中抽取事件的元素信息;/n对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;/n根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示。/n
【技术特征摘要】
1.一种舆情事件处理方法,其特征在于,包括:
从舆情文本中抽取事件的元素信息;
对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;
根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示。
2.如权利要求1所述的方法,其特征在于,所述从舆情文本中抽取事件的元素信息,包括:
根据预设的事件本体结构,对所述舆情文本进行元素提取,确定所述舆情文本中各类型元素的信息;所述事件本体结构包括:所述事件的元素类型,所述事件的元素信息包括:从所述舆情文本提取的各类型元素的信息。
3.如权利要求1所述的方法,其特征在于,所述对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示,包括:
根据预设的向量格式,对所述事件的元素信息进行向量化,得到所述事件的单个向量化表示;所述向量格式为各元素信息在向量化表示中的排列格式。
4.如权利要求3所述的方法,其特征在于,所述单个向量化表示包括如下至少一组片段:事件类型片段、时间片段、地点片段,文本内容片段;
其中,所述事件类型片段包括:用于指示事件类型的元素信息;所述时间片段包括:用于指示时间的元素信息;所述地点片段包括:用于指示地点的元素信息;所述文本内容片段包括:用于指示文本内容的元素信息。
5.如权利要求1-4中任一所述的方法,其特征在于,所述根据所述事件的时间信息、及预设网络模型,对所述事件的单个向量化表示进行处理,得到事件序列的向量化表示,包括:
将所述事件的单个向量化表示,输入预设的第一网络模型,得到所述事件序列的向量化表...
【专利技术属性】
技术研发人员:张杰,吴信东,
申请(专利权)人:北京明略软件系统有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。