舆情分析方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:20992703 阅读:37 留言:0更新日期:2019-04-29 22:39
本申请涉及一种基于自然语言处理技术的舆情分析方法、装置、计算机设备和存储介质,该方法包括:识别目标对象的各舆情信息中包括的关键词;基于语义相似度对各关键词进行聚类;对各舆情信息进行分段,从分段得到的每个舆情片段中识别第一关键词;针对每个舆情片段,选取包括与第一关键词属于同一聚类下的第二关键词的舆情信息,作为舆情片段的关联语句;对关联语句进行语义分析,生成相应的语义描述信息;将每个舆情片段中包括的第一关键词和相应关联语句的语义描述信息,输入情感分析模型中,输出舆情片段的正负面研判结果;根据各舆情片段的正负面研判结果,对目标对象进行异常识别。采用本方法能够提高舆情信息传达的信息量。

Public opinion analysis methods, devices, computer equipment and storage media

This application involves a public opinion analysis method, device, computer equipment and storage medium based on natural language processing technology. The method includes: identifying keywords included in the public opinion information of the target object; clustering keywords based on semantic similarity; segmenting public opinion information to identify the first keyword from each segment of public opinion; and targeting at For each public opinion segment, the public opinion information including the second key word which belongs to the same cluster with the first key word is selected as the related sentences of the public opinion segment; the relevant semantic description information is generated by semantic analysis of the related sentences; the semantic description information of the first key word and the corresponding related sentences included in each public opinion segment is input into the emotional analysis model, and the public opinion is output. The positive and negative judgment results of sentiment fragments; anomaly recognition of target objects is carried out according to the positive and negative judgment results of each public opinion fragment. This method can improve the amount of information conveyed by public opinion information.

【技术实现步骤摘要】
舆情分析方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种舆情分析方法、装置、计算机设备和存储介质。
技术介绍
随着科学技术的飞速发展,通信技术和通信平台逐渐壮大。人们不再像过去一样,只能单方面的接收电视、广播等平台传播的信息,而是可以借助网络平台或软件,即时有效地发表和获取各种舆情信息。传统方法中,舆情信息在网络平台中,仅用于向人们展示,并供人们进一步的传播。很显然,传统舆情信息能够传达的信息量,仅为舆情信息本身,而并未能够传达表面的舆情信息背后深层次的信息。因此,传统舆情信息传达的信息量比较低。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高舆情信息传达的信息量的舆情分析方法、装置、计算机设备和存储介质。一种舆情分析方法,所述方法包括:识别目标对象的各舆情信息中包括的关键词;基于语义相似度对各所述关键词进行聚类;对各舆情信息进行分段,从分段得到的每个舆情片段中识别第一关键词;针对每个舆情片段,选取包括与所述第一关键词属于同一聚类下的第二关键词的舆情信息,作为所述舆情片段的关联语句;对所述关联语句进行语义分析,生成相应的语义描述信息;将每个舆情片本文档来自技高网...

【技术保护点】
1.一种舆情分析方法,所述方法包括:识别目标对象的各舆情信息中包括的关键词;基于语义相似度对各所述关键词进行聚类;对各舆情信息进行分段,从分段得到的每个舆情片段中识别第一关键词;针对每个舆情片段,选取包括与所述第一关键词属于同一聚类下的第二关键词的舆情信息,作为所述舆情片段的关联语句;对所述关联语句进行语义分析,生成相应的语义描述信息;将每个舆情片段中包括的第一关键词和相应关联语句的语义描述信息,输入预先建立的情感分析模型中,输出所述舆情片段的正负面研判结果;根据各舆情片段的正负面研判结果,对目标对象进行异常识别。

【技术特征摘要】
1.一种舆情分析方法,所述方法包括:识别目标对象的各舆情信息中包括的关键词;基于语义相似度对各所述关键词进行聚类;对各舆情信息进行分段,从分段得到的每个舆情片段中识别第一关键词;针对每个舆情片段,选取包括与所述第一关键词属于同一聚类下的第二关键词的舆情信息,作为所述舆情片段的关联语句;对所述关联语句进行语义分析,生成相应的语义描述信息;将每个舆情片段中包括的第一关键词和相应关联语句的语义描述信息,输入预先建立的情感分析模型中,输出所述舆情片段的正负面研判结果;根据各舆情片段的正负面研判结果,对目标对象进行异常识别。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:建立各舆情信息与所包括的关键词之间的关联关系;所述针对每个舆情片段,选取包括与所述第一关键词属于同一聚类下的第二关键词的舆情信息,作为所述舆情片段的关联语句包括:针对每个舆情片段,从各舆情信息中,筛选出与所述第一关键词具有关联关系的舆情信息;从筛选出的舆情信息中,选取与第二关键词具有关联关系的舆情信息,作为所述舆情片段的关联语句。3.根据权利要求2所述的方法,其特征在于,在所述基于语义相似度对各所述关键词进行聚类之后,所述方法还包括:从属于同一聚类的关键词中选取代表关键词;根据每一聚类的代表关键词构成词云;针对词云的每个代表关键词,确定包括与所述代表关键词属于同一聚类下的关键词的舆情信息,并建立代表关键词和确定的舆情信息之间的关联关系;输出所述词云至终端进行展示。4.根据权利要求1所述的方法,其特征在于,所述根据各舆情片段的正负面研判结果,对目标对象进行异常识别包括:针对每个舆情信息,根据所述舆情信息所包括的舆情片段的正负面研判结果,对整个舆情信息进行评分;根据评分分值对舆情信息进行正负面评价处理,得到正负面评价结果;根据各舆情信息的正负面评价结果,对目标对象进行异常识别。5.根据权利要求4所述的方法,其特征在于,所述根据各舆情信息的正负面评价结果,对目标对象进行异常识别包括:根据各舆情信息的正负面评价结果,得到舆情信息的情感正负比例;从预设的...

【专利技术属性】
技术研发人员:朱元李磊
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1