【技术实现步骤摘要】
一种基于文本相似度的事件情感分类方法
本专利技术涉及自然语言处理
,具体涉及一种基于文本相似度的事件情感分类方法。
技术介绍
伴随着计算机的日益普及和互联网的迅速发展,网络已成为许多领域的用户发表和反馈个人观点、评论的主要途径。这些共享的评论信息不仅为用户提供了产品使用体验交流的平台,也可以作为其他用户使用产品前的借鉴。但是,网络中的这些评论信息量非常大,如果对每一条评论信息都人工阅读分析评论好坏,会浪费用户大量的时间。因此,如何让用户在短时间内就能够客观的了解某个产品的评论信息所反映出的总体评价好坏情况,即对网络中的评论文本进行情感分析分类,是非常必要的。文本情感分析,就是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。文本情感分类是利用底层情绪信息抽取的结果将情感文本分为了若干类别,例如分为褒贬两类。而目前针对情感分析的技术是基于单个文本的,所有模型都是预测单个文本的情感倾向,如正向、负向或中性。面对海量的数据,人工是很难保证所有的热点都被监测到,且人工监测时监测工作量大,很难开展对单独的某部分文本进行监测。基于此,提供一种基于文本相似度的事 ...
【技术保护点】
1.一种基于文本相似度的事件情感分类方法,其特征在于,包括以下操作步骤:S000、设整个待处理事件的情感值为S,设情感分界值分别为S1、S2;S001、选取并生成单文本情感分类模型model,情感类别为正面、中立、负面;S002、根据余弦相似度将文本聚类,聚合成不同的事件类;S003、设置事件的分割参数limit‑num,用来控制事件中的文本切割参数;S004、针对每一个事件类event,按照声量值选择文本,然后判断分析;S005、将事件类中所有文本向量进行均值运算,生成该类的均值向量,将均值向量输入到应用模型model中,输出均值向量情感值p_avg;S006、事件内部存 ...
【技术特征摘要】
1.一种基于文本相似度的事件情感分类方法,其特征在于,包括以下操作步骤:S000、设整个待处理事件的情感值为S,设情感分界值分别为S1、S2;S001、选取并生成单文本情感分类模型model,情感类别为正面、中立、负面;S002、根据余弦相似度将文本聚类,聚合成不同的事件类;S003、设置事件的分割参数limit-num,用来控制事件中的文本切割参数;S004、针对每一个事件类event,按照声量值选择文本,然后判断分析;S005、将事件类中所有文本向量进行均值运算,生成该类的均值向量,将均值向量输入到应用模型model中,输出均值向量情感值p_avg;S006、事件内部存在情感倾向的文本,计算情感值;S007、利用情感分类模型对事件情感值进行计算(综合w1,w2),其中,w1+w2=1;S008、判断事件情感分类s=p(event),若s≥s2,则事件为正向;若s1<s<s2,则事件为中立;若s≤s1,则事件为负向。2.根据权利要求1所述的一种基于文本相似度的事件情感分类方法,其特征在于,...
【专利技术属性】
技术研发人员:辛如意,
申请(专利权)人:成都睿码科技有限责任公司,杭州数峰科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。