当前位置: 首页 > 专利查询>徐勇专利>正文

一种基于情感分析的UGC模糊综合评价方法技术

技术编号:13326840 阅读:67 留言:0更新日期:2016-07-11 16:14
本发明专利技术公开了一种基于情感分析的UGC模糊综合评价方法,在分析、研究以上模糊综合评价方法各自优缺点的基础上,本发明专利技术将情感标签的抽取、情感极性的判断、模糊统计等方法引入到用户生成内容的模糊综合评价,首先,利用情感抽取、情感极性判断的方法,将相关用户生成的评价信息情感分为若干评价等级;然后,通过模糊统计方法确定模糊综合评价矩阵;最后,构建综合评价模型FCE,由于因素集、指标权重和模糊评价矩阵的确定,是模糊综合评价方法的重要环节。还考虑相关因素集被提及的次数,从而能够更加客观地确定评价指标模型中因素的指标权重。模型中的指标权重和模糊评价矩阵可以用机器学习的方法得到,计算途径方便可靠。

【技术实现步骤摘要】

本专利技术涉及一种基于情感分析的UGC模糊综合评价方法
技术介绍
随着Web2.0技术的不断发展,针对商品、服务、话题等对象,由普通网络用户自发在网络平台上的发布信息越来越多,这些信息统称为用户生成内容(UGC,UserGeneratedContent)。近年来,UGC以其快捷、去中心化的信息生态特点逐步被人们所接受,并在新闻论坛、博客、微信、旅游评论、电商商品评论等领域都有广泛的应用。例如在电子商务领域的网络购物过程中,由于购物平台的非实体性,消费者在选择商品时,无法实时体验商品性能,因而无法更加全面的了解商品。针对此问题,电商平台不仅为消费者提供产品自身特征相关信息(如多方位的商品外观展示、特性文字信息等),还展示了其他消费者对商品的评价,让购买过该商品的消费者根据其自身的购物体验,对商品做出具体的评价。这些评价形式的网络用户生成内容将作为其他消费者购买决策的重要参考。因此,消费者对商品的评价将会直接影响着其他消费者购买该商品的意愿[1]。但是,随着评论条数的不断增多,消费者评价系统的作用似乎在减弱,几乎没有消费者为了了解商品的属性而去阅读成千上万的评价信息。评价丰富了,但其后消费者从评价信息中获取的有用信息却越来越少。为了更好地利用消费者评价信息,就需要针对这些海量的评价信息构建一个准确、高效的综合评价系统。为电子商务、旅游体验等网络平台构建一个可靠、有效的用户生成内容综合评价方法,不仅能帮助后续其他用户快速、精确、深入地了解商品、景点、服务等信息,也有利于企业稳定老客户,进一步挖掘消费者的深度需求,提高产品和服务的质量,从而提高企业竞争力。模糊综合评价是一种利用模糊数学理论把定性评价转化为定量评价的有效方法。李梵蓓首先将模糊数学的思想应用到商品质量综合评价问题上,然后利用编程实现该评价方法,操作简单方便、结论可靠[3]。王跃进等将多级模糊综合评价方法用于绿色食品的研究[4]。乌云娜等运用模糊度量方法分析企业存在的风险,评价结果可为控制风险和优化并购方案提供决策参考,是一种行之有效的评价企业并购风险方法[5]。王涛从电子商务层面构造出电子商务产品指标体系,应用模糊数学综合判断方法,对电子商务企业产品进行整体分析和综合评判,评价出产品优劣。其不足是采用指标两两进行评价方法确定权重,主观性太强,对商品的综合评价结果说服力不够强[6]。杨静着眼于电子商务网站售后商品评价环节存在的问题,构建的评价模型考虑了评价的公正性和易于理解性,但是对于模糊评价矩阵是用调查统计的方法得到,此过程需要更多的人力物力。并且在各指标权重的判断过程中,采用了专家经验判断,主观性较强[7]。综上所述,由于人类的情感是非常丰富的,所以跨媒体UGC表达的显示和隐式情感不能简单划分为正向情感、负向情感。而目前关于网络平台用户生成内容表达的用户情感表示方法均为离散表示结构,不足以精细化表达用户情感。上述提及的参考文献如下:[1]ParkDH,LeeJ,HanI.Theeffectofon-lineconsumerreviewsonconsumerpurchasingintention:Themoderatingroleofinvolvement[J].InternationalJournalofElectronicCommerce,2007,11(4):125-148。[2]赵晓冬,郑涛.基于FUZZY-AHP评价方法的个人信用等级评价模型指标体系[J].数量经济技术经济研究,2003,(5):97-98。[3]李梵蓓.商品质量的模糊综合评价[J].内蒙古财经学院学报,1994,4:92-95。[4]王跃进,孟宪颐.绿色产品多级模糊评价研究[J].中国机械工程,2000,11(9):1016-1020。[5]乌云娜,蔡爽,王艳霞.企业并购风险分析和模糊度量[J].中国电力教育,2006,管理论坛与教育研究专刊:94-96。[6]王涛.电子商务企业产品评价指标体系的建立及模糊评价[J].现代情报,2007,1:178-180。[7]杨静.电子商务网站商品模糊评价模型的构建[J].现代情报,2013,33(4)31-33。
技术实现思路
本专利技术目的是提供一种基于情感分析的UGC模糊综合评价方法,分别得到商品情况综合得分,物流情况综合得分和服务情况综合得分,这样消费者和卖家都可以更好的了解商品的信息。以便商家更好的提高商品整体的质量与服务。为了解决上述技术问题,本专利技术采用的技术方案是:一种基于情感分析的UGC模糊综合评价方法,包括以下步骤:(1)建立电子商务商品评价指标结构模型经过收集、分析消费者在淘宝购买商品时的评价信息,归纳得出消费者在进行淘宝购物时关心的因素,建立电子商务商品评价指标结构模型;(2)文本情感分析(2.1)信息抽取利用语句情感标签抽取方法分析商品评价信息,挖掘消费者对商品的评价意见,并且累计关于商品的“好的评价信息”和“坏的评价信息”的数量;语句情感标签抽取方法是指将一小段文字的评论信息,利用分词器将一段话分割成一系列短语,然后再进行情感标签的抽取与统计;(2.2)情感极性判断(2.2.1)初步判断信息抽取完毕后,对结果进行情感极性的判定;对于极性明显的词语,直接利用hownet情感词语集和同义词词林]建立情感词典来直接确定其极性,比如“好”、“漂亮”相关褒义词语记为”1”;如果在褒义词之前加有否定词,如不好、不喜欢记为”-1”;如果一般或者其它中性的描述,就记为”0”;如果无法直接查找到情感词语的极性,则利用上下文关系进行判断,如果消费者评论语句中出现转折词语,比如“尽管…还是…”,“可”,“但是”的词语出现时,则在基本情感提取结果上减1;如果出现递进关系的词语,比如“不但、不仅、而且”的词语出现时,在评论语句的基本情感基础上加1;(2.2.2)进一步判断情感描述性词语被副词修饰的情况下,情感极性强度会被加强,好的情感倾向在程度副词的修饰下会更好,坏的情感倾向则会更坏,比如“很好、超符合、极其差”,当一个评论中的情感描述词被程度副词修饰时,如果情感极性通过步骤(2.2.1)中的方法被判断为”1”,则将其更改为”2”;如果情感极性通过步骤(2.2.1)中的方法被判断为”-1”,则将其更改为”-2”;评论信息的情感极性判断完成之后,会得到一个相对应的数值,有五种可能:2、1、0、-1、-2,分别将这五种可能与五个等级相对应,如{2,1,0,-1,-2本文档来自技高网
...

【技术保护点】
一种基于情感分析的UGC模糊综合评价方法,其特征在于,包括以下步骤:(1)建立电子商务商品评价指标结构模型经过收集、分析消费者在淘宝购买商品时的评价信息,归纳得出消费者在进行淘宝购物时关心的因素,建立电子商务商品评价指标结构模型;(2)文本情感分析(2.1)信息抽取利用语句情感标签抽取方法分析商品评价信息,挖掘消费者对商品的评价意见,并且累计关于商品的“好的评价信息”和“坏的评价信息”的数量;语句情感标签抽取方法是指将一小段文字的评论信息,利用分词器将一段话分割成一系列短语,然后再进行情感标签的抽取与统计;(2.2)情感极性判断(2.2.1)初步判断信息抽取完毕后,对结果进行情感极性的判定;对于极性明显的词语,直接利用hownet情感词语集和同义词词林建立情感词典来直接确定其极性,“好”、“漂亮”相关褒义词语记为”1”;如果在褒义词之前加有否定词,如“不好”、“不喜欢”记为”‑1”;如果一般或者其它中性的描述,就记为”0”;如果无法直接查找到情感词语的极性,则利用上下文关系进行判断,如果消费者评论语句中出现转折词语,比如“尽管…还是…”,“可”,“但是”的词语出现时,则在基本情感提取结果上减1;如果出现递进关系的词语,“不但、不仅、而且”的词语出现时,在评论语句的基本情感基础上加1;(2.2.2)进一步判断情感描述性词语被副词修饰的情况下,情感极性强度会被加强,好的情感倾向在程度副词的修饰下会更好,坏的情感倾向则会更坏,比如“很好、超符合、极其差”,当一个评论中的情感描述词被程度副词修饰时,如果情感极性通过步骤(2.2.1)中的方法被判断为”1”,则将其更改为”2”;如果情感极性通过步骤(2.2.1)中的方法被判断为”‑1”,则将其更改为”‑2”;评论信息的情感极性判断完成之后,会得到一个相对应的数值,有五种可能:2、1、0、‑1、‑2,分别将这五种可能与五个等级相对应,如{2,1,0,‑1,‑2}={较好,好,一般,差,极差};(3)模糊综合评价(3.1)模糊统计①在每一次试验中都要确定指标集U中的固定元素Bi中的一个u0是否属于可变动的等级集合;每一次试验中,指标集都必须属于一个确定清晰的集合,而每一个消费者对商品的评价都可以看做一个试验,如:针对一条消费者评价,商品的质量情况属于五个等级中的哪一个,必须清晰、明确;②在每一条消费者评论中,u0是固定的,而评价等级A在随机变动;如果在所分析的n条评论中,元素u0属于A的次数为m,则元素u0对A的隶属频率定义为:当商品评论条数n足够大时,根据大数定律,元素u0的隶属频率总是稳定于某一数,这个稳定的数即为元素u0对A的隶属度,模糊统计用来确定模糊评价方法的隶属度;(3.2)模糊评价(3.2.1)构建模糊评价指标根据商品评价指标确定指标集,一级指标集记为U={U1 U2 … Um},其中i=1,2,...,m,表示有m个一级指标;二级指标记为Ui={ui1,ui2,…,uin},表示第i个一级指标有n个二级指标;一级指标集为U={B1 B2 B3},二级指标集为B1={C1 C2 C3};(3.2.2)确定评价集V={V1,V2,…,Vn}每一个评价指标Ui有n个评价等级,淘宝评分系统用五颗星的评价方法,在这里用常见的方法确定五个等级:{较好,好,一般,差,极差},评价等级与分数的对应关系为:{较好,好,一般,差,极差}={5,4,3,2,1};(3.2.3)确定评价指标权重首先,统计商品的评论信息条数(n);然后,利用步骤(2)实现信息抽取;然后统计评论中提及的商品情况(m)、物流情况(f)、服务情况(x);接着,分别计算这三个指标的评论条数占总评论条数的百分比作为权重,具体权重计算方法为:商品自身情况的权重为m/(m+f+x),物流情况权重为f/(m+f+x),服务情况权重为x/(m+f+x),同一条评论中同时提及多个商品的指标,即(m+f+x)≠n;并且对商品评价信息提到的要素进行归类,在统计数量时,商品情况+1;统计结束得到的权重要进行归一化处理,最后的结果作为模糊综合评价的各个指标的权重,记为A={a1,a2,…,am},m表示指标的个数;(3.2.4)确定模糊评价矩阵在商品情况、物流情况,服务情况的指标下,计算每个评价等级所占的比例,得到以下m个指标构成的模糊评价矩阵RR=r11r12...r15r21r22...r25............rm1rm2...rm5]]>(3.2.5)计算综合评价值模糊综合评价模型为:其中bj表示被评级对象从整体上看对评价等级模糊子集隶属程度,A表示评价指标的相关权重,R是模糊评价矩阵;bj=min(1,Σi=1mairij),j=1,2,...,n]]>然后对B进行归一化处理,得到模糊综合评价集最后用的值确定该商品的综...

【技术特征摘要】
1.一种基于情感分析的UGC模糊综合评价方法,其特征在于,包括以下步骤:
(1)建立电子商务商品评价指标结构模型
经过收集、分析消费者在淘宝购买商品时的评价信息,归纳得出消费者在进行淘宝购
物时关心的因素,建立电子商务商品评价指标结构模型;
(2)文本情感分析
(2.1)信息抽取
利用语句情感标签抽取方法分析商品评价信息,挖掘消费者对商品的评价意见,并且
累计关于商品的“好的评价信息”和“坏的评价信息”的数量;语句情感标签抽取方法是指将
一小段文字的评论信息,利用分词器将一段话分割成一系列短语,然后再进行情感标签的
抽取与统计;
(2.2)情感极性判断
(2.2.1)初步判断
信息抽取完毕后,对结果进行情感极性的判定;对于极性明显的词语,直接利用hownet
情感词语集和同义词词林建立情感词典来直接确定其极性,“好”、“漂亮”相关褒义词语记
为”1”;如果在褒义词之前加有否定词,如“不好”、“不喜欢”记为”-1”;如果一般...

【专利技术属性】
技术研发人员:徐勇张慧李东勤陈亮梁后军魏苏林
申请(专利权)人:徐勇
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1