【技术实现步骤摘要】
基于大数据的网销商品情感倾向分析方法
本专利技术涉及一种网销商品分析方法,具体涉及一种网销商品的情感倾向分析方法。
技术介绍
随着社会生活的不断发展,网络销售模式亦在不断演变和进化,网购逐渐深入到千家万户,越来越多的人接受和选择通过各种网络销售平台采买所需的商品和物资。网销产品的一大服务特色,是可以通过用户评价/评论来对所购产品进行点评,包括产品质量、物流服务、使用体验等各类信息均可给出每一单交易的评论和打分等,从而给其他客户选购时提供参考,也对卖家提供的产品和服务提供了一定的约束力。然而,对于琳琅满目的品牌、琳琅满目的网络销售链接,以及各销售链接下动辄千条万条的评论数据,客户往往无法直接且直观地从海量评论中有效提取出所需的准确信息,并形成相对客观的判断。同时网销产品的评论数据中,大多差评占比较少,好评或默认好评占比较多,也存在较多刷单好评的现象,因此一方面往往能给用户起到提醒作用的差评,大多掩埋在数量众多的好评中,另一方面,不同销售链接根据好评差评的占比给出的好评率也相差甚微,客户很难在接近或相同的好评率( ...
【技术保护点】
1.一种基于大数据的网销商品情感倾向分析方法,其特征在于:该方法包括情感得分计算步骤;/n其中针对某同类商品的情感得分计算步骤包括:/nB1)采集网络平台上属于该同类商品的网销商品链接及其对应的包括品牌数据、评论数据在内的数据信息;/nB2)通过基于评论分析词典的情感倾向分析方法,对步骤B1)采集的各网销商品链接的各条评论进行情感分析,计算得到各网销商品链接下各条评论的情感得分;/nB3)基于各网销商品链接下各条评论的情感得分,计算得到各网销商品链接的商品情感得分;/nB4)结合步骤B3)得到的各网销商品链接的商品情感得分和品牌数据,计算该同类商品下各品牌的情感得分。/n
【技术特征摘要】
1.一种基于大数据的网销商品情感倾向分析方法,其特征在于:该方法包括情感得分计算步骤;
其中针对某同类商品的情感得分计算步骤包括:
B1)采集网络平台上属于该同类商品的网销商品链接及其对应的包括品牌数据、评论数据在内的数据信息;
B2)通过基于评论分析词典的情感倾向分析方法,对步骤B1)采集的各网销商品链接的各条评论进行情感分析,计算得到各网销商品链接下各条评论的情感得分;
B3)基于各网销商品链接下各条评论的情感得分,计算得到各网销商品链接的商品情感得分;
B4)结合步骤B3)得到的各网销商品链接的商品情感得分和品牌数据,计算该同类商品下各品牌的情感得分。
2.根据权利要求1所述的基于大数据的网销商品情感倾向分析方法,其特征在于:该方法还包括初始化步骤;其中初始化步骤包括:A0)基于网络平台上用户对商品的多源评论数据,构建和/或更新商品的评论分析词典的步骤;所述评论分析词典包括情感词词典、否定词词典、程度词词典和/或停用词词典;
其中情感词词典中包括若干情感词以及各情感词对应的情感词分值;
其中否定词词典中包括若干否定词;
其中程度词词典中包括若干程度词以及各程度词对应的程度词分值;
其中停用词词典中包括若干停用词。
3.根据权利要求1所述的基于大数据的网销商品情感倾向分析方法,其特征在于:所述多源评论数据包括若干网络销售平台的评论数据。
4.根据权利要求1所述的基于大数据的网销商品情感倾向分析方法,其特征在于:所述步骤B3)为:基于各网销商品链接下各条评论的情感得分,结合标准化和基于熵的加权处理方法,计算得到各网销商品链接的商品情感得分。
5.根据权利要求1所述的基于大数据的网销商品情感倾向分析方法,其特征在于:所述B2)通过基于评论分析词典的情感倾向分析方法,对步骤B1)采集的各网销商品链接的各条评论进行情感分析,计算得到各网销商品链接下各条评论的情感得分的步骤中,基于评论分析词典的情感倾向分析方法对某一网销商品链接bij下的某条评论进行情感分析计算得到该条评论的情感得分包括如下步骤:
B21)子句分割:根据标点符号将条评论对应的评论文本c,拆分为若干子句
B22)修饰关系分析:根据评论分析词典,针对每个子句,识别该子句中的情感词(a1,a2,…)、程度词(d1,d2,…)、否定词(h1,h2,…)和停用词,并记录其位置;结合停用词确定各程度词、否定词所修饰的目标情感词,并结合评论分析词典中对应的程度词分值和情感词分值,以及否定词的数量,确定该子句中各程度词、否定词与目标情感词之间的修饰关系;
B23)各子句情感得分计算:根据获得的修饰关系,确定各个子句的情感得分,其中子句ci的情感得分为:
其中,|H|表示否定词出现的次数,D表示程度词分值,表示情感词wk的情感词分值,nw表示子句ci中情感词出现次数;其中,对si为正值的子句ci的情感得分用子句正向情感得分表示,对si为负值的子句ci的情感得分用子句负向情感得分用表示;
B24)该条评论情感得分计算:针对该条评论对应的评论文本c,将其所有子句中的子句正向情感得分进行累加,得到该条评论的正向情感得分s+,将其所有子句中的子句负向情感得分进行累加,得到该条评论的负向情感得分s-:
其中,mc表示评论c的子句数量。
6.根据权利要求5所述的基于大数据的网销商品情感倾向分析方法,其特征在于:所述步骤B2)中还包括异常值去除步骤,该步骤包括:通过基于评...
【专利技术属性】
技术研发人员:王海涛,曹馨宇,赵静,张帆,吴刚,赵超,丁文兴,
申请(专利权)人:中国标准化研究院,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。