深度学习商品评论文本情感倾向分析方法技术

技术编号:21273658 阅读:39 留言:0更新日期:2019-06-06 08:03
根据本发明专利技术所涉及的深度学习商品评论文本情感倾向分析方法,因为将文本处理得到最简文本,并对最简文本划分训练集与测试集,根据训练集得到词语序列并设置具有情感权重值的感情特征,并调整情感权重值得到矫正情感权重值,根据词语序列按不同的构成词组合方式得到多个词组序列,计算词组序列中的矫正情感权重值得到文本的情感标签,并将情感标签与人为感情评价对比,得到最终情感权重值与最终矫正情感权重值,对训练集中的全部文本执行上述操作,根据最终情感权重值与最终矫正情感权重值得到情感模型对测试集进行情感分析已做验证。

【技术实现步骤摘要】
深度学习商品评论文本情感倾向分析方法
本专利技术属于自然语言处理
,具体涉及一种深度学习商品评论文本情感倾向分析方法。
技术介绍
随着我国电子商务的健康发展,流量红利期已过,客户成本越来越高。电子商务企业如何识别客户消费偏好,开展精准营销,降低竞争成本,是每个企业必备功课。商品评论数据是电子商务交易完成后,客户对产品的质量、价格、服务等方面的评价。商品评论数据已成为企业获取客户消费偏好、开展精准营销的重要信息来源。这种评价集往往带有很强的情感倾向。研究客户的情感倾向既能度量客户对企业的认可度,也能挖掘客户的消费偏好。目前,文本情感分析领域主要分为三个研究方向。第一个是基于规则和词典的方法:这种方法借助人工构建的情感词典和专家总结的规则来识别文本的情感,一般不考虑词之间的语义关联,仅仅是将文本看成是词与词的集合。基于情感词典的文本情感分类方法性能过于依赖词典的质量,对网络新词和表情符号的区分能力不强。第二个是基于机器学习的方法:此方法运用机器学习分类器,通过人工选择的语言学特征进行训练,用训练好的分类器识别文本的情感,常用的分类器有朴素贝叶斯、最大熵模型、支持向量机,常用的语言学特征有词袋模型、词性特征、否定词特征等。第三个是基于深度学习的方法:此种方法运用神经网络模型,通过在训练集上的训练自动学习得到用于分类的情感特征,然后用训练好的神经网络模型识别文本的情感。由此产生的常用相关技术方法有:(1)运用word2vec工具得到文本的词向量表示,输入到训练好的卷积神经网络(convolutinneuralnetwork,CNN)中,得到商品评论文本的情感倾向。(2)将对抗式训练应用到文本情感分析领域,结合CNN,提高了在处理对抗样本时的鲁棒性。(3)利用情感词典得到文本的情感极性分值结合word2vec得到的词向量,得到有“情感信息”的特征向量,再输入CNN中进行训练。以上三个专利都只在模型的输入层进行优化,再用CNN进行情感判定,而本文对神经网络进行优化,融合了LSTM(LongShortTermMemory)神经网络和CNN,提高了文本情感分析的准确度。(4)采用word2vec工具得到文本的词向量表示,将其输入LSTM神经网络得到具有上下文语义关系的词向量,再输入CNN提取特征,最后通过softmax(归一化)层得到文本情感类别。(5)选用词语特征与词向量作为双通道输入,接着用CNN进行文本情感分类,(6)联合使用CNN和LSTM对词向量进行处理。深度学习适合做文本情感分析是因为深度学习结构灵活,其底层词嵌入技术能避免文本长短不均带来的处理困难,使用深度学习抽象特征,能避免大量人工提取特征的工作。技术方法(1)-(3)和技术方法(5)都只在模型的输入层进行优化,再用CNN进行情感判定,技术方法(4)、(6)的在神经网络的输入层的输入对文本情感信息表示较简单造成对文本情感分析的准确率不高,
技术实现思路
本专利技术是为了解决上述问题而进行的,提供了一种深度学习商品评论文本情感倾向分析方法,具有这样的特征,包括以下步骤:步骤S1:将文本进行处理得到最简文本,并对最简文本划分训练集与测试集;步骤S2:将训练集中的单个文本逐词分隔得到对应的词语序列,词语序列包含多个构成词,对构成词对应设置感情特征,对感情特征设置情感权重值;步骤S3:基于词语序列调整构成词的情感权重值得到矫正情感权重值;步骤S4:将词语序列按不同分段方式得到多个词组序列;步骤S5:分别对词组序列中每个感情特征的矫正情感权重值进行计算,根据计算结果选择感情特征作为该词组序列对应的文本的文本情感标签;步骤S6:将文本情感标签与文本的人为感情评价进行对比,根据对比结果通过调整情感权重值与矫正情感权重值改变文本情感标签进而使得文本情感标签与人为感情评价一致,将最终得到的情感权重值设定为最终情感权重值,将最终得到的矫正情感权重值设定为最终矫正情感权重值;步骤S7:对训练集中的所有文本执行步骤S2-步骤S6;步骤S8:运用最终情感权重值与最终矫正情感权重值构成的情感模型对测试集进行情感分析,并验证情感分析的准确性。在本专利技术提供的深度学习商品评论文本情感倾向分析方法中,还可以具有这样的特征:其中,步骤S1中,处理的过程包括以下子步骤:步骤S1-1:按预定规则简化文本得到预处理文本;步骤S1-2:为预处理文本中的每个构成词定义词性得到最简文本。步骤S1-3:将最简文本划分为训练集与测试集。在本专利技术提供的深度学习商品评论文本情感倾向分析方法中,还可以具有这样的特征:其中,步骤S2中,得到词语序列包括以下子步骤:步骤S2-1:将训练集中的单个文本逐词分隔形成多个构成词;步骤S2-2:辨识构成词并对该构成词标注词语情感特征得到情感特征词;步骤S2-3:为情感特征词赋予相应的权重值得到权重特征词;步骤S2-4:将多个权重特征词连接得到词语序列。在本专利技术提供的深度学习商品评论文本情感倾向分析方法中,还可以具有这样的特征:其中,在步骤S3中,得到矫正情感权重值的方法为:结合词语序列中构成词之前的部分对构成词的情感权重值进行调整。在本专利技术提供的深度学习商品评论文本情感倾向分析方法中,还可以具有这样的特征:其中,在步骤S4中,分段为按预定数量的相邻构成词进行分隔。在本专利技术提供的深度学习商品评论文本情感倾向分析方法中,还可以具有这样的特征:其中,最简文本的数量为10000次-30000次。在本专利技术提供的深度学习商品评论文本情感倾向分析方法中,还可以具有这样的特征:其中,测试集数量为训练集的20%-25%。专利技术的作用与效果根据本专利技术所涉及的深度学习商品评论文本情感倾向分析方法,因为将文本处理得到最简文本,并对最简文本划分训练集与测试集,根据训练集得到词语序列并设置具有情感权重值的感情特征,并调整情感权重值得到矫正情感权重值,根据词语序列按不同的构成词组合方式得到多个词组序列,计算词组序列中的矫正情感权重值得到文本的情感标签,并将情感标签与人为感情评价对比,得到最终情感权重值与最终矫正情感权重值,对训练集中的全部文本执行上述操作,根据最终情感权重值与最终矫正情感权重值得到情感模型对测试集进行情感分析已做验证。所以,本专利技术的深度学习商品评论文本情感倾向分析方法同时考虑了单个构成词的感情倾向与多个构成词构成的语境感情倾向,提高了文本情感分析的准确度,考虑到了文本的上下文联系,极大程度消除了歧义,获得了更丰富的文本表述,因此增强了文本的情感信息表示,有利于增加文本情感分类效果及提高文本情感分类的准确度。附图说明图1是本专利技术的实施例中深度学习商品评论文本情感倾向分析方法的步骤流程图;图2是本专利技术的实施例中深度学习商品评论文本情感倾向分析方法的数据流程图;图3是本专利技术的实施例中深度学习商品评论文本情感倾向分析方法的LSTM神经网络节点内部的结构图;图4是本专利技术的实施例中深度学习商品评论文本情感倾向分析方法的经测试的文本情感准确率曲线;图5是本专利技术的实施例中深度学习商品评论文本情感倾向分析方法的经测试的文本情感损失率曲线。具体实施方式为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,以下实施例结合附图对本专利技术的深度学习商品评论文本情感倾向分析方法作具体阐述。如图1所本文档来自技高网
...

【技术保护点】
1.一种深度学习商品评论文本情感倾向分析方法,其特征在于,包括以下步骤:步骤S1:将所述文本进行处理得到最简文本,并对该最简文本划分训练集与测试集;步骤S2:将所述训练集中的单个文本逐词分隔得到对应的词语序列,该词语序列包含多个构成词,对该构成词对应设置感情特征,对该感情特征设置情感权重值;步骤S3:基于所述词语序列调整所述构成词的情感权重值得到矫正情感权重值;步骤S4:将所述词语序列按不同分段方式得到多个词组序列;步骤S5:分别对所述词组序列中每个所述感情特征的所述矫正情感权重值进行计算,根据计算结果选择所述感情特征作为该词组序列对应的所述文本的文本情感标签;步骤S6:将所述文本情感标签与该文本的人为感情评价进行对比,根据对比结果通过调整所述情感权重值与所述矫正情感权重值改变所述文本情感标签进而使得所述文本情感标签与所述人为感情评价一致,将最终得到的情感权重值设定为最终情感权重值,将最终得到的矫正情感权重值设定为最终矫正情感权重值;步骤S7:对训练集中的所有所述文本执行步骤S2‑步骤S6;步骤S8:运用最终情感权重值与最终矫正情感权重值构成的情感模型对所述测试集进行情感分析,并验证情感分析的准确性。...

【技术特征摘要】
1.一种深度学习商品评论文本情感倾向分析方法,其特征在于,包括以下步骤:步骤S1:将所述文本进行处理得到最简文本,并对该最简文本划分训练集与测试集;步骤S2:将所述训练集中的单个文本逐词分隔得到对应的词语序列,该词语序列包含多个构成词,对该构成词对应设置感情特征,对该感情特征设置情感权重值;步骤S3:基于所述词语序列调整所述构成词的情感权重值得到矫正情感权重值;步骤S4:将所述词语序列按不同分段方式得到多个词组序列;步骤S5:分别对所述词组序列中每个所述感情特征的所述矫正情感权重值进行计算,根据计算结果选择所述感情特征作为该词组序列对应的所述文本的文本情感标签;步骤S6:将所述文本情感标签与该文本的人为感情评价进行对比,根据对比结果通过调整所述情感权重值与所述矫正情感权重值改变所述文本情感标签进而使得所述文本情感标签与所述人为感情评价一致,将最终得到的情感权重值设定为最终情感权重值,将最终得到的矫正情感权重值设定为最终矫正情感权重值;步骤S7:对训练集中的所有所述文本执行步骤S2-步骤S6;步骤S8:运用最终情感权重值与最终矫正情感权重值构成的情感模型对所述测试集进行情感分析,并验证情感分析的准确性。2.根据权利要求1所述的深度学习商品评论文本情感倾向分析方法,其特征在于:其中,步骤S1中,处理的过程包括以下子步骤...

【专利技术属性】
技术研发人员:应捷苏灵松肖昊琪
申请(专利权)人:上海理工大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1