电商评论分析方法、系统及计算机可读存储介质技术方案

技术编号：37393459 阅读：36 留言：0更新日期：2023-04-27 07:30

本发明专利技术涉及电商评论分析方法、系统及计算机可读存储介质，其电商评论分析方法包括：抓取电商平台的商品评论数据；对商品评论数据进行清洗，得到目标商品评论数据；利用电商评论观点分析模型对目标商品评论数据进行观点分析，得到每条评论文本的四元组信息，四元组信息包括属性词及其对应的属性类别、观点词、情感极性；具体利用BERT模型和BiLSTM模型进行编码，之后获取四元组信息。本发明专利技术采用基于BERT和BiLSTM编码相结合，先抽取属性词，然后基于属性词信息抽取观点词，并进行属性类别和情感极性的判别，实现了更细粒度的四元组（属性、观点、属性类别、情感极性）抽取，能更好地分析消费者对商品的观点和看法。费者对商品的观点和看法。费者对商品的观点和看法。

全部详细技术资料下载

【技术实现步骤摘要】
电商评论分析方法、系统及计算机可读存储介质

[0001]本专利技术属于数据分析
，具体涉及电商评论分析方法、系统及计算机可读存储介质。

技术介绍

[0002]随着互联网电商的发展和普及，越来越多的消费者开始在电商平台上购物。在购物过程中，消费者往往会通过发表评论来描述对商品的使用体验，商家端会积累大量的商品评论数据。对商家来说，从大量的商品评论数据中挖掘出消费者的观点和情感倾向，对于把握消费者需求和喜好，同时将其用于竞品分析、产品迭代、体验优化等有着很现实的意义。现有技术中，按照情感倾向的不同判别粒度，可以将评论观点分析分为句子粒度情感分析和细粒度情感分析（Aspect
‑
based Sentiment Analysis，简称ABSA）。
[0003]句子粒度情感分析一般就是判别某个用户的一条评论的整体情感，常见的分类为“好评”、“中评”、“差评”；如果一条评论中只存在一种情感极性，如“快递很给力，第二天就到了”，句子粒度情感分析可以将其分类到“好评”标签中；如果一条评论中存在多种情感极性，如“快递很给力，第二天就到了，就是味道不太好闻”中有正负两种情感极性，句子粒度情感分析就很难进行分类。句子粒度情感分析由于其粒度较大，导致分析结果很多时候是没有太大的参考价值。句子粒度情感分析属于文本分类任务，常见的算法模型有长短期记忆网络（Long short term memory，简称LSTM）文本分类模型、双向编码表征转换算法（Bidirectional Encoder Representa...

【技术保护点】

【技术特征摘要】
1.一种电商评论分析方法，其特征在于，包括以下步骤：S1、抓取电商平台的商品评论数据；S2、对商品评论数据进行清洗，得到目标商品评论数据；S3、利用电商评论观点分析模型对目标商品评论数据进行观点分析，得到每条评论文本的四元组信息，四元组信息包括属性词及其对应的属性类别、观点词、情感极性；其中，观点分析的过程，包括以下步骤：S31、将目标商品评论数据输入BERT模型进行编码，取BERT模型的后四层向量的平均值作为BERT编码向量；将目标商品评论数据转换为腾讯词向量，之后输入第一BiLSTM模型进行编码，得到BiLSTM编码向量；将BERT编码向量和BiLSTM编码向量拼接，得到句子编码向量；S32、基于句子编码向量进行属性词抽取，得到属性词；S33、基于属性词进行观点词的抽取以及属性类别和情感极性的预测。2.根据权利要求1所述的一种电商评论分析方法，其特征在于，所述步骤S32具体包括：句子编码向量分别经过第一全连接网络和第二全连接网络分别得到Start和End序列，两个序列组合以抽取属性词；其中，Start和End序列分别用于标记每个属性词的开始和结束位置，序列长度和评论文本的字符个数相等；对于Start序列，在属性词开始的位置为1，其它位置为0；对于End序列，在属性词结束的位置为1，其它位置为0。3.根据权利要求2所述的一种电商评论分析方法，其特征在于，所述步骤S33具体包括以下步骤：S331、对句子编码向量中的属性词进行显式标注，并进行向量转换得到第一目标句向量；将属性词对应的词向量拼接在第一目标句向量中的每个字向量之后，得到第二目标句向量；以属性词的开始位置作为初始零位，基于第一目标句向量往两边扩充，每移动一个字，就在上一个字的位置基础上加1，以得到每个字的相对位置并进行向量编码，得到相对位置编码；将相对位置编码拼接在第二目标句向量中的每个字向量之后，得到第三目标句向量；S332、将第一目标句向量、第二目标句向量和第三目标句向量输入第二BiLSTM模型，以输出BiLSTM特征向量；S333、BiLSTM特征向量输入第三全连接网络，以进行观点词的抽取；BiLSTM特征向量输入第四全连接网络，以进行属性类别和情感极性的预测。4.根据权利要求3所...

【专利技术属性】
技术研发人员：倪进鑫，
申请(专利权)人：杭州实在智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人