【技术实现步骤摘要】
一种基于自然语言处理的评论分析报告生成方法
[0001]本专利技术涉及一种基于自然语言处理的评论分析报告生成方法,属于文本数据挖掘、评论分析、自然语言处理领域。
技术介绍
[0002]如今,电子商务已经渗透各行各业,消费者也养成了从购物平台上获取商品信息、购买商品、评价商品、与其他消费者互动交流的习惯。商品评论是商品详情页中必备的板块,影响着消费者在网上购物的全流程。首先,消费者在购物平台上挑选商品时会浏览商品的具体评论,进而判断商品是否货真价实或者符合自己需求;接着,消费者在购物平台上选中的心仪的商品后,可以浏览各个款式/型号/颜色的评论描述,帮助挑选合适的商品款式/型号/颜色;然后,消费者在签收商品的快递包裹后,可以在购物平台的评论区发表拆箱感受、初次使用感受、对物流包装的满意度等内容;最后,消费者可以在商品评论的详情页中对商品细节进一步展开讨论,促成新用户的消费。购物平台上大量的商品评论不仅影响着消费者购物的全流程,而且可以帮助商家更好地完成选品优化、产品性能改进等方面的工作。
[0003]许多企业已经认识到用 ...
【技术保护点】
【技术特征摘要】
1.一种基于自然语言处理的评论分析报告生成方法,其特征在于,包括以下步骤:步骤S1、爬取一领域的用户评论文本数据,获得评论集;步骤S2、从评论集中挖掘领域新词,添加至自定义词表;步骤S3、基于自定义词表与停用词表,对评论集中的文本进行分词后输入主题模型,将评论文本归为多类评论话题;步骤S4、基于每类评论话题下的关键文本,运用摘要模型和情感分类模型输出该话题的摘要和情感值,并生成评论集的话题清单;步骤S5、基于所有评论话题的排列在预设位置前的多个关键词绘制话题图谱;步骤S6、结合实际业务从话题图谱中筛选出用户需求项,并挖掘需求项的同义词;步骤S7、对每个需求项,筛选包含该关键词或其同义词的所有评论文本,基于依存句法规则从评论文本提取包括评价对象和评价词的二元组,抽取每个二元组对应的最短子句,计算所有最短子句的情感均值作为该需求项的满意度,并对二元组拼接形成的短语进行文本聚类以获得关于该需求项的多个评价主题;步骤S8、对每个需求项,从评论集中提取与该需求项有关的建议句;步骤S9、计算每个需求项的关注度,基于IF
−
Kano卡诺模型对需求项进行分类,并生成评论集的需求分析清单;步骤S10、根据实际业务确定技术项/服务项,基于需求分析清单的数据以及专家打分数据,构建技术项/服务项的质量屋。2.根据权利要求1所述的基于自然语言处理的评论分析报告生成方法,其特征在于,所述步骤S2包括以下子步骤:S21、将评论文本切分为短句;S22、对于每个短句,提取多种长度的词段;S23、计算每一个词段的平均互信息与左右邻接熵的综合值;S24、根据平均互信息与左右邻接熵的综合值,计算词段的综合得分,根据综合得分人工筛选出评论集的相关新词,并添加至自定义词表。3.根据权利要求2所述的基于自然语言处理的评论分析报告生成方法,其特征在于,所述步骤S3包括以下子步骤:S31、基于自定义词表与停用词表,对评论集中的所有评论文本进行分词,获得分词后的记录;S32、将分词后的记录输入主题模型,获得关于评论集的多个话题,以及每个话题排列在前的多个关键词;S33、基于训练的主题模型,寻找评论文本的最佳匹配话题。4.根据权利要求3所述的基于自然语言处理的评论分析报告生成方法,其特征在于,所述步骤S4包括以下子步骤:S41、提取话题的关键句;S42、生成话题的文本摘要;S43、将抽取到的关键句输入到文本情感分析模型,计算话题情感值;S44、生成评论集的话题清单,所述话题清单包括文本摘要、多个关键词、话题包含文本数和话题情感值。
5.根据权利要求4所述的基于自然语言处理的评论分析报告生成方法,其特征在于,所述步骤S5包括以下子步骤:S51、将步骤S31中分词后的记录输入词向量模型进行训练,生成各个关键词的词向量;S52、对关键词进行去重,保存至关键词列表;S53、计算关键词之间的语义相似度;S54、基于关键词列表,使用绘制话题图谱网络,生成话题图谱网络。6.根据权利要求5所述的基于自然语言处理的评论分析报告生成方法,其特征在于,所述步骤S6包括以下子步骤:S61、结合实...
【专利技术属性】
技术研发人员:张健,
申请(专利权)人:深圳联友科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。