一种基于观点挖掘分析的汽车竞品对比方法技术

技术编号:22468695 阅读:35 留言:0更新日期:2019-11-06 12:09
本发明专利技术公开了一种基于观点挖掘分析的汽车竞品对比方法,首先构建汽车用户评价训练数据集,之后使用深度学习网络结构,包括卷积神经网络TextCNN训练文本主题抽取模型、LSTM‑Attention训练文本情感极性判别模型;通过结合TextCNN及LSTM‑Attention两种深度学习模型,利用pipeline处理的方式得到汽车用户评价主题及主题情感打分,最后利用模型输出主题评价和情感极性实现基于汽车用户评论观点的汽车竞品对比。与现有技术相比,汽车竞品分析来源于用户评论,具有真实性高、可行性强的特点,且模型有良好的准确率和通用性。

A comparison method of automobile competitive products based on view mining analysis

【技术实现步骤摘要】
一种基于观点挖掘分析的汽车竞品对比方法
本专利技术涉及自然语言处理观点挖掘分析领域,特别涉及一种基于观点挖掘分析的汽车竞品对比方法。
技术介绍
伴随互联网2.0时代的迅速发展,传统生活方式和商业结构发生巨大变革,互联网伴随每个人生活的各个方面,人们习惯于在互联网中留下大量文本信息以发表观点、表述情感。随着政府对新能源汽车的大力扶植以及智能联网汽车兴起都预示着未来几年汽车行业的多元化发展及转变,汽车厂商需要了解自身产品是否能够满足消费者的需求,但传统的调研手段因为样本量小、效率低等缺陷已经无法满足当前快速发展的市场环境。因此,汽车厂商需要一种快速、准确的方式来了解消费者需求。在汽车行业领域,各大汽车门户网站存在大量消费者对各个车型评价数据,寻找合适的手段分析、处理这些数据能够使得汽车厂商加快研发进度,提高企业收益,用户观点挖掘及文本情感分析是该问题很好的解决方案。近几年深度学习在自然语言处理领域特别是观点挖掘及分析领域中表现出了较强的泛化能力和鲁棒性。常用方法是将文本进行词嵌入处理,使用深度卷积网络(CNN),循环神经网络(RNN)对进行一系列词嵌入序列进行文本分类。使用CNN做分类模本文档来自技高网...

【技术保护点】
1.一种基于观点挖掘分析的汽车竞品对比方法,通过构建流处理的深度网络学习框架,利用自然语言处理文本挖掘方法,挖掘汽车用户文本评价观点以实现汽车竞品对比,其特征在于,包含以下主要步骤:步骤1、数据获取及预处理:步骤1.1数据获取:评论数据收集,利用网络爬虫技术获得各大汽车网站中各个品牌汽车的用户评价信息;数据包括,汽车品牌、用户对该车型的文本评价和时间属性;步骤1.2数据预处理:对步骤1.1中原始数据中的用户文本评价部分进行数据预处理其中包括:去除数据中非文本部分、中文分词以及去除停用词部分;步骤1.3数据标注:定义汽车评论所属类别包括:操控、动力、空间、内饰、舒适、外观、油耗;对步骤1.2中处...

【技术特征摘要】
1.一种基于观点挖掘分析的汽车竞品对比方法,通过构建流处理的深度网络学习框架,利用自然语言处理文本挖掘方法,挖掘汽车用户文本评价观点以实现汽车竞品对比,其特征在于,包含以下主要步骤:步骤1、数据获取及预处理:步骤1.1数据获取:评论数据收集,利用网络爬虫技术获得各大汽车网站中各个品牌汽车的用户评价信息;数据包括,汽车品牌、用户对该车型的文本评价和时间属性;步骤1.2数据预处理:对步骤1.1中原始数据中的用户文本评价部分进行数据预处理其中包括:去除数据中非文本部分、中文分词以及去除停用词部分;步骤1.3数据标注:定义汽车评论所属类别包括:操控、动力、空间、内饰、舒适、外观、油耗;对步骤1.2中处理后的用户文本评价数据标注,首先将评论所属类别进行标注,用户文本评价及文本评价所属类别作为数据集1;之后对各个评论的情感极性进行标记作为数据集2;经标记后,数据集1包括汽车品牌、用户对该车型的文本评价和文本评价所属类别,数据集2包括汽车品牌、用户对该车型的文本评价和文本评价情感极性;数据集1、数据集2分别包含4000条训练数据;步骤2、训练TextCNN、LSTM-Attention模型:步骤2.1模型参数配置:在步骤1.3中获得模型训练数据集总量为4000记为S;模型过程设置N个epochs,即模型迭代训练N次,选定每一个epoch的batch-size值为K,即在每次迭代训练过程中需要进行训练S/K次,每次K条文本参与训练,模型训练均使用交叉熵损失函数作为损失函数,模型训练使用Adam损失函数作为损失优化函数;步骤2.2训练文本类别抽取模型Cm:将步骤1.3中经标注的数据集1作为训练数据输入给Cm,Cm模型判别评论的所属类别包括外观、内饰、空间、舒适、油耗、操控、性价比,采用多分类交叉熵损失函数结合L2范数优化...

【专利技术属性】
技术研发人员:李天瑞乔东殷成凤王淑营贾真
申请(专利权)人:西南交通大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1