The invention requests protection of a method for predicting automobile sales based on emotional analysis. The method obtains comment data from automobile comment website and preprocesses the data. According to user's experience, the comment data is divided into six aspects: safety, comfort, control, power, economy and service. Affective factors were integrated into the model to establish affective prediction models. Predict the sales of automobiles, find out which aspect of automobile performance consumers pay more attention to, as a guide for future production. The operation process of this method: the user inputs the previous sales data, brings the data into the model, and obtains the sales forecast data for the next quarter. This prediction method improves the prediction accuracy.
【技术实现步骤摘要】
一种基于评论情感分析的汽车销量预测方法
本专利技术属于汽车销量分析预测领域,具体属于一种涉及评论情感分析的评论情感分析的汽车销量。
技术介绍
汽车销量预测技术指的是根据以往的销售数据和其他数据对下个某个阶段的销量进行估计。现有的汽车销量预测技术主要是根据以往的销售数据,使用自回归模型或者灰色模型预测技术。基于这些预测方法的局限在于,深入在以往的销售数据忽略了用户的评论数据的影响。根据研究在线评论数据有助于提高销量预测模型的准确率。基于汽车评论数据进行预测是当前研究的热门方向,但存在一些难点如在自然语言处理方面(现在的评论语言种类繁多,随意性大,网络用语较多)。
技术实现思路
本专利技术旨在解决以上现有技术的问题。提出了一种提高预测的准确性的基于评论情感分析的汽车销量预测方法。本专利技术的技术方案如下:一种基于评论情感分析的汽车销量预测方法,其包括如下步骤:1)、对汽车评论数据进行包括统一格式并剔除重复词汇在内的预处理;2)、利用中科院汉语语法系统对经过预处理后的汽车评论数据进行分词处理,去除停用词;3)、利用多标签分类技术对对步骤2分词处理后的评论数据集进行多标签分类;4)、使用互信息技术对情感值进行量化,求得评论文本集的情感值;5)、将情感值融合进入回归模型预测下个阶段的汽车销量。进一步的,所述步骤1)将汽车评论数据分为舒适、动力、操控、服务、经济和安全六个方面,首先求出一个评论词与类标签之间的关系,公式如下:其中,n表示文档总数,表示词word不在文档Di中,x2表示某一个词word和汽车某一方面lj之间的相关性,表示不含有lj方面,即p(word,lj) ...
【技术保护点】
1.一种基于评论情感分析的汽车销量预测方法,其特征在于,包括如下步骤:1)、对汽车评论数据进行包括统一格式并剔除重复词汇在内的预处理;2)、利用中科院汉语语法系统对经过预处理后的汽车评论数据进行分词处理,去除停用词;3)、利用多标签分类技术对对步骤2分词处理后的评论数据集进行多标签分类;4)、使用互信息技术对情感值进行量化,求得评论文本集的情感值;5)、将情感值融合进入回归模型预测下个阶段的汽车销量。
【技术特征摘要】
1.一种基于评论情感分析的汽车销量预测方法,其特征在于,包括如下步骤:1)、对汽车评论数据进行包括统一格式并剔除重复词汇在内的预处理;2)、利用中科院汉语语法系统对经过预处理后的汽车评论数据进行分词处理,去除停用词;3)、利用多标签分类技术对对步骤2分词处理后的评论数据集进行多标签分类;4)、使用互信息技术对情感值进行量化,求得评论文本集的情感值;5)、将情感值融合进入回归模型预测下个阶段的汽车销量。2.根据权利要求1所述的基于评论情感分析的汽车销量预测方法,其特征在于,所述步骤1)将汽车评论数据分为舒适、动力、操控、服务、经济和安全六个方面,首先求出一个评论词与类标签之间的关系,公式如下:其中,n表示文档总数,表示词word不在文档Di中,x2表示某一个词word和汽车某一方面lj之间的相关性,表示不含有lj方面,即p(word,lj)表示词Word在文档Di中出现的次数且lij=1,lj表示汽车的某一方面性能,j表示其中某一种性能编号(1≤j≤6),i表示第i篇文档。p(word)表示词word在文档Di中出现的次数,p(word)表示词word在文档Di中出现的次数,p(lj)文本集中lj出现的次数,表示词word不在文档Di出现的次数。3.根据权利要求1或2所述的基于评论情感分析的汽车销量预测方法,其特征在于,所述步骤1)使用中科院计算所的汉语词法分析系统ICTCLAS3,首先将搜狗输入法中与汽车行业相关的细胞词库导入汉语词法分析系统,利用UltraEdit编辑器将非文本格式的词库解析出来,统一格式并剔除重复词汇。4.根据权利要求3所述的基于评论情感分析的汽车销量预测方法,其特征在于,所述步骤2)将数词、代词、量词、拟声词、方位词、连词、叹词、后接成分和助词作为停用词。5.根据权利要求2所述的基于...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。