本发明专利技术提供了一种基于租车网站评论的情感分析可视化的方法,包括以下步骤:获取评价数据;构建词典;对评价数据进行数据预处理;对预处理后的文本数据进行情感分析;统计维度词和有情感的评价词的数量;将统计完毕后的数据导入可视化软件进行数据可视化;将可视化数据通过接口导入网站。经过评论数量的积累后,用户可以通过查看数据图表方便,快捷地了解每辆车和租车点的评论,然后选择自己心仪的汽车租用。这个自然语言处理运用可以增加用户对租车体验的满意度,同时也能让租车点对自己的服务进行优化。进行优化。进行优化。
【技术实现步骤摘要】
一种基于租车网站评论的情感分析可视化的方法及设备
[0001]本专利技术涉及计算机
,具体涉及一种基于租车网站评论的情感分析可视化的方法及设备。
技术介绍
[0002]随着人工智能和5G时代的快速发展,运用人工智能技术进行数据分析成为了一个重要的应用方向。在这个快节奏的社会里,人们更喜欢看图片,图表等快速准确地获取有用的信息而不再喜欢看大篇幅的文字。因此,本专利技术提出一种方法和运用,从租车网站中大量用户的评论中提取有用评论并将它们以图表形式展示给用户。
[0003]在目前主流的租车网站中,并没有找到可以对租车点和汽车进行评论的模块。这种情况会让用户在选择汽车时产生过多的纠结和犹豫,也会担心租的汽车是否适合该用户驾驶。因此,提供用户进行评论的功能以及将评论以图表形式可视化将会让用户更安心地去租用自己心仪的汽车。
技术实现思路
[0004]本专利技术的目的在于提供一种基于租车网站评论的情感分析可视化的方法及设备,以期解决
技术介绍
中存在的问题。
[0005]为了实现上述目的,本专利技术采用以下技术方案:
[0006]一种基于租车网站评论的情感分析可视化的方法,包括以下步骤:
[0007]获取评价数据;
[0008]构建词典;
[0009]对评价数据进行数据预处理;
[0010]对预处理后的文本数据进行情感分析;
[0011]统计维度词和有情感的评价词的数量;
[0012]将统计完毕后的数据导入可视化软件进行数据可视化;
[0013]将可视化数据通过接口导入网站。
[0014]在一些实施例中,所述获取评价数据,包括:获取初始汽车评论信息以及系统采集用户租车完成后对租车点和租用车型的评论。
[0015]随着网站的运行,用户的评论增多,不断扩充数据集。
[0016]数据集数据来源包括但不限于懂车帝,汽车之家等与汽车有关的网站。
[0017]在一些实施例中,所述构建词典包括,基于获取评价数据构建情感词词典和维度词词典。
[0018]在一些实施例中,所述对评价数据进行数据预处理包括,去除重复评论,使用结巴分词,以及去除停用词。
[0019]在一些实施例中,所述对预处理后的文本数据进行情感分析包括,对文本数据使用Bert预训练和深度学习模型进行情感分析。
[0020]在一些实施例中,进行情感分析的方法为:
[0021]将数据集分为训练集和测试集,并进行Bert预训练获得相应的词向量,再与维度词词典的词ID构建矩阵;
[0022]使用深度神经网络Bi
‑
LSTM模型对数据进行训练和测试。
[0023]情感分析可视化的方法包括但不限于Bert预训练+深度学习模型。
[0024]在一些实施例中,使用深度神经网络Bi
‑
LSTM模型对数据进行训练和测试,包括:设定Bert词向量维度768,LSTM维度为384,LSTM
‑
layers为3,dropout为0.5,选择双向循环;模型后面用SoftMax函数和交叉熵损失函数得出评论数据的极性;数据的极性分为
‑
1,0,1,分别代表差评,中评,好评三种类型的评论数据。
[0025]在一些实施例中,所述统计维度词和有情感的评价词的数量包括,统计每个维度词相对应的好评,中评以及差评。
[0026]在一些实施例中,所述将统计完毕后的数据导入可视化软件进行数据可视化包括,将统计后的数据进行整理,按照维度词进行切片,最终通过可视化软件进行数据可视化。
[0027]可视化软件包括但不限于Tableau。
[0028]本申请还提供了一种基于租车网站评论的情感分析可视化的设备,包括:
[0029]信息交互模块,用于与网站进行交互,接收网站的用户评论数据,输入到数据采集模块,然后获取从数据可视化模块返回的结果,并将结果作为答案输出到网站页面上;
[0030]数据采集模块,用于采集任务相关的数据;
[0031]检索库模块,用于构建情感词词典和维度词词典;
[0032]数据预处理模块,用于对评论数据进行数据清洗;
[0033]情感分析模块,用于对评论数据进行情感分析,得出评论是否为好评,中评或者差评;
[0034]数据统计模块,用于统计各维度词的好评,中评,差评的数量;
[0035]数据可视化模块,用于将数据统计模块的数据以图表形式展现。
[0036]本申请所提供的一种基于租车网站评论的情感分析可视化的方法具有的有益效果包括但不限于:
[0037]经过评论数量的积累后,用户可以通过查看数据图表方便,快捷地了解每辆车和租车点的评论,然后选择自己心仪的汽车租用。这个自然语言处理运用可以增加用户对租车体验的满意度,同时也能让租车点对自己的服务进行优化。
附图说明
[0038]图1为本基于租车网站评论的情感分析可视化的方法的流程图;
[0039]图2为基于租车网站评论的情感分析可视化的装置结构框图。
具体实施方式
[0040]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0041]相反,本申请涵盖任何由权利要求定义的在本申请的精髓和范围上做的替代、修改、等效方法以及方案。进一步,为了使公众对本申请有更好的了解,在下文对本申请的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本申请。
[0042]以下将结合图1
‑
2对本申请实施例所涉及的一种基于租车网站评论的情感分析可视化的方法进行详细说明。值得注意的是,以下实施例仅仅用于解释本申请,并不构成对本申请的限定。
[0043]本专利技术的目的在于在租车网站上收集用户评论并可视化展示出来,这种基于租车网站评论的情感分析可视化的方法的主要难点在于目前还没有用户对租用的汽车和该租车点的评论,在使用初期能利用的数据较少,以及初期做出的评论会有一定的误差。
[0044]本专利技术将在其他汽车网站上获取对每个车型相应的评论,尽可能在本专利技术使用初期能用显示较为准确的评论。之后随着用户租用汽车的数量增多,网站收集的评论随之增加,会逐渐地对评论的图表进行优化。用户也会对网站显示的图表更加信赖。主要包括以下步骤:
[0045]如图1
‑
2所示,一种基于租车网站评论的情感分析可视化的方法,具体包括以下几个步骤:
[0046]步骤s1:在汽车网站获取初始汽车评论信息以及系统采集用户租车完成后对租车点和租用车型的评论;
[0047]步骤s2:建立情感词词典以及维度词词典;
[0048]步骤s3:对初始数据进行数据预处理;
[0049]步骤s4:对预处理后的文本数据进行情感分析;...
【技术保护点】
【技术特征摘要】
1.一种基于租车网站评论的情感分析可视化的方法,其特征在于,包括以下步骤:获取评价数据;构建词典;对评价数据进行数据预处理;对预处理后的文本数据进行情感分析;统计维度词和有情感的评价词的数量;将统计完毕后的数据导入可视化软件进行数据可视化;将可视化数据通过接口导入网站。2.根据权利要求1所述的一种基于租车网站评论的情感分析可视化的方法,其特征在于,所述获取评价数据,包括:获取初始汽车评论信息以及系统采集用户租车完成后对租车点和租用车型的评论。3.根据权利要求1所述的一种基于租车网站评论的情感分析可视化的方法,其特征在于,所述构建词典包括,基于获取评价数据构建情感词词典和维度词词典。4.根据权利要求1所述的一种基于租车网站评论的情感分析可视化的方法,其特征在于,所述对评价数据进行数据预处理包括,去除重复评论,使用结巴分词,以及去除停用词。5.根据权利要求1所述的一种基于租车网站评论的情感分析可视化的方法,其特征在于,所述对预处理后的文本数据进行情感分析包括,对文本数据使用Bert预训练和深度学习模型进行情感分析。6.根据权利要求5所述的一种基于租车网站评论的情感分析可视化的方法,其特征在于,进行情感分析的方法为:将数据集分为训练集和测试集,并进行Bert预训练获得相应的词向量,再与维度词词典的词ID构建矩阵;使用深度神经网络Bi
‑
LSTM模型对数据进行训练和测试。7.根据权利要求6所述的一种基于租车网站评论的情感分析可视化的方法,其特征在于,使用深度神经网络Bi<...
【专利技术属性】
技术研发人员:刘峻枫,杨兰,周兴发,司成良,
申请(专利权)人:四川长虹电子控股集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。