The present invention relates to an emotional classification method for tourism evaluation based on at_GRU neural network and emotional dictionary, which is used to realize the semantic classification of tourism users'evaluation of tourism as a whole according to the evaluation text of the whole journey by tourists. It includes the following steps: 1) emotional feature processing stage: vectorization of emotional features in Tourism commentary by constructing a composite special emotional dictionary for Tourism Processing; 2) Data preprocessing stage: the original comment text training words Vector and context vector stitching, the stitching vector and vectorized emotional features are fused as input of bidirectional GRU neural network; 3) bidirectional GRU text semantic classification model stage: training bidirectional GRU neural network and classification of tourism evaluation emotions. Compared with the prior art, the invention has the advantages of high accuracy, considering the accuracy of emotion dictionary and robustness of machine learning, etc.
【技术实现步骤摘要】
结合At_GRU神经网络与情感词典的旅游评价情感分类方法
本专利技术涉及自然语言处理及深度学习领域,尤其是涉及一种结合At_GRU神经网络与情感词典的旅游评价情感分类方法。
技术介绍
旅游线路评价是记录游客于旅行网站对某景点制定的特定旅行线路的反馈,是最直接表达旅客对该条旅行线路的满意程度或建议意见,垂直连接旅客与旅游网站的纽带。通过旅游线路评价,旅客可以详细阐述该线路对行程安排、住宿情况、交通安排等供其他旅客借鉴,旅游公司也可以直接听取意见,快速响应改善、调整该条旅行线路等细节,提升服务、加强旅客的满意度。因此快速准确地对旅游线路评价进行详细的分析、处理并得出精准的评价等级及分类可以极大提高旅行线路优化速度,缩短反馈间隙,同时降低人工分析费用并有效提升旅行公司的服务质量。旅游线路评价信息是记录旅客反馈的重要信息,主要表现为短文本形式的自然语言段落。同时近年来,关于自然语言处理技术一直处于高速发展,尤其以文本语义分析作为重要研究对象尤为突出,文本语义分析即对文本进行结构化提取、分析和理解,从语义层面进行关联,从而准确理解文本含义。语义分析方法包括传统方法与深度学习方法,其中深度学习相较于传统方法可以提取更多有效的文本特征,以及更高的准确率。在国内外都有大量学者做过相关研究,何有世提出基于决策树的多特征组合语义挖掘,夏名首等人采用ICTCLAS分词技术以及词频统计进行商品评价特征挖掘,但未能引用深度学习训练,因而也不能很好的提取更精准的特征,李杰等人采用CNN模型进行短文本分析,但未能充分利用上下文语义信息,造成分类不够准确问题。
技术实现思路
本专利技术的目的 ...
【技术保护点】
1.一种结合At_GRU神经网络与情感词典的旅游评价情感分类方法,用以根据游客对该旅行全程的评价文本实现旅游用户对旅游整体的评价语义分类,其特征在于,包括以下步骤:1)情感特征处理阶段:通过构建复合型旅游专用情感词典对旅游评论中的情感特征进行向量化处理;2)数据预处理阶段:对原始评论文本训练词向量并进行上下文向量拼接,将拼接后的向量与向量化后的情感特征进行融合,作为双向GRU神经网络的输入;3)双向GRU文本语义分类模型阶段:训练双向GRU神经网络并对旅游评价情感进行分类。
【技术特征摘要】
1.一种结合At_GRU神经网络与情感词典的旅游评价情感分类方法,用以根据游客对该旅行全程的评价文本实现旅游用户对旅游整体的评价语义分类,其特征在于,包括以下步骤:1)情感特征处理阶段:通过构建复合型旅游专用情感词典对旅游评论中的情感特征进行向量化处理;2)数据预处理阶段:对原始评论文本训练词向量并进行上下文向量拼接,将拼接后的向量与向量化后的情感特征进行融合,作为双向GRU神经网络的输入;3)双向GRU文本语义分类模型阶段:训练双向GRU神经网络并对旅游评价情感进行分类。2.根据权利要求1所述的一种结合At_GRU神经网络与情感词典的旅游评价情感分类方法,其特征在于,所述的步骤1)具体包括以下步骤:11)构建复合型旅游专用情感词典:统计多种现有的情感词典,并合并其中的相同极性词语,形成复合型情感词典,分别对复合情感词典和分词后的旅游评价词向量化,并获取词典中每个单词与旅游评价所有单词的欧式距离,选择距离相近的作为相近同类情感词,融合形成复合型旅游专用情感词典;12)语义逻辑规则处理:读取旅游评论,以中英文标点符号作为分句标识对评论进行分句,并根据分句的词性获取每个分句的情感值,结合每个分句的情感值作为该条评论的情感极性;13)情感特征向量化:将处理好的分句的情感极性进行增维并向量化。3.根据权利要求2所述的一种结合At_GRU神经网络与情感词典的旅游评价情感分类方法,其特征在于,所述的步骤11)中,现有的情感词典包括清华大学词典、知网Hownet情感词典和台湾大学简体中文情感词典。4.根据权利要求1所述的一种结合At_GRU神经网络与情感词典的旅游评价情感分类方法,其特征在于,所述的步骤2)具体包括以下步骤:21)分词、去除停用词以及训练词向量:将原始评论文本信息定义为S,包含构成的词语集W(w1,w2,...,wn),n为句子S的词语数量,采用ICTCLAS工具对原始评论文本分词后并去除停用词,采用Word2vec工具对词语集W(w1,w2,...,wn)进行词向量训...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。