文本的情感倾向分类方法、装置和服务器制造方法及图纸

技术编号:22022345 阅读:19 留言:0更新日期:2019-09-04 01:18
本公开提供了一种文本的情感倾向分类方法、装置和服务器;其中,该方法包括:获取待处理的文本数据;对文本数据进行分词处理,得到至少一个分词;通过预设的转换规则,将分词转换成词向量;将词向量输入至预先训练完成的情感倾向分类模型中,输出文本数据的情感倾向分类结果;其中,情感倾向分类模型包括双向GRU网络层和单向GRU网络层;双向GRU网络层包括多个依次连接的双向GRU网络单元;单向GRU网络层包括多个依次连接的单向GRU网络单元;双向GRU网络层中的双向GRU网络单元与单向GRU网络层中相应位置上的单向GRU网络单元连接。本公开可以提高情感倾向分类结果的准确性和鲁棒性。

Text Emotional Tendency Classification Method, Device and Server

【技术实现步骤摘要】
文本的情感倾向分类方法、装置和服务器
本公开涉及舆情分析
,尤其是涉及一种文本的情感倾向分类方法、装置和服务器。
技术介绍
相关技术中,可以使用情感词典判断文本的情感倾向,具体可以将文本与情感词典中的词进行匹配,对匹配结果进行统计分析,再基于预设的判断规则确定文本的情感倾向;但是情感词典和所需的判断规则均需要人工设计,因而使用该方式分析文本的情感倾向准确性依赖于人工经验和先验知识,易导致分析结果准确性不稳定且缺少广泛适用性。另一种方式中,可以采用LSTM(LongShort-TermMemory,长短期记忆网络)对文本的情感倾向进行分类;但是该LSTM网络不仅结构复杂、难以实现,而且仅能捕捉到文本的一部分语义信息,导致分析结果的准确性较差。
技术实现思路
本公开的目的在于提供一种文本的情感倾向分类方法、装置和服务器,以提高情感倾向分类结果的准确性和鲁棒性。为了实现上述目的,本公开采用的技术方案如下:第一方面,本公开提供了一种文本的情感倾向分类方法,该方法包括:获取待处理的文本数据;对文本数据进行分词处理,得到至少一个分词;通过预设的转换规则,将分词转换成词向量;将词向量输入至预先训练完成的情感倾向分类模型中,输出文本数据的情感倾向分类结果;其中,情感倾向分类模型包括双向GRU网络层和单向GRU网络层;双向GRU网络层包括多个依次连接的双向GRU网络单元;单向GRU网络层包括多个依次连接的单向GRU网络单元;双向GRU网络层中的双向GRU网络单元与单向GRU网络层中相应位置上的单向GRU网络单元连接。第二方面,本公开提供了一种文本的情感倾向分类装置,装置包括:数据获取模块,用于获取待处理的文本数据;分词模块,用于对文本数据进行分词处理,得到至少一个分词;转换模块,用于通过预设的转换规则,将分词转换成词向量;分类模块,用于将词向量输入至预先训练完成的情感倾向分类模型中,输出文本数据的情感倾向分类结果;其中,情感倾向分类模型包括双向GRU网络层和单向GRU网络层;双向GRU网络层包括多个依次连接的双向GRU网络单元;单向GRU网络层包括多个依次连接的单向GRU网络单元;双向GRU网络层中的双向GRU网络单元与单向GRU网络层中相应位置上的单向GRU网络单元连接。第三方面,本公开提供了一种服务器,包括处理器和存储器,存储器存储有能够被处理器执行的机器可执行指令,处理器执行机器可执行指令以实现上述文本的情感倾向分类方法。第四方面,本公开提供了一种机器可读存储介质,机器可读存储介质存储有机器可执行指令,机器可执行指令在被处理器调用和执行时,机器可执行指令促使处理器实现上述文本的情感倾向分类方法。上述文本的情感倾向分类方法、装置、服务器和机器可读存储介质,其使用的情感倾向分类模型中包含双向GRU网络层和单向GRU网络层,并且双向GRU网络层中的双向GRU网络单元与单向GRU网络层中相应位置上的单向GRU网络单元连接。待处理文本进行分词、将分词转换成词向量后,将词向量输入至上述情感倾向分类模型中,从而得到文本数据的情感倾向分类结果;该方式中,通过模型中的双向GRU网络层可以获得分词间的双向语义依赖关系,通过单向GRU网络层可以将双向GRU网络层输出的双向GRU运算结果进行进一步汇总,从而输出最终的运算结果进行情感倾向分类,在全面提取文本语义信息的基础上实现情感倾向分类,分类结果的准确性和鲁棒性更佳。附图说明为了更清楚地说明本公开具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本公开实施方式提供的一种情感倾向分类模型的结构示意图;图2为本公开实施方式提供的一种文本的情感倾向分类方法的流程图;图3为本公开实施方式提供的另一种情感倾向分类模型的结构示意图;图4为本公开实施方式提供的另一种文本的情感倾向分类方法的流程图;图5为本公开实施方式提供的情感倾向分类模型中,一种双向GRU网络单元计算前向GRU结果和后向GRU结果的原理示意图;图6为本公开实施方式提供的一种GRU的神经网络结构图;图7为本公开实施方式提供的情感倾向分类模型中,一种双向GRU网络单元和单向GRU网络单元的原理示意图;图8为本公开实施方式提供的另一种情感倾向分类模型的结构示意图;图9为本公开实施方式提供的另一种情感倾向分类模型的原理示意图;图10为本公开实施方式提供的一种文本的情感倾向分类装置的结构示意图;图11为本公开实施方式提供的一种服务器的结构示意图。具体实施方式下面将结合实施方式对本公开的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本公开一部分实施方式,而不是全部的实施方式。基于本公开中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本公开保护的范围。考虑到相关技术中使用感情词典和LSTM网络分析文本的情感倾向时准确性较差的问题,本公开实施方式提供了一种文本的情感倾向分类方法、装置和服务器;该技术可以应用于高校舆情分析、社会舆情、网络舆情分析等场景中。下面具体描述。首先,本实施方式中提供的文本的情感倾向分类方法,拟采用深度学习网络训练得到的情感倾向分类模型,如图1所示,该情感倾向分类模型包括双向GRU(GatedRecurrentUnit,门控循环单元)网络层和单向GRU网络层;双向GRU网络层包括多个依次连接的双向GRU网络单元;单向GRU网络层包括多个依次连接的单向GRU网络单元;双向GRU网络层中的双向GRU网络单元与单向GRU网络层中相应位置上的单向GRU网络单元连接。作为示例,图1中的双向GRU网络层包括四个依次连接的双向GRU网络单元,单向GRU网络层包括四个依次连接的单向GRU网络单元。在实际实现时,双向GRU网络单元和单向GRU网络单元的数量可以根据实际需求设置,如70个、100个等。通常,双向GRU网络单元和单向GRU网络单元的数量相同,且相应位置的双向GRU网络单元与单向GRU网络单元相连接。上述相应位置可以理解为:如果双向GRU网络单元和单向GRU网络单元的数量为N,则第i个双向GRU网络单元与第i个单向GRU网络单元为相应位置的双向GRU网络单元与单向GRU网络单元,即第i个双向GRU网络单元与第i个单向GRU网络单元相连接;其中,N为大于1的自然数;1≤i≤N。基于上述情感倾向分类模型,如图2所示的一种文本的情感倾向分类方法的流程图;该方法包括如下步骤:步骤S202,获取待处理的文本数据。该文本数据通常由字符或字符串组成;该文本数据可以从网络上爬取,如微博、贴吧、评论网站等。步骤S204,对文本数据进行分词处理,得到至少一个分词。词语通常是文本数据中最小的语义单元,通过分析文本数据中各个词语的语义,可以统计得到该文本数据的情感倾向。因此,需要对文本数据进行分词处理,分词处理是自然语言处理中较为基础的一个处理方法,分词处理可以上述文本数据切割成一个个单独的词语。在实际实现时,分词处理具体可以采用开源的分词工具包实现,如Jieba工具包等。步骤S206,通过预设的本文档来自技高网...

【技术保护点】
1.一种文本的情感倾向分类方法,其特征在于,所述方法包括:获取待处理的文本数据;对所述文本数据进行分词处理,得到至少一个分词;通过预设的转换规则,将所述分词转换成词向量;将所述词向量输入至预先训练完成的情感倾向分类模型中,输出所述文本数据的情感倾向分类结果;其中,所述情感倾向分类模型包括双向GRU网络层和单向GRU网络层;所述双向GRU网络层包括多个依次连接的双向GRU网络单元;所述单向GRU网络层包括多个依次连接的单向GRU网络单元;所述双向GRU网络层中的双向GRU网络单元与所述单向GRU网络层中相应位置上的单向GRU网络单元连接。

【技术特征摘要】
1.一种文本的情感倾向分类方法,其特征在于,所述方法包括:获取待处理的文本数据;对所述文本数据进行分词处理,得到至少一个分词;通过预设的转换规则,将所述分词转换成词向量;将所述词向量输入至预先训练完成的情感倾向分类模型中,输出所述文本数据的情感倾向分类结果;其中,所述情感倾向分类模型包括双向GRU网络层和单向GRU网络层;所述双向GRU网络层包括多个依次连接的双向GRU网络单元;所述单向GRU网络层包括多个依次连接的单向GRU网络单元;所述双向GRU网络层中的双向GRU网络单元与所述单向GRU网络层中相应位置上的单向GRU网络单元连接。2.根据权利要求1所述的方法,其特征在于,将所述词向量输入至预先训练完成的情感倾向分类模型中,输出所述文本数据的情感倾向分类结果的步骤,包括:如果所述分词为多个,将每个分词对应的所述词向量分别输入至所述双向GRU网络层中的指定位置上的双向GRU网络单元;所述指定位置为:所述分词在所述文本数据中的排列位置;通过所述双向GRU网络单元计算输入的词向量的前向GRU结果和后向GRU结果,输出所述前向GRU结果和所述后向GRU结果的拼接结果;将所述拼接结果输入至与所述双向GRU网络单元连接的单向GRU网络单元;对于第一个单向GRU网络单元,计算输入的拼接结果的后向GRU结果,将计算结果输出至第二个单向GRU网络单元;对于除所述第一个单向GRU网络单元以外的单向GRU网络单元,将前一个单向GRU网络单元输出的计算结果与当前单向GRU网络单元接收到的拼接结果进行后向GRU运算,将计算结果输出至下一个单向GRU网络单元;直至最后一个单向GRU网络单元输出计算结果;根据最后一个单向GRU网络单元输出的计算结果确定所述文本数据的情感倾向分类结果。3.根据权利要求2所述的方法,其特征在于,所述情感倾向分类模型还包括全连接层和分类函数层;根据最后一个单向GRU网络单元输出的计算结果确定所述文本数据的情感倾向分类结果的步骤,包括:将最后一个单向GRU网络单元输出的计算结果输入至所述全连接层;通过所述全连接层对接收到的计算结果进行特征映射处理,得到所述文本数据对应的特征向量;所述全连接层预设有权重参数和偏置参数,所述特征映射处理基于所述权重参数和所述偏置参数进行;将所述特征向量输入至所述分类函数层;通过所述分类函数层对所述特征向量进行归一化处理,得到所述文本数据的情感倾向分类结果。4.根据权利要求2所述的方法,其特征在于,所述情感倾向分类模型中的双向GRU网络层为多层;多层双向GRU网络层的相应位置上的双向GRU网络单元依次连接;最后一层双向GRU网络层中的双向GRU网络单元与所述单向GRU网络层中相应位置上的单向GRU网络单元连接;通过所述双向GRU网络单元计算输入的词向量的前向GRU结果和后向GRU结果,输出所述前向GRU结果和所述后向GRU结果的拼接结果的步骤,包括:对于第一层双向GRU网络层,通过所述双向GRU网络层中的双向GRU网络单元计算输入的词向量的前向GRU结果和后向GRU结果,输出所述前向GRU结果和所述后向GRU结果的中间拼接结果至第二层双向GRU网络层;对于除所述第一层双向GRU网络层以外的双向GRU网络层,通过当前层的双向GRU网络层中的双向GRU网络单元计算上一层双向GRU网络层输出的中间拼接结果的前向GRU结果和后向GRU结果,输出当前层的双向GRU网络层对应的中间拼接结果至下一层双向GRU网络层;直至最后一层双向GRU网络层输出最终拼接结果。5.一种文本的情感倾向分类装置,其特征在于,所述装置包括:数据获取模块,用...

【专利技术属性】
技术研发人员:王振杰
申请(专利权)人:新华三大数据技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1