一种文本的情感分类方法、装置、设备及存储介质制造方法及图纸

技术编号:21832813 阅读:26 留言:0更新日期:2019-08-10 18:03
本发明专利技术实施例涉及机器学习领域,公开了一种文本的情感分类方法、装置、设备及存储介质。本发明专利技术中,该文本的情感分类方法包括:获取目标文本中的核心词语的情感特征向量;其中,情感特征向量包括:表示正面情感的第一元素、表示负面情感的第二元素、表示否定意义的第三元素和表示情感程度的第四元素中的至少三个元素;根据核心词语的词向量和情感特征向量,确定核心词语的融合向量;将基于融合向量表示的目标文本,输入到长短期记忆网络模型中,确定目标文本的情感类别。通过将核心词语的情感特征向量和词向量相融合,使用核心词语的融合向量表示目标文本,减少冗余词语对评价目标文本的情感类别的影响,能够使目标文本的情感类别更准确。

An Emotional Text Classification Method, Device, Equipment and Storage Media

【技术实现步骤摘要】
一种文本的情感分类方法、装置、设备及存储介质
本专利技术实施例涉及人工智能和自然语言处理
,特别涉及一种文本的情感分类方法、装置、设备及存储介质。
技术介绍
目前,随着互联网的普及,在网络上发表观点和交流情感已成为人们日常生活的一部分。网络文本会包含很多倾向性的文本信息,对这些网络文本所要表达的情感进行分析的方法主要有基于规则的方法、基于浅层机器学习的方法和基于深度学习的方法。专利技术人发现相关技术中至少存在如下问题:在对这些文本进行处理时,如果文本中存在很多冗余的词语,冗余词语对文本情感分析不产生作用或者负面作用;在传统的文本情感分析方法中,如果把自然语言中每个词语都当作一个特征维度,则对应的维数就会非常大,且词语之间不包含语义信息,不利于后续深度学习模型的处理,不能准确的获得文本的情感类别。
技术实现思路
本专利技术实施方式的目的在于提供一种文本的情感分类方法、装置、设备及存储介质,通过使用核心词语的融合向量表示目标文本,减少了目标文本中的冗余信息,能够获得更准确的情感类别。为解决上述技术问题,本专利技术的实施方式提供了一种文本的情感分类方法,包括以下步骤:获取目标文本中的核心词语的情感特征向量;其中,情感特征向量包括:表示正面情感的第一元素、表示负面情感的第二元素、表示否定意义的第三元素和表示情感程度的第四元素中的至少三个元素;根据核心词语的词向量和情感特征向量,确定核心词语的融合向量;将基于融合向量表示的目标文本,输入到长短期记忆网络模型中,确定目标文本的情感类别。为解决上述技术问题,本专利技术的实施方式提供了一种文本的情感分类装置,包括:获取模块,融合模块和分类模块;获取模块,用于获取目标文本中的核心词语的情感特征向量;其中,情感特征向量包括:表示正面情感的第一元素、表示负面情感的第二元素、表示否定意义的第三元素和表示情感程度的第四元素中的至少三个元素;融合模块,用于根据核心词语的词向量和情感特征向量,确定核心词语的融合向量;分类模块,用于将基于融合向量表示的目标文本,输入到长短期记忆网络模型中,确定目标文本的情感类别。本专利技术的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述文本的情感分类方法。本专利技术的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述文本的情感分类方法。本专利技术实施方式相对于相关技术而言,通过去除掉目标文本中的冗余词语,只使用核心词语对应的融合向量来表示目标文本,减少了冗余词语对评价目标文本情感类别的影响;并且,该融合向量融合了情感特征向量和词向量,并且该融合向量中包括第一元素、第二元素、第三元素和第四元素中的至少三种,使得该融合向量能够更明确地表达核心词语的情感特征,使核心词语的语义更加明确,避免了词语之间缺少语义信息的问题,突出了核心词语所要表达的情感信息,能够使目标文本的情感类别更准确。另外,根据核心词语的词向量和情感特征向量,确定核心词语的融合向量,包括:将核心词语的词向量和情感特征向量进行拼接,确定核心词语的融合向量;其中,融合向量包括的元素包括:词向量包括的元素和情感特征向量包括的元素。该方式中,通过将核心词语的词向量和情感特征向量进行拼接,完成两个向量的融合,使用该融合向量表示核心词语,使核心词语的情感特征更加突出,语义更加明确,使目标文本的情感类别更准确。另外,获取目标文本中的核心词语的情感特征向量,包括:将核心词语分别与正面情感词典中的词语、负面情感词典中的词语、否定词典中的词语和情感程度词典中的词语中的至少三种进行匹配,确定获得包括第一元素、第二元素、第三元素和第四元素中的至少三个元素的情感特征向量。该方式中,通过将核心词语与不同的词典进行匹配,获得对应的情感特征向量中的元素,各个对应的元素能够直接表达核心词语的情感信息,进而使得包括第一元素、第二元素、第三元素和第四元素中的至少三个元素的情感特征向量,能够间接体现目标文本的情感信息,从而能够更快捷的确定目标文本的情感类别。另外,在获取目标文本中的核心词语的情感特征向量之前,还包括:对目标文本中包括的句子进行分词,获得目标词语;根据目标词语的词性和依存句法关系,确定核心词语。该方式中,通过对目标文本中的句子进行分词,明确句子中各个词语的词性及要表达的语义,再根据依存句法关系,获得目标文本的核心词语,减少了目标文本中的冗余信息,提高了确定目标文本的情感类别的效率。另外,依存句法关系包括:主谓关系,动宾关系,动补关系,并列关系,定中关系和状中关系中的至少一种。另外,目标文本的情感类别,包括:积极情感和消极情感。另外,词向量位于低维向量空间。附图说明一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。图1是根据本专利技术第一实施方式中的文本的情感分类方法流程方框图;图2是根据本专利技术第二实施方式中的文本的情感分类方法流程方框图;图3是根据本专利技术第三实施方式中的文本的情感分类装置流程方框图;图4是根据本专利技术第四实施方式中的电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本专利技术各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。本专利技术的第一实施方式涉及一种文本的情感分类方法。用于减少目标文本中的冗余词语对评价该文本情感分类的影响,使目标文本的情感类别更准确。下面对本实施方式中的文本的情感分类方法的实现细节进行具体的说明,以下内容仅为方便理解本方案的实现细节,并非实施本方案的必须。图1所示为本实施方式中的文本的情感分类方法的流程图,该方法可用于服务器。该方法可包括如下步骤。在步骤101中,获取目标文本中的核心词语的情感特征向量。其中,情感特征向量包括:表示正面情感的第一元素、表示负面情感的第二元素、表示否定意义的第三元素和表示情感程度的第四元素中的至少三个元素。需要说明的是,其中的第一元素和第二元素表示的是能够直接体现核心词语的情感倾向的元素,同时也是对核心词语进行情感分类的最主要的元素;第三元素表示的是对核心词语的情感产生反转影响的元素;第四元素虽然不会改变核心词语的情感倾向,但是会加强或削弱核心词语的情感强度,当核心词语中同时出现表示正面情感的第一元素和表示负面情感的第二元素时,可通过表示情感程度的第四元素来决定该核心词语的情感倾向。使用第一至第四元素中的至少三个来表示情感特征向量,所选择的三个元素中至少包括第一元素,或,第二元素,使得该情感特性向量能够突出核心词语的情感倾向。若同时使用第一元素、第二元素和第三元素来表示该情感特征向量,可根据第三元素与第一或第二元素之间的距离,来确定该表示情感反转的第三元素是用来进一步限定哪个元素的,比如,核心词语为“不讨厌,喜欢”,则可确定本文档来自技高网...

【技术保护点】
1.一种文本的情感分类方法,其特征在于,所述方法包括:获取目标文本中的核心词语的情感特征向量;其中,所述情感特征向量包括:表示正面情感的第一元素、表示负面情感的第二元素、表示否定意义的第三元素和表示情感程度的第四元素中的至少三个元素;根据所述核心词语的词向量和所述情感特征向量,确定所述核心词语的融合向量;将基于所述融合向量表示的所述目标文本,输入到长短期记忆网络模型中,确定所述目标文本的情感类别。

【技术特征摘要】
1.一种文本的情感分类方法,其特征在于,所述方法包括:获取目标文本中的核心词语的情感特征向量;其中,所述情感特征向量包括:表示正面情感的第一元素、表示负面情感的第二元素、表示否定意义的第三元素和表示情感程度的第四元素中的至少三个元素;根据所述核心词语的词向量和所述情感特征向量,确定所述核心词语的融合向量;将基于所述融合向量表示的所述目标文本,输入到长短期记忆网络模型中,确定所述目标文本的情感类别。2.根据权利要求1所述的文本的情感分类方法,其特征在于,根据所述核心词语的词向量和所述情感特征向量,确定所述核心词语的融合向量,包括:将所述核心词语的所述词向量和所述情感特征向量进行拼接,确定所述核心词语的所述融合向量;其中,所述融合向量包括的元素包括:所述词向量包括的元素和所述情感特征向量包括的元素。3.根据权利要求1所述的文本的情感分类方法,其特征在于,所述获取目标文本中的核心词语的情感特征向量,包括:将所述核心词语分别与正面情感词典中的词语、负面情感词典中的词语、否定词典中的词语和情感程度词典中的词语中的至少三种进行匹配,确定获得包括所述第一元素、所述第二元素、所述第三元素和所述第四元素中的至少三个元素的所述情感特征向量。4.根据权利要求1所述的文本的情感分类方法,其特征在于,在获取目标文本中的核心词语的情感特征向量之前,还包括:对所述目标文本中包括的句子进行分词,获得目标词语;根据所述目标词语的词性和依存句法关系,确定所述核心...

【专利技术属性】
技术研发人员:过弋樊振
申请(专利权)人:华东理工大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1