文本情感分析方法、装置及计算机可读存储介质制造方法及图纸

技术编号:32736801 阅读:21 留言:0更新日期:2022-03-20 08:43
本发明专利技术涉及大数据领域,公开了一种文本情感分析方法、装置及计算机可读存储介质。其中,文本情感分析方法,包括:获取目标文本中的各个词语;获取所述各个词语的词向量表示;获取所述各个词语的隐式依存句法结构信息表示;将各个所述词语的所述词向量表示和所述隐式依存句法结构信息表示拼接、得到输入矩阵;将所述输入矩阵输入属性情感分析模型,得到所述目标文本的属性情感分类。与现有技术相比,本发明专利技术实施方式所提供的情感分析方法、装置及计算机可读存储介质具有提升文本情感分析精准度的优点。的优点。的优点。

【技术实现步骤摘要】
文本情感分析方法、装置及计算机可读存储介质


[0001]本专利技术涉及大数据领域,特别涉及一种文本情感分析方法、装置及计算机可读存储介质。

技术介绍

[0002]互联网时代的飞速发展,使得各类数据海量增长,而文本数据作为人们交流表达的重要载体,蕴含着大量有价值的信息,其中丰富的用户情感信息体现在文本中。然而,互联网环境错综复杂,数据量之大可想而知,如何智能高效地分析出这些数据背后所蕴含的价值变得异常重要,因此,针对互联网评论资源,关于文本情感分析的相关研究也随之受到关注。文本情感分析,又被称为意见挖掘,是自然语言处理领域内的一项经典研究任务。
[0003]然而,本专利技术的专利技术人发现,现有技术中的文本情感分析结果的准确度较低。

技术实现思路

[0004]本专利技术实施方式的目的在于提供一种文本情感分析方法、装置及计算机可读存储介质,使得文本情感分析结果的准确度提高。
[0005]为解决上述技术问题,本专利技术的实施方式提供了一种文本情感分析方法,包括:获取目标文本中的各个词语;获取所述各个词语的词向量表示;获取所述各个词语的隐式依存句法结构信息表示;将各个所述词语的所述词向量表示和所述隐式依存句法结构信息表示拼接、得到输入矩阵;将所述输入矩阵输入属性情感分析模型,得到所述目标文本的属性情感分类。
[0006]本专利技术的实施方式还提供了一种文本情感分析装置,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如前述的文本情感分析方法。
[0007]本专利技术的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现前述的文本情感分析方法。
[0008]本专利技术实施方式相对于现有技术而言,对于目标文本中的各个词语,通过获取各个词语的词向量表示和隐式依存句法结构信息表示,直接将各个所述词语的所述词向量表示和所述隐式依存句法结构信息表示拼接后得到输入矩阵,将输入矩阵输入属性情感分析模型从而得到目标文本的属性情感分类,这一过程中没有直接对最佳依存句法树进行建模,而是使用目标文本的隐式依存句法结构信息表示输入到属性情感分析模型中进行情感分析,不仅提高了属性情感分析模型在属性级情感分析数据集上的效果,而且可以减少因依存句法树带来的误差传播问题,提升对目标文本的属性级情感分析效果。
附图说明
[0009]图1是本专利技术一实施方式所提供的文本情感分析方法的程序流程图;
[0010]图2是本专利技术一实施方式所提供的文本情感分析方法中Biaffine parser模型的运算流程示意图;
[0011]图3是本专利技术一实施方式所提供的文本情感分析方法中得到目标文本的属性情感分类的步骤的程序流程图;
[0012]图4是本专利技术一实施方式所提供的文本情感分析方法中的属性级情感分析模型的运算流程示意图;
[0013]图5是本专利技术另一实施方式所提供的文本情感分析方法的程序流程图;
[0014]图6是本专利技术另一实施方式所提供的文本情感分析装置的结构示意图。
[0015]实施方式
[0016]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本专利技术各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。
[0017]属性级情感分析旨在先识别文本中出现的属性词,针对识别出的属性词,根据特定属性词来判断整个文本对该特定属性词的情感倾向。在实际的应用场景中,属性级情感分析有着广泛的应用场景和研究发展的空间,以淘宝、亚马逊和当当等为代表的电商平台中,使用属性级情感分析技术可以从用户对某一商品的大量评论数据中挖掘出有价值的商业信息。近年来,许多工作在属性级情感分析中开始挖掘利用文本的依存句法结构信息,在这些融入文本的依存句法结构信息到属性级情感分析任务上的研究工作中,依存句法树的存储方式是以邻接矩阵的形式存储。
[0018]然而,本专利技术的专利技术人发现,现有技术中的文本的依存句法分析过程存在误差,这一误差的存在导致最终的文本情感分析结果的准确度较低。
[0019]为了解决这一技术问题,本专利技术的一种实施方式涉及一种文本情感分析方法,如图1所示,至少包括以下步骤:
[0020]步骤S101:获取目标文本中的各个词语。
[0021]具体的,在本实施方式中,首先根据分词模型将目标文本分割为一个个词语,目标文本可以是光学字符识别(Optical Character Recognition,OCR)的结果文本(即OCR文本),也可以是普通文本,即只要是文本即可,应用范围较广。目标文本的长度不限,经过分词模型分割后至少可以得到一个词语。分词模型可以是N元模型(n

gram),N元模型是一种较为成熟的用于分词的模型,可以根据前n

1项推测第n项,对文本的分词较为准确。可以理解的是,前述仅为本实施方式中对目标文本进行分词的一种具体的方法的举例说明,并不构成限定,在本专利技术的其它实施方式中,也可以是其它方法,具体可以根据实际需要进行灵活的设置,例如当目标文本为英文文本时,也可以是通过NLTK(Natural Language Toolkit,自然语言工具包)对目标文本进行精确的分词操作,并去除目标文本中的停用词。
[0022]步骤S102:获取各个词语的词向量表示。
[0023]具体的,在本实施方式中,使用预训练好的GloVe(Global Vectors,全局向量)词嵌入模型将各个词语转化为与其对应的300维向量。即目标文本中的各个词语与其词向量表示是一一对应的。可以理解的是,前述仅为本实施方式中获取各个词语的词向量表示的一种具体的举例说明,并不构成限定在,在本专利技术的其它实施方式中,还可以是通过Skip

gram模型或连续词袋模型(ContinuousBag

of

Words)等其它算法模型获取各个词语的词向量表示,或者是同时使用Skip

gram模型和连续词袋模型两种算法模型获取各个词语的词向量表示等,具体可以根据实际需要进行灵活的设置。
[0024]步骤S103:获取各个词语的隐式依存句法结构信息表示。
[0025]具体的,在本实施方式中,将目标文本中的各个词语输入深度神经依存句法分析模型,获取深度神经依存句法分析模型在编码阶段产生的隐藏状态表示,根据隐藏状态表示获取各个词语的隐式依存句法结构信息表示。具体的,各个词语的隐式依存句法结构信息是指深度神经依存句法分析模型在编码层阶段产生的隐藏状态,在本实施方式中,深度神经依存句法分析模型例如为Biaffine parser模型,Biaf本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本情感分析方法,其特征在于,包括:获取目标文本中的各个词语;获取所述各个词语的词向量表示;获取所述各个词语的隐式依存句法结构信息表示;将各个所述词语的所述词向量表示和所述隐式依存句法结构信息表示拼接,得到输入矩阵;将所述输入矩阵输入属性情感分析模型,得到所述目标文本的属性情感分类。2.根据权利要求1所述的文本情感分析方法,其特征在于,所述获取所述各个词语的隐式依存句法结构信息表示,包括:将所述目标文本输入深度神经依存句法分析模型,获取所述深度神经依存句法分析模型在编码阶段产生的隐藏状态表示,根据所述隐藏状态表示获取所述各个词语的隐式依存句法结构信息表示。3.根据权利要求2所述的文本情感分析方法,其特征在于,所述获取所述深度神经依存句法分析模型在编码阶段产生的隐藏状态表示,包括:经由三层双向长短时记忆网络对所述目标文本进行编码处理,得到所述隐藏状态表示。4.根据权利要求3所述的文本情感分析方法,其特征在于,所述根据所述隐藏状态表示获取所述各个词语的隐式依存句法结构信息表示,包括:将所述隐藏状态表示经由线性映射层映射后得到所述各个词语的隐式依存句法结构信息表示。5.根据权利要求4所述的文本情感分析方法,其特征在于,所述将所述隐藏状态表示经由线性映射层映射后得到所述各个词语的隐式依存句法结构信息表示,包括:将所述隐藏状态表示的不同层级分别经由所述线性映...

【专利技术属性】
技术研发人员:夏睿李成路周祥生董修岗孙文卿
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1