一种文本的中文隐式情感信息的识别方法及系统技术方案

技术编号:34145640 阅读:13 留言:0更新日期:2022-07-14 18:53
本申请公开了一种文本的中文隐式情感信息的识别方法及系统:训练得到第一基于转换器的双向编码表征(BERT)网络及训练得到第二BERT网络,在对文本进行情感信息分析时,将从文本提取的中文词句特征输入第一BERT网络中进行中文显式情感的识别,输出得到显式情感的分类信息;当输出的显式情感的分类信息表示为隐式情感信息时,将从文本提取的中文词句特征输入到第二BERT网络中,进行中文隐式情感的类别识别,输出得到该中文词句特征的隐式情感的类别信息。更进一步地,在执行上述方法之前,还包括:预设网络词典,所述网络词典中包括多个网络词句与情感信息之间的对应关系;将从文本提取的中文词句特征在所述网络词典中检索,判断是否有匹配的网络词句,如果是,将所匹配的网络词句对应的情感信息作为所述中文词句特征的情感信息;如果否,将从文本提取的中文词句特征输入第一BERT网络。这样,本申请准确地识别文本中的中文隐式情感信息。识别文本中的中文隐式情感信息。识别文本中的中文隐式情感信息。

【技术实现步骤摘要】
一种文本的中文隐式情感信息的识别方法及系统


[0001]本申请涉及人工智能领域,特别涉及一种文本的中文隐式情感信息的识别方法及系统。

技术介绍

[0002]随着人工智能技术的发展,人机交互技术受到学术界和工业界的广泛关注。随之各种各样的人机交互数字机器人层出不穷,逐渐对人们的生活产生重大影响,成为人们生活中不可缺少的一部分。在人机交互中,用户语音中的语句是带有感情色彩的,特别是有些用户经常使用一些不含有显式情感词的语句片段来表达他们的主观情感,怎样让采用情感识别模型的数字机器人能够准确地对用户提供的文本识别,并理文本中语句的情感信息,以作出合理的反馈是一个有挑战的问题。在此过程中,情感识别模型识别的准确率直接影响人机对话的质量。
[0003]近几年来,对于中文自然语言显式情感分析研究已经取得了比较好的实验结果,但是对于文本中的中文隐式情感研究仍然是一个比较新颖的研究问题,同时也是一个比较有挑战的问题。对文本中的中文隐式情感识别展开深入的研究,将有助于更全面及更精确地提升文本情感分析的效果,提升人机交互的质量,同时能够为文本表示学习、自然语言理解、用户建模以及知识嵌入等方面的研究起到积极的推动作用,进一步促进基于文本情感分析相关领域的应用和产业的快速发展。

技术实现思路

[0004]有鉴于此,本申请实施例提供一种文本的中文隐式情感信息的识别方法,该方法能够准确地识别文本中的中文隐式情感信息。
[0005]本申请实施例还提供一种文本的中文隐式情感信息的识别系统,该系统能够准确地识别文本中的中文隐式情感信息。
[0006]本申请实施例是这样实现的:
[0007]一种文本的中文隐式情感信息的识别方法,所述方法包括:
[0008]训练得到第一BERT网络及训练得到第二BERT网络;
[0009]对文本进行情感信息分析时,将从文本提取的中文词句特征输入第一BERT网络中进行中文显式情感的识别,输出得到所述中文词句特征的显式情感的分类信息;
[0010]在所述中文词句特征的显式情感的分类信息表示为隐式情感信息的情况下,将从文本提取的中文词句特征输入到第二BERT网络中,进行中文隐式情感的类别识别,输出得到所述中文词句特征的隐式情感的类别信息。
[0011]较佳地,所述将从文本提取的中文词句特征输入第一BERT网络之前,所述方法还包括:
[0012]预设网络词典,所述网络词典中包括多个网络词句与情感信息之间的对应关系;
[0013]将从文本提取的中文词句特征在所述网络词典中检索,判断是否有匹配的网络词
句,如果是,将所匹配的网络词句对应的情感信息作为所述中文词句特征的情感信息;如果否,执行将从文本提取的中文词句特征输入第一BERT网络的步骤。
[0014]较佳地,所述显式情感的分类信息包括:生气类别、厌恶类别、恐惧类别、高兴类别、喜欢类别、中性类别、悲伤类别和隐式情感类别中的一种或多种组合;
[0015]所述隐式的分类信息包括:生气类别、厌恶类别、恐惧类别、高兴类别、喜欢类别和悲伤类别中的一种或多种组合。
[0016]较佳地,所述第一BERT网络是分类8种类别的分类网络模型;
[0017]所述第二BERT网络是分类6种类别的分类网络模型。
[0018]较佳地,所述将从文本提取的中文词句特征输入第一BERT网络中进行显式情感的识别包括:
[0019]第一BERT网络识别所述文本提取的中文词句特征中包含有情感词,所包含的情感词对应显式情感的分类信息。
[0020]较佳地,所述将从文本提取的中文词句特征输入到第二BERT网络中,进行隐式情感的类别识别,包括:
[0021]第二BERT网络识别的所述文本提取的中文词句特征中不包含情感词。
[0022]较佳地,所述训练得到第一BERT网络包括:
[0023]采用以掩码语言模型MLM和下一个词句预测NSP方式对第一BERT网络进行预训练,且在预训练完成后将预训练表示应用在第一BERT网络的下游任务中,对第一BERT网络进行微调后,训练得到第一BERT网络;
[0024]所述训练得到第二BERT网络包括:
[0025]采用MLM和NSP方式对第二BERT网络进行预训练,且在预训练完成后将预训练表示应用在第二BERT网络的下游任务中,对第二BERT网络进行微调后,训练得到第二BERT网络。
[0026]一种文本的中文隐式情感信息的识别系统,所述系统包括:训练单元、情感信息的分类单元及输出单元,其中,
[0027]训练单元,用于训练得到第一BERT网络及训练得到第二BERT网络;
[0028]情感信息的分类单元,用于对文本进行情感信息分析时,将从文本提取的中文词句特征输入第一BERT网络中进行中文显式情感的识别,得到显式情感的分类信息;在得到的显式情感的分类信息表示为隐式情感信息的情况下,将从文本提取的中文词句特征输入到第二BERT网络中,进行中文隐式情感的类别识别,得到所述中文词句特征的隐式情感的类别信息;
[0029]输出单元,用于将得到的显式情感的分类信息或/和得到的该中文词句特征的隐式情感的类别信息输出。
[0030]较佳地,训练单元,还用于预设网络词典,所述网络词典中包括多个网络词句与情感信息之间的对应关系;
[0031]情感信息的分类单元,还用于将从文本提取的中文词句特征在所述网络词典中检索,判断是否有匹配的网络词句,如果是,将所匹配的网络词句对应的情感信息作为所述中文词句特征的情感信息;如果否,将从文本提取的中文词句特征输入第一BERT网络。
[0032]如上所述,本申请实施例训练得到第一基于转换器的双向编码表征(BERT,Bidirectional Encoder Representation from Transformers)网络及训练得到第二BERT
网络,在对文本进行中文情感信息分析时,将从文本提取的中文词句特征输入第一BERT网络中进行显式情感信息的识别,输出得到显式情感的分类信息;当输出的显式情感的分类信息表示为隐式情感信息时,将从文本提取的中文词句特征输入到第二BERT网络中,进行隐式情感信息的类别识别,输出得到该中文词句特征的隐式情感的类别信息。更进一步地,在执行上述方法之前,还包括:预设网络词典,所述网络词典中包括多个网络词句与情感信息之间的对应关系;将从文本提取的中文词句特征在所述网络词典中检索,判断是否有匹配的网络词句,如果是,将所匹配的网络词句对应的情感信息作为所述中文词句特征的情感信息;如果否,将从文本提取的中文词句特征输入第一BERT网络。这样,本申请实施例准确地识别文本中的中文隐式情感信息。
附图说明
[0033]图1为本申请实施例提供的一种文本的中文隐式情感信息的识别方法流程图;
[0034]图2为本申请实施例提供的一种文本的中文隐式情感信息的识别方法具体例子流程图;
[0035]图3为本申请实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本的中文隐式情感信息的识别方法,其特征在于,所述方法包括:训练得到第一BERT网络及训练得到第二BERT网络;对文本进行情感信息分析时,将从文本提取的中文词句特征输入第一BERT网络中进行中文显式情感的识别,输出得到所述中文词句特征的显式情感的分类信息;在所述中文词句特征的显式情感的分类信息表示为隐式情感信息的情况下,将从文本提取的中文词句特征输入到第二BERT网络中,进行中文隐式情感的类别识别,输出得到所述中文词句特征的隐式情感的类别信息。2.如权利要求1所述的方法,其特征在于,所述将从文本提取的中文词句特征输入第一BERT网络之前,所述方法还包括:预设网络词典,所述网络词典中包括多个网络词句与情感信息之间的对应关系;将从文本提取的中文词句特征在所述网络词典中检索,判断是否有匹配的网络词句,如果是,将所匹配的网络词句对应的情感信息作为所述中文词句特征的情感信息;如果否,执行将从文本提取的中文词句特征输入第一BERT网络的步骤。3.如权利要求1所述的方法,其特征在于,所述显式情感的分类信息包括:生气类别、厌恶类别、恐惧类别、高兴类别、喜欢类别、中性类别、悲伤类别和隐式情感类别中的一种或多种组合;所述隐式的分类信息包括:生气类别、厌恶类别、恐惧类别、高兴类别、喜欢类别和悲伤类别中的一种或多种组合。4.如权利要求1所述的方法,其特征在于,所述第一BERT网络是分类8种类别的分类网络模型;所述第二BERT网络是分类6种类别的分类网络模型。5.如权利要求1所述的方法,其特征在于,所述将从文本提取的中文词句特征输入第一BERT网络中进行显式情感的识别包括:第一BERT网络识别所述文本提取的中文词句特征中包含有情感词,所包含的情感词对应显式情感的分类信息。6.如权利要求1所述的方法,其特征在于,所述将从文本提取的中文词句特征输入到第二BE...

【专利技术属性】
技术研发人员:杨志明
申请(专利权)人:深思考人工智能机器人科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1