文本分析方法、装置和相关产品制造方法及图纸

技术编号:44916511 阅读:19 留言:0更新日期:2025-04-08 18:58
本公开提供一种文本分析方法、装置和相关产品,涉及自然语言处理技术领域。该方法包括:获取待分析文本以及待分析文本对应的嵌入编码;对待分析文本对应的嵌入编码进行自注意力计算,获得待分析文本中各个单词的自注意力权重;对待分析文本进行抽象语义分析,获得待分析文本的抽象语义表示图谱;将抽象语义表示图谱中的节点关系映射为向量,获得图谱关系嵌入编码;通过图谱关系嵌入编码对待分析文本中各个单词的自注意力权重进行增强,获得增强后自注意力权重;基于增强后自注意力权重和待分析文本中各个单词的嵌入编码,获得待分析文本的增强后文本编码,以便基于增强后文本编码进行文本分析。本公开实施例可以提升任务分析的准确性。

【技术实现步骤摘要】

本公开涉及自然语言处理,尤其涉及一种文本分析方法、装置、电子设备、计算机可读存储介质和计算机程序产品。


技术介绍

1、本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

2、在细粒度情感分析任务中,系统需要从文本中抽取出评价对象、评价内容等细粒度情感要素。目前最通用的方法是基于判别式模型判断要素在文本中的边界,或基于生成式模型直接生成情感要素内容。二者都依赖预训练模型中的多头自注意力结构将上下文信息注入文本token(令牌)编码中,以提升分析任务的准确性。

3、上述基于预训练模型的细粒度情感分析方法虽然能够获得含有丰富语义环境信息的token编码,但是当输入文本长度超过一定限度时,上下文信息过多会造成注意力涣散,最终导致较差的分析任务效果。


技术实现思路

1、本公开的目的在于提供一种文本分析方法、装置、电子设备、计算机可读存储介质和计算机程序产品,可以提升分析任务的准确性。

2、本公开的其他特性和优点将通过下面的本文档来自技高网...

【技术保护点】

1.一种文本分析方法,其特征在于,包括:

2.根据权利要求1所述方法,其特征在于,通过所述图谱关系嵌入编码对所述待分析文本中各个单词的自注意力权重进行增强,获得增强后自注意力权重,包括:

3.根据权利要求1所述方法,其特征在于,通过所述图谱关系嵌入编码对所述待分析文本中各个单词的自注意力权重进行增强,获得增强后自注意力权重,包括:

4.根据权利要求3所述方法,其特征在于,根据所述待分析文本的所述图谱关系嵌入编码进行关系传播,确定所述待分析文本中两两单词之间的传播关系嵌入编码,包括:

5.根据权利要求4所述方法,其特征在于,根据所述第一目标单...

【技术特征摘要】

1.一种文本分析方法,其特征在于,包括:

2.根据权利要求1所述方法,其特征在于,通过所述图谱关系嵌入编码对所述待分析文本中各个单词的自注意力权重进行增强,获得增强后自注意力权重,包括:

3.根据权利要求1所述方法,其特征在于,通过所述图谱关系嵌入编码对所述待分析文本中各个单词的自注意力权重进行增强,获得增强后自注意力权重,包括:

4.根据权利要求3所述方法,其特征在于,根据所述待分析文本的所述图谱关系嵌入编码进行关系传播,确定所述待分析文本中两两单词之间的传播关系嵌入编码,包括:

5.根据权利要求4所述方法,其特征在于,根据所述第一目标单词对和所述第二目标单词对的关系嵌入编码确定所述中间词...

【专利技术属性】
技术研发人员:姚旭杨胡婕刘宁
申请(专利权)人:中国电信股份有限公司技术创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1