一种文本标签提取方法、装置及电子设备制造方法及图纸

技术编号:44845884 阅读:23 留言:0更新日期:2025-04-01 19:41
本发明专利技术提供一种文本标签提取方法、装置及电子设备。方法包括:获取第一文本对应的词向量矩阵,所述词向量矩阵中的每个词对应一个词嵌入向量;根据每两个所述词嵌入向量之间的语义相关度,确定每两个所述词嵌入向量之间的上下文屏蔽向量;根据所述词嵌入向量和所述上下文屏蔽向量,构建文本语义图;其中,所述文本语义图中的每个节点对应一个所述词嵌入向量,每个所述上下文屏蔽向量为两个节点之间的边权重;根据所述文本语义图,获取所述第一文本的标签,涉及通信技术领域。本发明专利技术的方案,能够提高文本标签提取的准确性。

【技术实现步骤摘要】

本专利技术涉及计算机,特别是指一种文本标签提取方法、装置及电子设备


技术介绍

1、文档标签抽取是自然语言处理领域的一项关键技术,其目的是从文档中自动识别并提取关键信息作为标签。目前,文档标签抽取技术主要包括基于规则的方法、基于机器学习的方法和基于深度学习的方法。这些方法需要依赖大量人工设计的特征和规则,不仅耗时耗力,而且难以适应文本数据的多样性和复杂性,文本标签提取的准确偏低。


技术实现思路

1、本专利技术的目的是提供一种文本标签提取方法、装置及电子设备,解决了提取的文本标签准确偏低的问题。

2、为达到上述目的,本专利技术的实施例提供一种文本标签提取方法,包括:

3、获取第一文本对应的词向量矩阵,所述词向量矩阵中的每个词对应一个词嵌入向量;

4、根据每两个所述词嵌入向量之间的语义相关度,确定每两个所述词嵌入向量之间的上下文屏蔽向量;

5、根据所述词嵌入向量和所述上下文屏蔽向量,构建文本语义图;其中,所述文本语义图中的每个节点对应一个所述词嵌入向量,每个所述上下本文档来自技高网...

【技术保护点】

1.一种文本标签提取方法,其特征在于,包括:

2.根据权利要求1所述的文本标签提取方法,其特征在于,所述根据每两个所述词嵌入向量之间的语义相关度,确定每两个所述词嵌入向量之间的上下文屏蔽向量,包括:

3.根据权利要求2所述的文本标签提取方法,其特征在于,所述根据所述语义相关度、第一可调参数和第二可调参数,确定每两个所述词嵌入向量之间的上下文屏蔽向量,包括:

4.根据权利要求1所述的文本标签提取方法,其特征在于,所述根据所述文本语义图,获取所述第一文本的标签,包括:

5.根据权利要求4所述的文本标签提取方法,其特征在于,所述根据所述融合特征,...

【技术特征摘要】

1.一种文本标签提取方法,其特征在于,包括:

2.根据权利要求1所述的文本标签提取方法,其特征在于,所述根据每两个所述词嵌入向量之间的语义相关度,确定每两个所述词嵌入向量之间的上下文屏蔽向量,包括:

3.根据权利要求2所述的文本标签提取方法,其特征在于,所述根据所述语义相关度、第一可调参数和第二可调参数,确定每两个所述词嵌入向量之间的上下文屏蔽向量,包括:

4.根据权利要求1所述的文本标签提取方法,其特征在于,所述根据所述文本语义图,获取所述第一文本的标签,包括:

5.根据权利要求4所述的文本标签提取方法,其特征在于,所述根据所述融合特征,得到所述标签,包括:

...

【专利技术属性】
技术研发人员:丁辰晖冯郑慧朱昱璇
申请(专利权)人:中移苏州软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1