【技术实现步骤摘要】
本专利技术涉及计算机,特别是指一种文本标签提取方法、装置及电子设备。
技术介绍
1、文档标签抽取是自然语言处理领域的一项关键技术,其目的是从文档中自动识别并提取关键信息作为标签。目前,文档标签抽取技术主要包括基于规则的方法、基于机器学习的方法和基于深度学习的方法。这些方法需要依赖大量人工设计的特征和规则,不仅耗时耗力,而且难以适应文本数据的多样性和复杂性,文本标签提取的准确偏低。
技术实现思路
1、本专利技术的目的是提供一种文本标签提取方法、装置及电子设备,解决了提取的文本标签准确偏低的问题。
2、为达到上述目的,本专利技术的实施例提供一种文本标签提取方法,包括:
3、获取第一文本对应的词向量矩阵,所述词向量矩阵中的每个词对应一个词嵌入向量;
4、根据每两个所述词嵌入向量之间的语义相关度,确定每两个所述词嵌入向量之间的上下文屏蔽向量;
5、根据所述词嵌入向量和所述上下文屏蔽向量,构建文本语义图;其中,所述文本语义图中的每个节点对应一个所述词嵌
...【技术保护点】
1.一种文本标签提取方法,其特征在于,包括:
2.根据权利要求1所述的文本标签提取方法,其特征在于,所述根据每两个所述词嵌入向量之间的语义相关度,确定每两个所述词嵌入向量之间的上下文屏蔽向量,包括:
3.根据权利要求2所述的文本标签提取方法,其特征在于,所述根据所述语义相关度、第一可调参数和第二可调参数,确定每两个所述词嵌入向量之间的上下文屏蔽向量,包括:
4.根据权利要求1所述的文本标签提取方法,其特征在于,所述根据所述文本语义图,获取所述第一文本的标签,包括:
5.根据权利要求4所述的文本标签提取方法,其特征在于,所
...【技术特征摘要】
1.一种文本标签提取方法,其特征在于,包括:
2.根据权利要求1所述的文本标签提取方法,其特征在于,所述根据每两个所述词嵌入向量之间的语义相关度,确定每两个所述词嵌入向量之间的上下文屏蔽向量,包括:
3.根据权利要求2所述的文本标签提取方法,其特征在于,所述根据所述语义相关度、第一可调参数和第二可调参数,确定每两个所述词嵌入向量之间的上下文屏蔽向量,包括:
4.根据权利要求1所述的文本标签提取方法,其特征在于,所述根据所述文本语义图,获取所述第一文本的标签,包括:
5.根据权利要求4所述的文本标签提取方法,其特征在于,所述根据所述融合特征,得到所述标签,包括:
...
【专利技术属性】
技术研发人员:丁辰晖,冯郑慧,朱昱璇,
申请(专利权)人:中移苏州软件技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。