当前位置: 首页 > 专利查询>重庆大学专利>正文

基于数据增强和依存句法的道路和综合管廊标准文本关系抽取方法技术

技术编号:46616072 阅读:2 留言:0更新日期:2025-10-14 21:12
本发明专利技术提出了一种基于数据增强和依存句法的道路和综合管廊标准文本关系抽取方法。包括:对道路和综合管廊标准文本进行采集和人工标注,利用大语言模型和模板构建提示词,采用上下文级和实体对级的数据增强策略扩充样本集;对文本进行BERT编码和分词,融合字粒度与词粒度特征,并通过BiLSTM进一步提取语义特征;结合依存句法分析构建依存图,通过剪枝算法筛选关键词节点,将依存类型嵌入与节点表示拼接;采用多关系异构图神经网络编码依存图,实现实体及关键词的特征聚合;最终通过前馈神经网络完成关系分类。所述方法有效缓解领域数据稀缺问题,提升了道路和综合管廊标准文本中关系抽取的准确性和鲁棒性,适用于标准文本的结构化与知识图谱构建。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,具体涉及一种基于数据增强和依存句法的道路和综合管廊标准文本关系抽取方法


技术介绍

1、随着智慧城市和基础设施信息化建设的不断推进,道路和综合管廊标准文本的结构化处理和自动化知识提取需求日益增长。关系抽取作为知识图谱构建的关键技术环节,已在新闻、医疗等领域得到广泛研究与应用,但道路工程标准文本因其专业性强、结构化表达突出、领域数据稀缺等特点,仍面临如下挑战:

2、现有数据集规模有限,人工标注成本高,导致训练数据稀缺,难以支撑高性能的关系抽取模型。

3、道路和管廊标准文本中关系多通过模式化短句和核心动词表达,现有方法未能有效利用文本的结构化和句法信息,影响了关系抽取的准确性。

4、基于大模型的数据增强方法应用于标准文本时,生成样本可能破坏原有语义特征,影响模型泛化能力和实际适用性。

5、因此,亟需一种兼顾数据稀缺和领域文本特征的高效关系抽取方法,以提升道路与综合管廊标准文本的自动化处理和知识提取能力。


技术实现思路

1、本专利技术旨在至本文档来自技高网...

【技术保护点】

1.一种基于数据增强和依存句法的道路和综合管廊标准文本关系抽取方法,其特征在于,包括:

2.根据权利要求1所述的一种基于数据增强和依存句法的道路和综合管廊标准文本关系抽取方法,其特征在于,所述步骤3包括:

3.根据权利要求1所述的一种基于数据增强和依存句法的道路和综合管廊标准文本关系抽取方法,其特征在于,所述步骤3还包括:

4.根据权利要求1所述的一种基于数据增强和依存句法的道路和综合管廊标准文本关系抽取方法,其特征在于,所述步骤4包括:

5.根据权利要求4所述的一种基于数据增强和依存句法的道路和综合管廊标准文本关系抽取方法,其特征在于,所...

【技术特征摘要】

1.一种基于数据增强和依存句法的道路和综合管廊标准文本关系抽取方法,其特征在于,包括:

2.根据权利要求1所述的一种基于数据增强和依存句法的道路和综合管廊标准文本关系抽取方法,其特征在于,所述步骤3包括:

3.根据权利要求1所述的一种基于数据增强和依存句法的道路和综合管廊标准文本关系抽取方法,其特征在于,所述步骤3还包括:

4.根据权利要求1所述的一种基于数据增强和依存句法的道路和综合管廊标准文本关系抽取方法,其特征在于,所述步骤4包括:

5.根据权利要求4所述的一种基于数据增强和依存句法的道路和综合管廊标准文...

【专利技术属性】
技术研发人员:万里韩世晨彭柱仁高鹏举
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1