基于自然语言分析的发票关系抽取方法技术

技术编号:46593380 阅读:0 留言:0更新日期:2025-10-10 21:26
本发明专利技术涉及关系抽取技术领域,具体为基于自然语言分析的发票关系抽取方法,包括以下步骤:通过分析图像印章、二维码和手写批注等多特征,匹配文本与图像空间信息,核查二维码与税控码一致性,识别字段组合及金额与付款方异常。本发明专利技术中,通过多层次融合分析发票图像中的印章、二维码及手写标记等细节特征,实现图文内容的空间联合判别,利用字符安全比对与编码一致性提升信息校验的可信度,借助上下文语义依存结构,强化支付行为与实体间的深层联系挖掘,金额与付款方等要素被动态归类聚合,实现对复杂交易关系的自动识别,进一步通过联动聚类与差异追踪,实现异常风险行为的智能判定与实时标签生成,提高财务管理的主动风控能力。

【技术实现步骤摘要】

本专利技术涉及关系抽取,尤其涉及基于自然语言分析的发票关系抽取方法


技术介绍

1、关系抽取是指利用自然语言处理技术从文本中提取出具有特定语义关系的实体及其之间的关系,属于信息抽取的一个重要分支,该技术主要应用于从大量的非结构化文本数据中,识别和抽取出与特定领域相关的知识。其中,传统发票关系抽取方法是指利用自然语言处理技术从发票数据中抽取出涉及金额、日期、交易方等信息的关系,通常采用规则匹配和基于模板的匹配方法,通过对发票文本进行预处理,提取特定字段或关键字来识别关系。

2、现有技术在应对多样化票据结构和混合书写内容时,模板化规则容易造成字段提取遗漏,人工设定的模式难以应对发票图像变形、批注干扰等复杂情境,固定关系抽取方式限制了语义理解的深度,金额与交易要素之间的潜在关联无法动态捕捉,面对批量发票或多场景融合需求时,容易产生数据识别延误和风险项遗漏,影响财务信息的准确流通与风险提前管控。


技术实现思路

1、本专利技术的目的是解决现有技术中存在的缺点,而提出的基于自然语言分析的发票关系抽取方法。...

【技术保护点】

1.基于自然语言分析的发票关系抽取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于自然语言分析的发票关系抽取方法,其特征在于,所述空间融合特征包括字段映射标识、区域关联属性、融合置信因子,所述匹配一致性标识包括识别编码、匹配索引、标准对齐编号,所述语义依存结构序列包括语法依存标记、语义关联编号、行为链结构,所述联动字段聚类组包括时序分组标识、字段联动参数、事件分类编号。

3.根据权利要求1所述的基于自然语言分析的发票关系抽取方法,其特征在于,所述空间融合特征的获取步骤具体为:

4.根据权利要求1所述的基于自然语言分析的发票关系抽取方法,其...

【技术特征摘要】

1.基于自然语言分析的发票关系抽取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于自然语言分析的发票关系抽取方法,其特征在于,所述空间融合特征包括字段映射标识、区域关联属性、融合置信因子,所述匹配一致性标识包括识别编码、匹配索引、标准对齐编号,所述语义依存结构序列包括语法依存标记、语义关联编号、行为链结构,所述联动字段聚类组包括时序分组标识、字段联动参数、事件分类编号。

3.根据权利要求1所述的基于自然语言分析的发票关系抽取方法,其特征在于,所述空间融合特征的获取步骤具体为:

4.根据权利要求1所述...

【专利技术属性】
技术研发人员:王刚戴捷陈元楷黄培冬董玉龙王天军李文霞刘婷婷陈俊宇
申请(专利权)人:甘肃同兴智能科技发展有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1