【技术实现步骤摘要】
本专利技术涉及关系抽取,尤其涉及基于自然语言分析的发票关系抽取方法。
技术介绍
1、关系抽取是指利用自然语言处理技术从文本中提取出具有特定语义关系的实体及其之间的关系,属于信息抽取的一个重要分支,该技术主要应用于从大量的非结构化文本数据中,识别和抽取出与特定领域相关的知识。其中,传统发票关系抽取方法是指利用自然语言处理技术从发票数据中抽取出涉及金额、日期、交易方等信息的关系,通常采用规则匹配和基于模板的匹配方法,通过对发票文本进行预处理,提取特定字段或关键字来识别关系。
2、现有技术在应对多样化票据结构和混合书写内容时,模板化规则容易造成字段提取遗漏,人工设定的模式难以应对发票图像变形、批注干扰等复杂情境,固定关系抽取方式限制了语义理解的深度,金额与交易要素之间的潜在关联无法动态捕捉,面对批量发票或多场景融合需求时,容易产生数据识别延误和风险项遗漏,影响财务信息的准确流通与风险提前管控。
技术实现思路
1、本专利技术的目的是解决现有技术中存在的缺点,而提出的基于自然语言分析的发
...【技术保护点】
1.基于自然语言分析的发票关系抽取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于自然语言分析的发票关系抽取方法,其特征在于,所述空间融合特征包括字段映射标识、区域关联属性、融合置信因子,所述匹配一致性标识包括识别编码、匹配索引、标准对齐编号,所述语义依存结构序列包括语法依存标记、语义关联编号、行为链结构,所述联动字段聚类组包括时序分组标识、字段联动参数、事件分类编号。
3.根据权利要求1所述的基于自然语言分析的发票关系抽取方法,其特征在于,所述空间融合特征的获取步骤具体为:
4.根据权利要求1所述的基于自然语言分析的
...【技术特征摘要】
1.基于自然语言分析的发票关系抽取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于自然语言分析的发票关系抽取方法,其特征在于,所述空间融合特征包括字段映射标识、区域关联属性、融合置信因子,所述匹配一致性标识包括识别编码、匹配索引、标准对齐编号,所述语义依存结构序列包括语法依存标记、语义关联编号、行为链结构,所述联动字段聚类组包括时序分组标识、字段联动参数、事件分类编号。
3.根据权利要求1所述的基于自然语言分析的发票关系抽取方法,其特征在于,所述空间融合特征的获取步骤具体为:
4.根据权利要求1所述...
【专利技术属性】
技术研发人员:王刚,戴捷,陈元楷,黄培冬,董玉龙,王天军,李文霞,刘婷婷,陈俊宇,
申请(专利权)人:甘肃同兴智能科技发展有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。