基于相对距离的向量化方法、系统、设备及介质技术方案

技术编号:42410081 阅读:18 留言:0更新日期:2024-08-16 16:28
本发明专利技术涉及数据处理的领域,提出了基于相对距离的向量化方法、系统、设备及介质,方法包括:获取待处理的具有树结构的单据文本,对单据文本中的结点依次进行编号;顺序每次选取三个不同的结点,作为有序三元组,直至遍历所有的结点,得到多个有序三元组;将每个有序三元组输入到预设的基于反向传播的模型;在所述基于反向传播的模型的嵌入层中根据结点的编号提取对应位置的嵌入向量,根据嵌入向量计算相对距离,作为输出结果。本发明专利技术能处理具有树结构的单据智能帮助文本,完成更加精细的向量化处理,保留智能帮助特有的树状层次结构,为单据处理流程提供高质量的智能帮助向量,提升智能模型的训练速度和降低模型的计算成本。

【技术实现步骤摘要】

本专利技术涉及数据处理的领域,尤其涉及基于相对距离的向量化方法、系统、设备及介质


技术介绍

1、随着经济全球化和企业数字化的浪潮,越来越多的企业搭建了自己的财务共享中心,一个用于处理共享财务信息的平台。随着互联网技术的飞速发展,网络数据规模不断扩大,数据的组织形式也变得复杂多样。每一天,财务共享中心都会收到海量的、并且种类繁多的单据,如何高效、准确、快速地处理这些单据对于合理的资金分配、库存管理和供应链优化至关重要。其中,树结构数据因其能有效体现数据的层次关系和异构信息融合的特性,被广泛应用于各种领域。然而,传统的人工处理方法耗时耗力,并且错误率也很高,已无法满足企业快速发展的要求。因此,很多企业开始寻求使用计算机代替人力进行单据处理的解决方案,而单据文本的向量化是该解决方案中至关重要的一步。

2、智能帮助是一种具有树状结构的单据文本,是财务单据最重要的一种组成成分。当前对单据文本向量化的技术中,大多采用基于统计或者基于神经网络的词嵌入技术。这些技术会构建一个语料库,包含所有可能出现的单据文本,然后对其进行统一的向量化处理。这类全局性的文本处本文档来自技高网...

【技术保护点】

1.基于相对距离的向量化方法,其特征在于,用于具有树结构的单据文本,包括,

2.根据权利要求1所述的基于相对距离的向量化方法,其特征在于,还包括基于如下过程训练所述预设的基于反向传播的模型:

3.根据权利要求2所述的基于相对距离的向量化方法,其特征在于,所述获取训练数据集的步骤包括:

4.根据权利要求3所述的基于相对距离的向量化方法,其特征在于,所述将所述预测结果输入到损失函数中对所述神经网络模型进行训练,直到得到基于反向传播的模型的步骤包括:

5.根据权利要求1所述的基于相对距离的向量化方法,其特征在于,所述获取待处理的具有树结构的单据文...

【技术特征摘要】

1.基于相对距离的向量化方法,其特征在于,用于具有树结构的单据文本,包括,

2.根据权利要求1所述的基于相对距离的向量化方法,其特征在于,还包括基于如下过程训练所述预设的基于反向传播的模型:

3.根据权利要求2所述的基于相对距离的向量化方法,其特征在于,所述获取训练数据集的步骤包括:

4.根据权利要求3所述的基于相对距离的向量化方法,其特征在于,所述将所述预测结果输入到损失函数中对所述神经网络模型进行训练,直到得到基于反向传播的模型的步骤包括:

5.根据权利要求1所述的基于相对距离的向量化方法,其特征在于,所述获取待处理的具有树结构的...

【专利技术属性】
技术研发人员:李绍轩王金丽任聪马士中徐同明杨斌王印智赵玉海杨楠楠
申请(专利权)人:浪潮通用软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1