【技术实现步骤摘要】
本专利技术涉及数据处理的领域,尤其涉及基于相对距离的向量化方法、系统、设备及介质。
技术介绍
1、随着经济全球化和企业数字化的浪潮,越来越多的企业搭建了自己的财务共享中心,一个用于处理共享财务信息的平台。随着互联网技术的飞速发展,网络数据规模不断扩大,数据的组织形式也变得复杂多样。每一天,财务共享中心都会收到海量的、并且种类繁多的单据,如何高效、准确、快速地处理这些单据对于合理的资金分配、库存管理和供应链优化至关重要。其中,树结构数据因其能有效体现数据的层次关系和异构信息融合的特性,被广泛应用于各种领域。然而,传统的人工处理方法耗时耗力,并且错误率也很高,已无法满足企业快速发展的要求。因此,很多企业开始寻求使用计算机代替人力进行单据处理的解决方案,而单据文本的向量化是该解决方案中至关重要的一步。
2、智能帮助是一种具有树状结构的单据文本,是财务单据最重要的一种组成成分。当前对单据文本向量化的技术中,大多采用基于统计或者基于神经网络的词嵌入技术。这些技术会构建一个语料库,包含所有可能出现的单据文本,然后对其进行统一的向量化处理
...【技术保护点】
1.基于相对距离的向量化方法,其特征在于,用于具有树结构的单据文本,包括,
2.根据权利要求1所述的基于相对距离的向量化方法,其特征在于,还包括基于如下过程训练所述预设的基于反向传播的模型:
3.根据权利要求2所述的基于相对距离的向量化方法,其特征在于,所述获取训练数据集的步骤包括:
4.根据权利要求3所述的基于相对距离的向量化方法,其特征在于,所述将所述预测结果输入到损失函数中对所述神经网络模型进行训练,直到得到基于反向传播的模型的步骤包括:
5.根据权利要求1所述的基于相对距离的向量化方法,其特征在于,所述获取待处理
...【技术特征摘要】
1.基于相对距离的向量化方法,其特征在于,用于具有树结构的单据文本,包括,
2.根据权利要求1所述的基于相对距离的向量化方法,其特征在于,还包括基于如下过程训练所述预设的基于反向传播的模型:
3.根据权利要求2所述的基于相对距离的向量化方法,其特征在于,所述获取训练数据集的步骤包括:
4.根据权利要求3所述的基于相对距离的向量化方法,其特征在于,所述将所述预测结果输入到损失函数中对所述神经网络模型进行训练,直到得到基于反向传播的模型的步骤包括:
5.根据权利要求1所述的基于相对距离的向量化方法,其特征在于,所述获取待处理的具有树结构的...
【专利技术属性】
技术研发人员:李绍轩,王金丽,任聪,马士中,徐同明,杨斌,王印智,赵玉海,杨楠楠,
申请(专利权)人:浪潮通用软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。