针对会计科目数据标准化处理的方法、系统及存储介质技术方案

技术编号:39157652 阅读:8 留言:0更新日期:2023-10-23 15:01
本发明专利技术提供了一种针对会计科目数据标准化处理的方法、系统及存储介质,该方法包括数据获取及处理步骤、分词并计算相似度步骤、关键词匹配步骤、标签可信度计算步骤、计算出综合的相对目标概率步骤和结果评估与返回步骤。本发明专利技术的有益效果是:会计科目数据形成标准后,可以大大提高不同行业和企业之间的信息传递效率,降低数据对于业务人员专业性的依赖,进而提高财务行业对企业数字化转型的助力。进而提高财务行业对企业数字化转型的助力。进而提高财务行业对企业数字化转型的助力。

【技术实现步骤摘要】
针对会计科目数据标准化处理的方法、系统及存储介质


[0001]本专利技术涉及数据处理
,尤其涉及一种针对会计科目数据标准化处理的方法、系统及存储介质。

技术介绍

[0002]会计科目是企业按照行业约定,在实际发生业务的内容和管理要求的基础上,对会计要求的具体内容分类核算的方式。由于企业实际业务的差别和一线会计人员的习惯差异,导致各企业之间的科目编码规则和科目名称都各有差异,无法形成互为认可的标准数据。由于目前的会计科目数据无法形成标准,不同行业和企业之间的信息传递效率不高,数据对于业务人员专业性的依赖较高,无法满足用户的需求。

技术实现思路

[0003]本专利技术提供了一种针对会计科目数据标准化处理的方法,包括如下步骤:
[0004]步骤1,数据获取及处理步骤:获取企业原始会计科目数据,对企业原始会计科目数据进行清洗、检查和补全;
[0005]步骤2,分词并计算相似度步骤:运用NLP的分词算法,对会计科目数据进行分词,并将分词结果与标准科目自身的分词结果计算相似度值;
[0006]判断科目编码、科目名称是否完全匹配,如是,那么匹配结果输出,否则执行步骤3和步骤4;
[0007]步骤3,关键词匹配步骤:将分词结果运用传统AI技术和自有行业专家为每一个标准科目定义关键词,弥补现有市场上财务共享数量不足的现状;
[0008]步骤4,标签可信度计算步骤:基于公司基础信息、财务信息进行标签可信度计算,根据所有标签可信度对于数据的影响,赋予不同标签响应的权重,得到所有标签可信度信息;
[0009]步骤5,计算出综合的相对目标概率步骤:结合步骤3的分词结果和步骤4中的所有标签可信度信息,综合计算出企业科目对应的多个标准科目相对目标概率;
[0010]步骤6,结果评估与返回步骤:将步骤5的相对目标概率与预设值对比,如超过预设值,则取目标概率最大的一个作为目标结果输出,映射到对应标准科目,完成标准化过程,反之,则作为对应上级科目的其他科目做结果输出,并交由用户进一步确认。
[0011]作为本专利技术的进一步改进,在所述步骤1中,对企业原始会计科目数据进行清洗、检查和补全包括:检查科目类别的完整性,科目名称的完整性,科目借贷方向的准确性、科目余额表试算平衡,并将原始数据中的冗余数据进行补全与纠偏。
[0012]作为本专利技术的进一步改进,在所述步骤2中,分词后需要将分词结果与标准科目自身的分词结果根据余弦相似度算法计算相似度值。
[0013]作为本专利技术的进一步改进,在所述步骤4中,利用优劣解距离法模型,并基于公司基础信息、财务信息进行标签可信度计算,根据所有标签可信度对于数据的影响,赋予不同
标签响应的权重。
[0014]作为本专利技术的进一步改进,在所述步骤4中,公司基础信息包括行业、是否上市,财务信息包括会计准则、科目类别。
[0015]作为本专利技术的进一步改进,所述步骤4包括如下步骤:
[0016]步骤A:将原始数据矩阵正向化;
[0017]步骤B:将正向化后的矩阵标准化;
[0018]步骤C:计算每个方案各自与最优解和最劣解的距离;
[0019]步骤D:根据最优解与最劣解计算得分并排序。
[0020]作为本专利技术的进一步改进,在所述步骤A中,将极小型指标、中间型指标、区间型指标对应的数据全部化成极大型指标。
[0021]作为本专利技术的进一步改进,在所述步骤6中,将步骤5的相对目标概率与预设值对比,如超过预设值,则取目标概率最大的一个作为目标结果输出,映射到对应标准科目,完成标准化过程,反之,则执行如下步骤:
[0022]将科目放入对应层级标准科目中的其他类科目,作为待细分科目;
[0023]交由用户判断是否对待细分科目进行细分,如是,那么记录该科目被细分的结果与次数,达到预设结果后正反馈至数据模型并修正数据模型
[0024]后续如有同类数据,将自动根据修正后的数据模型输出目标概率最大的目标结果。
[0025]本专利技术还提供了一种针对会计科目数据标准化处理的系统,包括:存储器、处理器以及存储在所述存储器上的计算机程序,所述计算机程序配置为由所述处理器调用时实现本专利技术所述方法的步骤。
[0026]本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序配置为由处理器调用时实现本专利技术所述方法的步骤。
[0027]本专利技术的有益效果是:会计科目数据形成标准后,可以大大提高不同行业和企业之间的信息传递效率,降低数据对于业务人员专业性的依赖,进而提高财务行业对企业数字化转型的助力。
附图说明
[0028]图1是本专利技术的方法流程图。
具体实施方式
[0029]本专利技术所要解决的技术问题在于,在财会行业数据相对不共享,会计规范相对宽松的背景下,提供一种针对与会计科目数据标准化处理的程序,完成行业上下游对于财务数据的进一步加工和使用,以助力企业数字化转型和行业规范化发展,如图1所示,本专利技术公开了一种针对会计科目数据标准化处理的方法,包括如下步骤:
[0030]步骤1,数据获取及处理步骤:获取企业原始会计科目数据,对企业原始会计科目数据进行清洗、检查和补全;对企业原始会计科目数据进行清洗、检查和补全包括:检查科目类别的完整性,科目名称的完整性,科目借贷方向的准确性、科目余额表试算平衡,并将原始数据中的冗余数据进行补全与纠偏。
[0031]在步骤1中,对企业原始会计科目数据进行清洗、检查和补全动作,示例如下:
[0032]处理前科目:
[0033]科目编码科目名称科目层级科目方向6602**V管理费用116602/01.001

LS管理费用/职工薪酬/社保311231#坏账准备&121231#

1应收票据坏账准备21
[0034]处理后科目:
[0035][0036][0037]步骤2,分词并计算相似度步骤:运用NLP的基础算法

分词算法,对会计科目数据进行分词,分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。在英文的行文中,单词之间是以空格作为自然分界符的,而中文只是字、句和段能通过明显的分界符来简单划界,唯独词没有一个形式上的分界符,虽然英文也同样存在短语的划分问题,不过在词这一层上,中文比之英文要复杂得多、困难得多。在分词后,将分词结果与标准科目自身的分词结果和词频-逆文档频率(Term Frequency

Inverse Document Frequency,TF

IDF)计算相似度值。
[0038]作为步骤2的优选实施例,在所述步骤2中,分词后需要将分词结果与标准科目自身的分词结果根据余弦相似度算法计算相似度值。
[0039]在步骤2中,对企业原始会计科目分词示例如下:
[0040][0041][0042]步骤3,关键词匹本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对会计科目数据标准化处理的方法,其特征在于,包括如下步骤:步骤1,数据获取及处理步骤:获取企业原始会计科目数据,对企业原始会计科目数据进行清洗、检查和补全;步骤2,分词并计算相似度步骤:运用NLP的分词算法,对会计科目数据进行分词,并将分词结果与标准科目自身的分词结果计算相似度值;判断科目编码、科目名称是否完全匹配,如是,那么匹配结果输出,否则执行步骤3和步骤4;步骤3,关键词匹配步骤:将分词结果运用传统AI技术和自有行业专家为每一个标准科目定义关键词;步骤4,标签可信度计算步骤:基于公司基础信息、财务信息进行标签可信度计算,根据所有标签可信度对于数据的影响,赋予不同标签响应的权重,得到所有标签可信度信息;步骤5,计算出综合的相对目标概率步骤:结合步骤3的分词结果和步骤4中的所有标签可信度信息,综合计算出企业科目对应的多个标准科目相对目标概率;步骤6,结果评估与返回步骤:将步骤5的相对目标概率与预设值对比,如超过预设值,则取目标概率最大的一个作为目标结果输出,映射到对应标准科目,完成标准化过程,反之,则作为对应上级科目的其他科目做结果输出,并交由用户进一步确认。2.根据权利要求1所述的方法,其特征在于,在所述步骤1中,对企业原始会计科目数据进行清洗、检查和补全包括:检查科目类别的完整性,科目名称的完整性,科目借贷方向的准确性、科目余额表试算平衡,并将原始数据中的冗余数据进行补全与纠偏。3.根据权利要求1所述的方法,其特征在于,在所述步骤2中,分词后需要将分词结果与标准科目自身的分词结果根据余弦相似度算法计算相似度值。4.根据权利要求1所述的方法,其特征在于,在所述步骤4中,利用优劣解...

【专利技术属性】
技术研发人员:王俊
申请(专利权)人:深圳答税科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1