针对会计科目数据标准化处理的方法、系统及存储介质技术方案

技术编号：39157652 阅读：8 留言：0更新日期：2023-10-23 15:01

本发明专利技术提供了一种针对会计科目数据标准化处理的方法、系统及存储介质，该方法包括数据获取及处理步骤、分词并计算相似度步骤、关键词匹配步骤、标签可信度计算步骤、计算出综合的相对目标概率步骤和结果评估与返回步骤。本发明专利技术的有益效果是：会计科目数据形成标准后，可以大大提高不同行业和企业之间的信息传递效率，降低数据对于业务人员专业性的依赖，进而提高财务行业对企业数字化转型的助力。进而提高财务行业对企业数字化转型的助力。进而提高财务行业对企业数字化转型的助力。

全部详细技术资料下载

【技术实现步骤摘要】
针对会计科目数据标准化处理的方法、系统及存储介质

[0001]本专利技术涉及数据处理
，尤其涉及一种针对会计科目数据标准化处理的方法、系统及存储介质。

技术介绍

[0002]会计科目是企业按照行业约定，在实际发生业务的内容和管理要求的基础上，对会计要求的具体内容分类核算的方式。由于企业实际业务的差别和一线会计人员的习惯差异，导致各企业之间的科目编码规则和科目名称都各有差异，无法形成互为认可的标准数据。由于目前的会计科目数据无法形成标准，不同行业和企业之间的信息传递效率不高，数据对于业务人员专业性的依赖较高，无法满足用户的需求。

技术实现思路

[0003]本专利技术提供了一种针对会计科目数据标准化处理的方法，包括如下步骤：
[0004]步骤1，数据获取及处理步骤：获取企业原始会计科目数据，对企业原始会计科目数据进行清洗、检查和补全；
[0005]步骤2，分词并计算相似度步骤：运用NLP的分词算法，对会计科目数据进行分词，并将分词结果与标准科目自身的分词结果计算相似度值；
[0006]判断科目编码、科目名称是否完全匹配，如是，那么匹配结果输出，否则执行步骤3和步骤4；
[0007]步骤3，关键词匹配步骤：将分词结果运用传统AI技术和自有行业专家为每一个标准科目定义关键词，弥补现有市场上财务共享数量不足的现状；
[0008]步骤4，标签可信度计算步骤：基于公司基础信息、财务信息进行标签可信度计算，根据所有标签可信度对于数据的影响，赋予不同标签响应的权重，得到所有...

【技术保护点】

【技术特征摘要】
1.一种针对会计科目数据标准化处理的方法，其特征在于，包括如下步骤：步骤1，数据获取及处理步骤：获取企业原始会计科目数据，对企业原始会计科目数据进行清洗、检查和补全；步骤2，分词并计算相似度步骤：运用NLP的分词算法，对会计科目数据进行分词，并将分词结果与标准科目自身的分词结果计算相似度值；判断科目编码、科目名称是否完全匹配，如是，那么匹配结果输出，否则执行步骤3和步骤4；步骤3，关键词匹配步骤：将分词结果运用传统AI技术和自有行业专家为每一个标准科目定义关键词；步骤4，标签可信度计算步骤：基于公司基础信息、财务信息进行标签可信度计算，根据所有标签可信度对于数据的影响，赋予不同标签响应的权重，得到所有标签可信度信息；步骤5，计算出综合的相对目标概率步骤：结合步骤3的分词结果和步骤4中的所有标签可信度信息，综合计算出企业科目对应的多个标准科目相对目标概率；步骤6，结果评估与返回步骤：将步骤5的相对目标概率与预设值对比，如超过预设值，则取目标概率最大的一个作为目标结果输出，映射到对应标准科目，完成标准化过程，反之，则作为对应上级科目的其他科目做结果输出，并交由用户进一步确认。2.根据权利要求1所述的方法，其特征在于，在所述步骤1中，对企业原始会计科目数据进行清洗、检查和补全包括：检查科目类别的完整性，科目名称的完整性，科目借贷方向的准确性、科目余额表试算平衡，并将原始数据中的冗余数据进行补全与纠偏。3.根据权利要求1所述的方法，其特征在于，在所述步骤2中，分词后需要将分词结果与标准科目自身的分词结果根据余弦相似度算法计算相似度值。4.根据权利要求1所述的方法，其特征在于，在所述步骤4中，利用优劣解...

【专利技术属性】
技术研发人员：王俊，
申请(专利权)人：深圳答税科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人