税务领域知识图谱的构建方法、装置、设备及存储介质制造方法及图纸

技术编号:32456709 阅读:28 留言:0更新日期:2022-02-26 08:36
本申请公开了一种税务领域知识图谱的构建方法、装置、设备及存储介质。所述构建方法包括:获取多个纳税人的税务数据;根据每个所述纳税人的税务数据,分别获取每个所述纳税人的各进项数据三元组和各销项数据三元组;利用所有所述纳税人的所有所述进项数据三元组以及所有所述销项数据三元组,构建税务行业知识图谱。本申请实施例提供的税务领域知识图谱的构建方法,能够快速构建税务领域知识图谱,清晰明确地表示出了数据之间的关系,便于数据查找,提高了查询效率,同时也减少了数据冗余,节省了存储资源,降低了税务稽查人力成本,降低了税务数据稽查误差,能够很好地满足实际应用的需要。的需要。的需要。

【技术实现步骤摘要】
税务领域知识图谱的构建方法、装置、设备及存储介质


[0001]本申请涉及计算机
,具体涉及一种税务领域知识图谱的构建方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]近年来,税务行业数字化已日臻成熟,税务系统建立了规则的标准化数据,为数据之间的关系挖掘提供了基本条件。如图1所示提供了一种螺纹钢行业内不同类别商品的进销关系示意图,铁矿石、棒材、焦炭组合是螺纹钢的进项,螺纹钢是工程服务、其他钢制品的进项,铁矿石在螺纹钢作为销项有一定的行业比例属性。在税务稽查领域,对各行业的监管以及掌握不同行业税务特征的任务工作量较大,例如相同原材料在不同行业的进项比例占比不同,行业种类较多,单纯靠人工处理税务领域的任务导致人力成本较高,耗时长,且容易出现差错,这些问题亟待解决。

技术实现思路

[0003]本申请的目的是提供一种税务领域知识图谱的构建方法、装置、电子设备及计算机可读存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
[0004]根据本申请实施例的一个方面,提供一种税务领域知识图谱的构建方法,应用于计算设备,所述构建方法包括:
[0005]从网络或数据库中获取多个纳税人的税务数据;
[0006]根据每个所述纳税人的税务数据,分别获取每个所述纳税人的各进项数据三元组和各销项数据三元组并存入图数据库;
[0007]利用所述图数据库中的所有所述纳税人的所有所述进项数据三元组以及所有所述销项数据三元组,构建税务行业知识图谱。
[0008]在本申请的一些实施例中,所述获取多个纳税人的税务数据,包括从第三方数据库中提取每个纳税人的税务数据,所述每个纳税人的税务数据包括进项商品的类别、各类别的所述进项商品的进项金额、销项商品的类别以及各类别的所述销项商品的销项金额。
[0009]在本申请的一些实施例中,所述根据每个所述纳税人的税务数据,分别获取每个所述纳税人的各进项数据三元组,包括:
[0010]根据第一纳税人的第一类别的进项商品的进项金额,获取所述第一纳税人的第一金额占比;所述第一金额占比为所述第一类别的进项商品的进项金额在进项商品总金额中的占比;所述进项商品总金额为所述第一纳税人的所有进项商品的进项金额的和;
[0011]以所述第一类别的进项商品的进项金额以及所述进项商品总金额作为两个实体,以所述第一金额占比作为对应的属性关系,构成一个所述进项数据三元组;
[0012]其中,所述第一纳税人为所述多个纳税人中的任一个,所述第一类别为所述第一
纳税人的所有所述进项商品中的任一类别。
[0013]在本申请的一些实施例中,根据每个所述纳税人的税务数据,分别获取每个所述纳税人的各销项数据三元组,包括:
[0014]根据第一纳税人的第二类别的销项商品的销项金额,获取所述第一纳税人的第二金额占比;所述第二金额占比为所述第二类别的销项商品的销项金额在销项商品总金额中的占比;所述销项商品总金额为所述第一纳税人的所有销项商品的销项金额的和;
[0015]以所述第二类别的销项商品的销项金额以及所述销项商品总金额作为两个实体,以所述第二金额占比作为对应的属性关系,构成一个所述销项数据三元组;
[0016]其中,所述第一纳税人为所述多个纳税人中的任一个,所述第二类别为所述第一纳税人的所有所述销项商品中的任一类别。
[0017]在本申请的一些实施例中,所述利用所述图数据库中的所有所述纳税人的所有所述进项数据三元组以及所有所述销项数据三元组,构建税务行业知识图谱,包括:
[0018]根据各所述纳税人的所述进项数据三元组以及所述销项数据三元组,获取各所述纳税人的任意一种类别组合的原材料关系以及成品关系;所述类别组合包括两种不同类别的所述进项商品与所述销项商品;
[0019]计算所有所述纳税人的同一种类别组合的原材料关系之和以及成品关系之和;
[0020]对各所述类别组合的原材料关系之和以及各所述类别组合的成品关系之和分别进行归一化处理,得到税务行业知识图谱;
[0021]其中,所述原材料关系为在同一类别组合中的进项商品作为原材料在用于生产所述同一类别组合中销项商品的所有原材料中的占比;所述成品关系为在同一类别组合中的销项商品作为成品在以所述同一类别组合中的进项商品作为原材料所生产出的所有成品中的占比。
[0022]在本申请的一些实施例中,所述根据各所述纳税人的所述进项数据三元组以及所述销项数据三元组,获取各所述纳税人的任意一种类别组合的原材料关系以及成品关系,包括:
[0023]根据所述纳税人的所述进项数据三元组以及所述销项数据三元组,计算第一类别组合中的进项商品的进项金额与销项金额占比之乘积,得到第一类别组合的原材料关系;
[0024]根据所述纳税人的所述进项数据三元组以及所述销项数据三元组,计算所述第一类别组合中的销项商品的销项金额与进项金额占比之乘积,得到第一类别组合的成品关系;
[0025]其中,所述销项金额占比为所述第一类别组合中的销项商品的销项金额在销项商品总金额中的占比,所述进项金额占比为所述第一类别组合中的进项商品的进项金额在进项商品总金额中的占比;所述第一类别组合为所述纳税人的所有类别组合中的任一种。
[0026]在本申请的一些实施例中,所述对各所述类别组合的原材料关系之和以及各所述类别组合的成品关系之和分别进行归一化处理,得到税务行业知识图谱,包括:
[0027]计算所有所述纳税人的所有所述类别组合的原材料关系的累加和;
[0028]分别计算各所述类别组合的原材料关系之和与所述原材料关系的累加和的商,得到第一归一化处理结果;
[0029]计算所有所述纳税人的所有所述类别组合的成品关系的累加和;
[0030]分别计算各所述类别组合的成品关系之和与所述成品关系的累加和的商,得到第二归一化处理结果;
[0031]利用所述第一归一化处理结果与所述第二归一化处理结果构成所述税务行业知识图谱。
[0032]根据本申请实施例的另一个方面,提供一种税务领域知识图谱的构建装置,应用于计算设备,所述构建装置包括:
[0033]第一获取模块,用于从网络或数据库中获取多个纳税人的税务数据;
[0034]第二获取模块,用于根据每个纳税人的税务数据,分别获取每个纳税人的各进项数据三元组和各销项数据三元组并存入图数据库;
[0035]构建模块,用于利用所述图数据库中的所有所述纳税人的所有所述进项数据三元组以及所有所述销项数据三元组,构建税务行业知识图谱。
[0036]根据本申请实施例的另一个方面,提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现上述任一项的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种税务领域知识图谱的构建方法,应用于计算设备,其特征在于,所述构建方法包括:从网络或数据库中获取多个纳税人的税务数据;根据每个所述纳税人的税务数据,分别获取每个所述纳税人的各进项数据三元组和各销项数据三元组并存入图数据库;利用所述图数据库中的所有所述纳税人的所有所述进项数据三元组以及所有所述销项数据三元组,构建税务行业知识图谱。2.根据权利要求1所述的方法,其特征在于,每个所述纳税人的税务数据包括进项商品的类别、各类别的所述进项商品的进项金额、销项商品的类别以及各类别的所述销项商品的销项金额。3.根据权利要求2所述的方法,其特征在于,所述根据每个所述纳税人的税务数据,分别获取每个所述纳税人的各进项数据三元组,包括:根据第一纳税人的第一类别的进项商品的进项金额,获取所述第一纳税人的第一金额占比;所述第一金额占比为所述第一类别的进项商品的进项金额在进项商品总金额中的占比;所述进项商品总金额为所述第一纳税人的所有进项商品的进项金额的和;以所述第一类别的进项商品的进项金额以及所述进项商品总金额作为两个实体,以所述第一金额占比作为对应的属性关系,构成一个所述进项数据三元组;其中,所述第一纳税人为所述多个纳税人中的任一个,所述第一类别为所述第一纳税人的所有所述进项商品中的任一类别。4.根据权利要求2所述的方法,其特征在于,根据每个所述纳税人的税务数据,分别获取每个所述纳税人的各销项数据三元组,包括:根据第一纳税人的第二类别的销项商品的销项金额,获取所述第一纳税人的第二金额占比;所述第二金额占比为所述第二类别的销项商品的销项金额在销项商品总金额中的占比;所述销项商品总金额为所述第一纳税人的所有销项商品的销项金额的和;以所述第二类别的销项商品的销项金额以及所述销项商品总金额作为两个实体,以所述第二金额占比作为对应的属性关系,构成一个所述销项数据三元组;其中,所述第一纳税人为所述多个纳税人中的任一个,所述第二类别为所述第一纳税人的所有所述销项商品中的任一类别。5.根据权利要求3所述的方法,其特征在于,所述利用所述图数据库中的所有所述纳税人的所有所述进项数据三元组以及所有所述销项数据三元组,构建税务行业知识图谱,包括:根据各所述纳税人的所述进项数据三元组以及所述销项数据三元组,获取各所述纳税人的任意一种类别组合的原材料关系以及成品关系;所述类别组合包括两种不同类别的所述进项商品与所述销项商品;计算所有所述纳税人的同一种类别组合的原材料关系之和以及成品关系之和;对各所述类别组合的原材料关系之和以及各所述类别组合的成品关系之和分别进行归一化处理,得到税务行业知识图谱;其中,所述原材料关系为在同一类别...

【专利技术属性】
技术研发人员:董晨辉
申请(专利权)人:新华三大数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1