一种基于图神经网络的纳税人风险评测方法技术

技术编号：32782695 阅读：12 留言：0更新日期：2022-03-23 19:41

本发明专利技术公开了一种基于图神经网络的纳税人风险评测方法，其步骤包括：1)构建图风险传播模型的数据集；2)基于该数据集中各纳税人的基本信息构建一图网络，作为纳税人属性信息网络；以增值税专用发票信息为依托构建纳税人票流关系信息网；3)将纳税人属性信息网络、税人票流关系信息网合并，得到一个最终图网络；然后获取该最终图网络的邻接矩阵；4)对该数据集中各纳税人的特征向量；5)将邻接矩阵作为图风险传播网络的网络参数，利用该数据集中各纳税人的特征向量训练图风险传播网络；6)对一组待测评的纳税人，获取该组纳税人中各纳税人的特征向量并输入训练后的图风险传播网络进行预测，得到每个纳税人的风险等级及是否存在团伙情况。情况。情况。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图神经网络的纳税人风险评测方法

[0001]本专利技术涉及一种纳税人风险评测方法，尤其涉及一种使用基于图神经网络(Graph Convolutional Network，GCN)的图风险传播模型，属于人工智能领域。

技术介绍

[0002]纳税人风险等级评价是税务机关根据纳税人的历史纳税状况、纳税人经营状况、纳税人进销商品状况等综合测评出纳税人风险等级。当前的纳税人风险等级评测是相对人工化的，主要是相关专家根据已有数据对纳税人进行风险测评，用到的数据也只是纳税人基本信息和经营状况信息，根据一定的规则对纳税人某一指标打分，最终得分由所有的指标求和得出，人工的工作量比较多，更重要的是，只是考察纳税人独自信息，并没有考虑到纳税人在交易链路、关系网中的嵌入位置信息。当前的模型很难发现“团伙作案”的模式，而这样的模式对于发现纳税人经营过程中的风险传播变化是极其重要的。故我们提出了结合纳税人特征信息和票流信息、关系网拓扑结构信息的图风险传播模型，既能智能化的评测纳税人风险等级，减少人工工作量，又能结合图网络算法发现团伙信息。
[0003]当前，风险等级评价任务主要有两类解决方案:1.基于机器学习的方案，2.基于专家建模的方案。
[0004]1.基于机器学习的方案主要考虑纳税人的基本信息建模为机器学习指标然后用机器学习算法比如决策树(Decision Tree)、支持向量机(SVM)、梯度提升树(GBDT)等进行分类决策。这种方法的优点是可以直观的看到基本信息中属性对分类结果的影响，可解释性比较强。缺点是需要...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的纳税人风险评测方法，其步骤包括：1)构建图风险传播模型的数据集，包括被税务机关稽查的纳税人并设定其风险值、被认定为非正常户的纳税人并设定其风险值、正常纳税人并设定其风险值；根据风险值取值范围设定多个区间，每一区间对应一纳税人风险等级标签；其中被税务机关稽查的纳税人的风险值＞被认定为非正常户的纳税人的风险值＞正常纳税人的风险值；2)基于该数据集中各纳税人的基本信息构建一图网络，作为纳税人属性信息网络；以增值税专用发票信息为依托构建纳税人票流关系信息网；3)将纳税人属性信息网络、税人票流关系信息网合并，得到一个最终图网络；然后获取该最终图网络的邻接矩阵；4)对该数据集中各纳税人分别进行纳税人名称向量化、纳税人登记时长向量化、纳税人行业代码向量化、纳税人雇工人数向量化、纳税人信用等级向量化；然后基于所得向量化结果构建各纳税人对应的特征向量；5)将所述邻接矩阵作为图风险传播网络的网络参数，利用该数据集中各纳税人的特征向量训练图风险传播网络；6)对一组待测评的纳税人，获取该组纳税人中各纳税人的特征向量并输入步骤5)训练后的图风险传播网络进行预测，得到每个纳税人的风险等级及是否存在团伙情况。2.如权利要求1所述的方法，其特征在于，所述图风险传播网络为GCN图卷积网络模型，其数学表达式为：Z＝f(X，A)＝Softmax(A Relu(AXW
(0)
)W
(1)
)；其中，X代表纳税人的特征向量，A代...

【专利技术属性】
技术研发人员：李超，马达，吴石磊，钟晓刚，康亚军，梁少虎，秦子鹏，
申请(专利权)人：中国软件与技术服务股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人