一种基于知识图谱的循环开票风险识别方法技术

技术编号:26173846 阅读:70 留言:0更新日期:2020-10-31 13:58
本发明专利技术特别涉及一种基于知识图谱的循环开票风险识别方法。该基于知识图谱的循环开票风险识别方法,从循环开票交易关系入手,以知识图谱技术为基础,构建纳税人交易关系主干网络;采用图算法搜索异常交易关系,揭示发票虚开风险;在识别循环开票纳税人的基础上,结合纳税人的属性信息,发现实体关联关系,识别虚开发票团伙。该基于知识图谱的循环开票风险识别方法,借鉴知识图谱技术挖掘交易闭环子图,不仅能够发现循环开票纳税人,同时结合纳税人的属性信息和开票信息,还能识别出发票虚开团伙,有助于深挖发票虚开风险,提升税收征管质效。

【技术实现步骤摘要】
一种基于知识图谱的循环开票风险识别方法
本专利技术涉及税收风险管理
,特别涉及一种基于知识图谱的循环开票风险识别方法。
技术介绍
一般来说,商品的交易流向是单向的,依次流经产业链的上游、中游和下游,而鲜少出现交易关系的闭环,即又从产业链下游流向产业链上游,此为异常交易,可能具有潜在的税收风险。虚开增值税专用发票,是指为他人、为自己、让他人为自己、介绍他人虚开增值税专用发票的行为。循环开票是指多户纳税人通过互相串开增值税发票,使交易关系构成有向环形图的特殊情况,往往涉嫌虚开发票风险。针对发票虚开犯罪的行为隐蔽性、手段多样性、组织团伙化等特点,本专利技术提出了一种基于知识图谱的循环开票风险识别方法。
技术实现思路
本专利技术为了弥补现有技术的缺陷,提供了一种简单高效的基于知识图谱的循环开票风险识别方法。本专利技术是通过如下技术方案实现的:一种基于知识图谱的循环开票风险识别方法,其特征在于:从循环开票交易关系入手,以知识图谱技术为基础,构建纳税人交易关系主干网络;采用图算法搜索异常交易关系,揭本文档来自技高网...

【技术保护点】
1.一种基于知识图谱的循环开票风险识别方法,其特征在于:从循环开票交易关系入手,以知识图谱技术为基础,构建纳税人交易关系主干网络;采用图算法搜索异常交易关系,揭示发票虚开风险;在识别循环开票纳税人的基础上,结合纳税人的属性信息,发现实体关联关系,识别虚开发票团伙。/n

【技术特征摘要】
1.一种基于知识图谱的循环开票风险识别方法,其特征在于:从循环开票交易关系入手,以知识图谱技术为基础,构建纳税人交易关系主干网络;采用图算法搜索异常交易关系,揭示发票虚开风险;在识别循环开票纳税人的基础上,结合纳税人的属性信息,发现实体关联关系,识别虚开发票团伙。


2.根据权利要求1所述的基于知识图谱的循环开票风险识别方法,其特征在于,包括以下步骤:
第一步,提取特定经营周期的增值税发票明细数据,包含增值税专用发票、增值税普通发票和电子发票数据;对提取的增值税发票明细数据进行数据预处理,按发票的购方和销方合并金额,并汇总销方纳税人总金额,计算销方与不同购方交易的金额占比;
第二步,利用合并的发票数据,提取增值税发票数据,以纳税人为实体,通过发票的购销方确定交易关系,构建纳税人之间的交易关系知识图谱;
第三步,通过深度优先算法寻找有向图中的闭环,即为循环开票的纳税人;
第四步,采用网络中心度、循环金额占比和纳税人信用等级指标计算加权风险评分,给出纳税人的循环开票风险得分,从而得到风险纳税人清单。


3.根据权利要求2所述的基于知识图谱的循环开票风险识别方法,其特征在于:所述第一步中,为了全面获取纳税人信息构建交易关系知识图谱,提取纳税人的登记信息,增值税发票数据和纳税人信用数据,形成纳税人画像;以增值税专用发票、增值税普通发票和电子发票的购方和销方纳税人作为图谱的实体,以购销方交易关系作为图谱关系,构建知识图谱;对知识图谱的数据抽取包括实体属性抽取和关系抽取两部分。


4.根据权利要求3所述的基于知识图谱的循环开票风险识别方法,其特征在于:所述实体属性抽取信息包括纳税人信息和开票地址信息;
其中,纳税人信息包括纳税人识别号、纳税人名称、法定代表人姓名、法定代表人身份证件号码、股东、股东身份证件号码、财务负责人姓名和财务负责人身份证件号码;
开票地址信息为销方纳税人的属性信息,包括增值税发票开票机的IP地址和Mac地址。


5.根据权利要求3所述的基于知识图谱的循环开票风险识别方法,...

【专利技术属性】
技术研发人员:王凯程林杨培强
申请(专利权)人:山东浪潮商用系统有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1