基于进销项比对的商贸企业增值税发票虚开风险评估方法技术

技术编号:26972192 阅读:40 留言:0更新日期:2021-01-06 00:04
一种基于进销项比对的商贸企业增值税发票虚开风险评估方法,包括以下步骤:步骤1,提取待评估地区全部增值税发票数据;步骤2,计算任意两个商品编码和的相似度,形成商品编码相似度矩阵;步骤3,根据企业登记行业信息、开票信息和增值税申报数据,筛选待评估企业;步骤4,对筛选出企业的涉及到的所有商品编码,利用步骤2的相似度矩阵SIM,对商品简称、商品编码和/或货物名称进行进销项比对,找出进销不匹配企业及对应商品编码,形成风险企业清单;步骤5,去除因某些商品企业在购进后,自行使用并没有对外销售的企业,形成最终风险清单。与现有技术相比,本发明专利技术虚开风险识别准确性高,并能够精确定位到存在风险的具体发票及金额大小。

【技术实现步骤摘要】
基于进销项比对的商贸企业增值税发票虚开风险评估方法
本专利技术涉及税务风险评估
,具体涉及一种基于进销项比对的商贸企业增值税发票虚开风险评估方法。
技术介绍
虚开发票指开具与实际经营业务情况不符的发票的违法行为,纳税单位和个人为了达到偷税的目的或者购货单位为了某种需要在商品交易过程中开具发票时,在商品名称、商品数量、商品单价以及金额上采取弄虚作假的手法。包括为他人虚开,为自己虚开,让他人为自己虚开,介绍他人虚开四种情况。为应对针对纳税人存在的发票虚开问题,税务机关运用数据信息比对分析的方法,对发票开具的真实性、准确性进行评估核实,对纳税人发票虚开风险做出定性、定量判断,进而采取进一步征管措施。
技术实现思路
为解决现有技术中存在的不足,本专利技术的目的在于,提供一种基于进销项比对的商贸企业增值税发票虚开风险评估方法,从商品简称、商品编码、货物信息三个层次进行综合分析比对,提升虚开风险识别准确性。本专利技术采用如下的技术方案。一种基于进销项比对的商贸企业增值税发票虚开风险评估方法,其特征在于,包括以下步骤本文档来自技高网...

【技术保护点】
1.一种基于进销项比对的商贸企业增值税发票虚开风险评估方法,其特征在于,包括以下步骤:/n步骤1,提取待评估地区设定时间区间内全部增值税发票数据,以SP表示全部发票的商品编码向量,SP=(sp

【技术特征摘要】
1.一种基于进销项比对的商贸企业增值税发票虚开风险评估方法,其特征在于,包括以下步骤:
步骤1,提取待评估地区设定时间区间内全部增值税发票数据,以SP表示全部发票的商品编码向量,SP=(sp1,sp2,…,spj,…,spβ),spj表示SP中第j个商品编码,β表示SP包括的商品编码数量,j=1,2,…,β;
步骤2,计算任意两个商品编码spa和spb的相似度simab,a,b=1,2,…,β,以simab作为元素形成商品编码相似度矩阵
步骤3,根据企业登记行业信息、开票信息和增值税申报数据,筛选待评估企业,形成待对比企业向量C=(c1,c2,…,ck,…,cδ),ck表示第k家待对比企业,δ表示待对比企业数量,k=1,2,…,δ;
步骤4,对筛选出企业的涉及到的所有商品编码,利用步骤2的相似度矩阵SIM,对商品简称、商品编码和/或货物名称进行进销项比对,找出进销不匹配企业及对应商品编码,形成风险企业清单;
步骤5,去除因某些商品企业在购进后,由于自行使用并没有对外销售,因此没有相应的销项发票的企业,形成最终风险清单。


2.根据权利要求1所述的基于进销项比对的商贸企业增值税发票虚开风险评估方法,其特征在于:
步骤1中所述设定时间区间为两年。


3.根据权利要求1所述的基于进销项比对的商贸企业增值税发票虚开风险评估方法,其特征在于:
步骤2具体包括:
步骤2.1,提取全部发票的货物名称,为每个商品编码spj生成一个词频向量CPj,j=1,2,…,β;
步骤2.2,使用每个商品编码spj的词频向量CPj,提取关键词,形成每个商品编码spj的关键词词频向量CP″j;
步骤2.3,使用CP″a和CP″b计算出任意两个商品编码spa和spb的相似度simab,a,b=1,2,…,β,以simab作为元素形成商品编码相似度矩阵


4.根据权利要求3所述的基于进销项比对的商贸企业增值税发票虚开风险评估方法,其特征在于:
步骤2.1中,将步骤1提取的全部增值税发票的货物名称合并后进行分词,形成全部发票分词向量,提取商品编码为spj的全部发票,对这些发票的货物名称合并后进行分词,形成与全部发票分词向量相同长度的分词出现次数向量,分词出现次数向量的元素进行归一化,形成商品编码为spj的词频向量CPj;
步骤2.2中,以CPj中分量的cpji作为元素,形成β×α矩阵M,对矩阵M的每个元素cpji进行TFIDF变换,以变换结果cp′ji作为元素,形成β×α矩阵M′,若cp′ji在矩阵M′的第j行中数值排名不在前γ名内将其置零,以变换结果cp″ji作为元素,形成β×α矩阵M″;
步骤2.3中,以如下公式计算simab,



式中:
·表示两个向量的数量积,
‖‖表示向量的长度。


5.根据权利要求4所述的基于进销项比对的商贸企业增值税发票虚开风险评估方法,其特征在于:
步骤.2.1中,以如下公式计算获得wi在商品编码为spj的全部发票货物名称中的词频cpji,



tji表示FCall中第i个词语wi在商品编码为spj的全部发票货物名称中出现的次数,若未出现过,则计为0,
形成商品编码为spj的词频向量CPj=(cpj1,cpj2,…,cpji,…,cpjα)。


6.根据权利要求1至5中任一项所述的基于进销项比对的商贸企业增值税发票虚开风险评估方法,其特征在于:
步骤3具体包括:
步骤3.1,根据企业登记行业信息,筛选出属于批发行业的企业;
步骤3.2,根据企业开票信息,去除服务类发票占比高于阈值的企业;
步骤3.3,根据企业增值税申报数据,筛选出开具发票销售额占总销售额比例大于筛选阈值的企业,形成待对比企业向量C=(c1,c2,…,ck,…,cδ),ck表示第...

【专利技术属性】
技术研发人员:吴敬周宏立
申请(专利权)人:神州数码信息系统有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1