【技术实现步骤摘要】
一种基于协同过滤的进销项差异度计算的方法及系统
本专利技术涉及
税务数据监管
,更具体地,涉及一种基于协同过滤的进销项差异度计算的方法及系统。
技术介绍
我国的国税地税征管体制改革以后,新税务机构正式运行的第一年,税收征管环境正在发生着巨大的变化,随着减税降费政策的贯彻执行,必然伴生的是利用金税三期系统、大数据和信息化手段加强税收征管与税务稽查的力度。在虚开行为中,进销项比对是一个重要指标。现在大数据和人工智能技术逐渐成熟,如何结合新技术提高进销项比对准确性是现阶段亟需解决的问题。现有的进销项比对是基于进销项商品编码比对来实现的,存在两个缺点:首先该方法是通过对纳税人购进和销售的商品编码进行简单比对,没有考虑充分发挥税务大数据的优势。另外,该方法对于进销项不完全一致的情况,缺少一个准确进销项差异度度量,无法满足精确监控的要求。现有技术(申请号:CN201611219220.9)公开了一种用于计算进项物品列表和销项物品列表之间差异度的方法,方法包括:进行进项物品的数据准备并且执行进项数据查询,对纳税 ...
【技术保护点】
1.一种基于协同过滤的进销项差异度计算的方法,所述方法包括:/n将进项商品评分矩阵作为协同过滤算法模型的输入,对所述协同过滤算法模型进行训练,获取纳税人进项特征矩阵和商品内容矩阵;/n将销项商品评分矩阵和所述商品内容矩阵作为协同过滤算法模型的输入,对所述协同过滤算法模型进行训练,获取纳税人销项特征矩阵;/n根据所述纳税人进项特征矩阵的购进特征向量和所述纳税人销项特征矩阵的销项特征向量之间的余弦相似度计算纳税人进销项差异度。/n
【技术特征摘要】
1.一种基于协同过滤的进销项差异度计算的方法,所述方法包括:
将进项商品评分矩阵作为协同过滤算法模型的输入,对所述协同过滤算法模型进行训练,获取纳税人进项特征矩阵和商品内容矩阵;
将销项商品评分矩阵和所述商品内容矩阵作为协同过滤算法模型的输入,对所述协同过滤算法模型进行训练,获取纳税人销项特征矩阵;
根据所述纳税人进项特征矩阵的购进特征向量和所述纳税人销项特征矩阵的销项特征向量之间的余弦相似度计算纳税人进销项差异度。
2.根据权利要求1所述的方法,所述方法还包括:
获取纳税人的进项发票信息和销项发票信息,构建纳税人的进项发票信息表和销项发票信息表;
对所述进项发票信息表和所述销项发票信息表的数据进行清洗;
对清洗后的所述进项发票信息表和所述销项发票信息表的数据进行聚合运算,获取进项发票信息聚合表和销项发票信息聚合表。
3.根据权利要求2所述的方法,所述方法还包括:
对所述进项发票信息聚合表中的字段进行标准化,按预定权重对各个字段进行加权平均处理,获取进项商品加权评分结果;并将进项商品加权评分结果映射到预定区间,获取所述进项商品最终加权评分,建立包括所述进项商品最终加权评分的进项商品评分事实表;
对所述销项发票信息聚合表中的字段进行标准化,按预定权重对各个字段进行加权平均处理,获取销项商品加权评分结果;并将销项商品加权评分结果映射到预定区间,获取所述销项商品最终加权评分,建立包括所述销项商品最终加权评分的销项商品评分事实表。
4.根据权利要求3所述的方法,所述方法还包括:
建立进项商品评分矩阵,所述进项商品评分矩阵包括:纳税人索引名称、购进和销售的所有商品的索引名称以及进项商品评分事实表;
建立销项商品评分矩阵,所述销项商品评分矩阵包括:纳税人索引名称、购进和销售的所有商品的索引名称以及销项商品评分事实表。
5.根据权利要求3所述的方法,所述方法中的字段包括:购进金额、购进数量和购进频次。
6.一种基于协同过滤的进...
【专利技术属性】
技术研发人员:张殿臣,刘丹,吴伟刚,郝建茹,潘竞旭,鲁龙,宋颖,
申请(专利权)人:航天信息股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。