发票超限量申请审批方法、装置、设备和介质制造方法及图纸

技术编号:32200233 阅读:24 留言:0更新日期:2022-02-08 16:06
本发明专利技术实施例涉及一种发票超限量申请审批方法、装置、设备和介质。该方法包括:获取待审批实体的实体信息和涉税数据,其中,所述待审批实体为发起发票超限量申请的实体;基于所述实体信息和所述涉税数据,构建第一基础特征向量;基于所述第一基础特征向量,生成第一衍生特征向量;其中,所述第一衍生特征向量用于反映所述待审批实体属于审批通过类型或审批拒绝类型的区分程度;将所述第一基础特征向量和所述第一衍生特征向量输入预先训练得到的目标申请审批模型,并基于模型输出结果确定对所述待审批实体发起的所述发票超限量申请的审批结果。通过上述技术方案,提高了审批方案的泛化性能和审批准确性。的泛化性能和审批准确性。的泛化性能和审批准确性。

【技术实现步骤摘要】
发票超限量申请审批方法、装置、设备和介质


[0001]本专利技术涉及金融
,尤其涉及一种发票超限量申请审批方法、装置、设备和介质。

技术介绍

[0002]发票超限量申请是指纳税实体(如企业)受各种因素的影响,在实际生产经营过程中出现实际用票量超过票种核定的领票数量,进而向主管税务机关发起的超额发票领取的申请。发票超限量申请审批是指主管税务机关对发票超限量申请的批复过程。为了提高主管税务机关的审批效率,往往借助计算机技术进行相关数据的处理,来实现智能/自动审批。
[0003]目前,对于发票超限量申请的智能审批的主要实现方案是基于专家评价指标体系的审批方案。该方案利用相关税务专家确定的评价指标、指标权重和风险定性阈值等参数对发起发票超限量申请的实体进行评估,并根据评估结果来确定是否通过该实体的发票超限量申请。
[0004]但是,上述基于专家评价指标体系的审批方案中,评价指标的选取、指标权重和风险定性阈值的设定均依赖于税务专家的领域经验,使得该方案存在泛化性能较差、可扩展性较差的问题。并且,上述三项内容的确定策略均是人为设定,其难以适应税收政策的变化与更新、也难以适应企业发展所引起的企业行为数据的变化与更新,导致该方案对于新时期发票审批的适应性和企业发展的适应性均较差,最终导致该方案的智能审批的准确性低。

技术实现思路

[0005]为了解决上述技术问题,本专利技术提供了一种发票超限量申请审批方法、装置、设备和介质。
[0006]第一方能,本专利技术实施例提供了一种发票超限量申请审批方法,该方法包括:获取待审批实体的实体信息和涉税数据,其中,所述待审批实体为发起发票超限量申请的实体;基于所述实体信息和所述涉税数据,构建第一基础特征向量;基于所述第一基础特征向量,生成第一衍生特征向量;其中,所述第一衍生特征向量用于反映所述待审批实体属于审批通过类型或审批拒绝类型的区分程度;将所述第一基础特征向量和所述第一衍生特征向量输入预先训练得到的目标申请审批模型,并基于模型输出结果确定对所述待审批实体发起的所述发票超限量申请的审批结果。
[0007]在一些实施例中,所述基于所述第一基础特征向量,生成第一衍生特征向量包括:获取多个样本实体类别;其中,所述样本实体类别通过对多个样本实体的第二基础特征向量进行分类而得到,所述样本实体类别和所述样本实体均为所述目标申请审批模
型的训练数据;确定所述第一基础特征向量归属于各所述样本实体类别的归属度,并基于各所述归属度生成归属度向量;基于所述归属度向量,生成所述第一衍生特征向量。
[0008]在一些实施例中,所述基于所述归属度向量,生成所述第一衍生特征向量包括:基于各所述样本实体类别中包含的对应有审批通过类型标签的样本实体的占比,确定各所述样本实体类别对应的关联度向量;其中,所述关联度向量中的元素用于表征所述元素对应的样本实体类别与所述审批通过类型之间的关联程度;基于所述归属度向量和所述关联度向量,生成所述第一衍生特征向量。
[0009]在一些实施例中,所述确定所述第一基础特征向量归属于各所述样本实体类别的归属度包括:确定每个所述样本实体类别的类别中心向量;确定所述第一基础特征向量和每个所述样本实体类别对应的所述类别中心向量之间的欧氏距离;针对每个所述样本实体类别,确定所述样本实体类别对应的所述欧氏距离与各所述欧氏距离的加和的比值,作为所述第一基础特征向量归属于所述样本实体类别的所述归属度。
[0010]在一些实施例中,所述样本实体类别通过对所述多个样本实体的所述第二基础特征向量进行聚类分析而得到。
[0011]在一些实施例中,所述第一基础特征向量包含历史申请次数、历史审批通过率、历史用票方差、当前申请异常值、历史纳税异常值、注册地址异常值和信息变更频度值。
[0012]进一步地,所述基于所述实体信息和所述涉税数据,构建第一基础特征向量包括:统计所述涉税数据中的发票超限额申请的申请次数,作为所述历史申请次数;统计所述涉税数据中的发票超限额申请的审批通过次数,并确定所述审批通过次数与所述历史申请次数的比值,作为所述历史审批通过率;基于所述涉税数据中的各历史发票领取周期内的领取发票信息,确定所述历史用票方差;基于当前发票领取周期内的已使用发票信息、当前发票超限额申请的申请发票信息和所述涉税数据中的各所述历史发票领取周期内的领取发票信息,确定所述当前申请异常值;基于所述涉税数据中的各所述历史发票领取周期内的纳税申报信息,确定所述历史纳税异常值;基于所述实体信息中的历史注册地址信息和历史实体法人信息,确定所述注册地址异常值和所述信息变更频度值。
[0013]在一些实施例中,所述基于模型输出结果确定对所述待审批实体发起的所述发票超限量申请的审批结果包括:基于所述模型输出的审批通过类型对应的概率和审批拒绝类型对应的概率,确定所述待审批实体发起的所述发票超限量申请对应的目标审批类型;将所述审批通过类型对应的概率、所述审批拒绝类型对应的概率和所述目标审批
类型确定为所述审批结果。
[0014]在一些实施例中,所述目标申请审批模型通过如下方式预先训练获得:获取训练样本集;其中,所述训练样本集中包含每个样本实体对应的第二基础特征向量、第二衍生特征向量和审批类型标签;所述审批类型标签为审批通过类型标签或审批拒绝类型标签;利用所述训练样本集对所述预设分类模型进行模型训练,并在训练达到预设收敛条件时,停止训练,且将训练后的预设分类模型确定为所述目标申请审批模型。
[0015]进一步地,所述预设分类模型为极致梯度提升模型。
[0016]第二方面,本专利技术实施例还提供了一种发票超限量申请审批装置,所述装置包括:数据获取模块,用于获取待审批实体的实体信息和涉税数据,其中,所述待审批实体为发起发票超限量申请的实体;第一基础特征向量构建模块,用于基于所述实体信息和所述涉税数据,构建第一基础特征向量;第一衍生特征向量生成模块,用于基于所述第一基础特征向量,生成第一衍生特征向量;其中,所述第一衍生特征向量用于反映所述待审批实体属于审批通过类型或审批拒绝类型的区分程度;审批结果确定模块,用于将所述第一基础特征向量和所述第一衍生特征向量输入预先训练得到的目标申请审批模型,并基于模型输出结果确定对所述待审批实体发起的所述发票超限量申请的审批结果。
[0017]在一些实施例中,第一衍生特征向量生成模块包括:样本实体类别获取子模块,用于获取多个样本实体类别;其中,所述样本实体类别通过对多个样本实体的第二基础特征向量进行分类而得到,所述样本实体类别和所述样本实体均为所述目标申请审批模型的训练数据;归属度向量生成子模块,用于确定所述第一基础特征向量归属于各所述样本实体类别的归属度,并基于各所述归属度生成归属度向量;第一衍生特征向量生成子模块,用于基于所述归属度向量,生成所述第一衍生特征向量。
[0018]在一些实施例中,第一衍生特征向量生成子模块具体用于:基于各所述样本实体类别中包含的对应有审批通过类型标签的样本实体的占比,确定各所述样本实体类本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种发票超限量申请审批方法,其特征在于,包括:获取待审批实体的实体信息和涉税数据,其中,所述待审批实体为发起发票超限量申请的实体;基于所述实体信息和所述涉税数据,构建第一基础特征向量;基于所述第一基础特征向量,生成第一衍生特征向量;其中,所述第一衍生特征向量用于反映所述待审批实体属于审批通过类型或审批拒绝类型的区分程度;将所述第一基础特征向量和所述第一衍生特征向量输入预先训练得到的目标申请审批模型,并基于模型输出结果确定对所述待审批实体发起的所述发票超限量申请的审批结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一基础特征向量,生成第一衍生特征向量包括:获取多个样本实体类别;其中,所述样本实体类别通过对多个样本实体的第二基础特征向量进行分类而得到,所述样本实体类别和所述样本实体均为所述目标申请审批模型的训练数据;确定所述第一基础特征向量归属于各所述样本实体类别的归属度,并基于各所述归属度生成归属度向量;基于所述归属度向量,生成所述第一衍生特征向量。3.根据权利要求2所述的方法,其特征在于,所述基于所述归属度向量,生成所述第一衍生特征向量包括:基于各所述样本实体类别中包含的对应有审批通过类型标签的样本实体的占比,确定各所述样本实体类别对应的关联度向量;其中,所述关联度向量中的元素用于表征所述元素对应的样本实体类别与所述审批通过类型之间的关联程度;基于所述归属度向量和所述关联度向量,生成所述第一衍生特征向量。4.根据权利要求2所述的方法,其特征在于,所述确定所述第一基础特征向量归属于各所述样本实体类别的归属度包括:确定每个所述样本实体类别的类别中心向量;确定所述第一基础特征向量和每个所述样本实体类别对应的所述类别中心向量之间的欧氏距离;针对每个所述样本实体类别,确定所述样本实体类别对应的所述欧氏距离与各所述欧氏距离的加和的比值,作为所述第一基础特征向量归属于所述样本...

【专利技术属性】
技术研发人员:郭建彬董立峰黄泰文李晓彤徐明媛赵菲菲盘浩军罗引王磊
申请(专利权)人:深圳中科闻歌科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1