【技术实现步骤摘要】
一种基于长短期记忆神经网络的发票票种核定方法
[0001]本专利技术涉及一种发票票种核定方法,尤其涉及一种使用基于长短期记忆神经网络(Long Short-Term Memory,LSTM)的时间序列预测模型的发票票种核定方法,属于人工智能领域。
技术介绍
[0002]纳税人办理税务登记后需领用发票,并向主管税务机关申请办理发票领用手续。主管税务机关根据纳税人的经营范围和规模,确认领用发票的种类、数量、开票限额等事宜。上述流程为发票票种核定。已办理发票票种核定的纳税人,当前领用发票的种类、数量或者开票限额不能满足经营需要的,可以向主管税务机关提出调整。目前发票票种核定多采用人工审核的方式,不仅效率低,还存在主观性较强等问题。除此之外,传统方式无法对存在票种变更情况的纳税人进行及时的提示提醒。
[0003]目前,通常将时间序列的预测研究大体分为3类:一是传统概率统计模型,主要包括回归模型,如差分整合移动平均自回归模型(Autoregressive Integrated Moving Average Model,ARIM ...
【技术保护点】
【技术特征摘要】
1.一种基于长短期记忆神经网络的发票票种核定方法,其步骤包括:1)基于长短期记忆神经网络LSTM建立票种核定预测模型并设定输入指标、输出指标;2)对于每一设定纳税人U,根据设定输入指标、输出指标采集该纳税人U最近连续N个月的相应数据作为该纳税人U的时序样本数据;3)利用变分自编码器神经网络对时序样本数据进行修复,得到平稳样本数据;然后利用平稳样本数据对票种核定预测模型进行训练,获得使得该票种核定预测模型性能最优时的最佳历史数据长度;4)根据得到的最佳历史数据长度对时序样本数据进行截取训练该票种核定预测模型;5)获取目标纳税人所述最佳历史数据长度的输入指标数据,并输入到步骤4)训练后的票种核定预测模型对该目标纳税人进行票种核定预测,得到该目标纳税人的扩版增量值、单份发票最高开票限额和每月最高购票数量。2.如权利要求1所述的方法,其特征在于,所述设定输入指标包括印花税税额、房产税税额、发票种类代码、开票金额、进项税额、销项税额、行业代码;所述设定输出指标为以10为底单份同一纳税人第i个月份发票最高开票限额与第i个月最高购票数量乘积值的对数,即扩版增量值。3.如权利要求1所述的方法,其特征在于,利用变分自编码器神经网络对时序样本数据进行修复,得到平稳样本数据的方法为:31)对于设定纳税人U的时序样本数据,根据该时序样本数据的移动平均变化图和移动均方差变化图,判定该时序样本数据是否合理,如果不合理则对该设定纳税人U重新采样;如果合理,...
【专利技术属性】
技术研发人员:王彦,武锦,王飚,马达,韩佶兴,刘思含,李超,李雪,
申请(专利权)人:中国软件与技术服务股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。