【技术实现步骤摘要】
一种税费种类认证方法、装置和计算机可读存储介质
本专利技术涉及税务系统
,特别是涉及一种税费种类认证方法、装置和计算机可读存储介质。
技术介绍
税费种类包括行业类别、征收品目等类别。传统方式中,企业的行业类别是由税务局工作人员通过企业的经营范围来判断属于哪个行业的,一个企业可能对应一个或者多个行业;企业的征收品目同样是由税务局工作人员通过企业的经营范围来判断属于哪个征收品目,一个企业可能对应一个或者多个征收品目。由于每个税局的业务人员所在的环境不同,所以每个税务工作人员主观标准不统一;行业、征收品目都有几百种,人脑很难凭记忆完成对应,这样就造成了很多纳税人的行业定义不明确,甚至有部分明显错误;纳税人数量众多,必然导致税务工作人员繁忙以及税务办事大厅拥挤。由于经营范围与行业、征收品目存在一对多的关系,并且部分样本数据错误,导致很难直接采用机器学习算法实现分类。可见,如何实现对税费种类的统一化管理,是本领域技术人员亟待解决的问题。
技术实现思路
本专利技术实施例的目的是提供一种税费种类认证方法、装置和计算机可读存储介质,可以实现对税费种类的统一化管理。为解决上述技术 ...
【技术保护点】
1.一种税费种类认证方法,其特征在于,包括:预先建立税费种类库;其中,所述税费种类库依据历史数据建立,在所述税费种类库中存储有特征信息和税费种类的对应关系;对待处理的经营范围信息进行切词处理,得到特征向量;根据所述特征向量和所述税费种类库中特征信息的匹配度,确定出所述经营范围信息所对应的税费种类。
【技术特征摘要】
1.一种税费种类认证方法,其特征在于,包括:预先建立税费种类库;其中,所述税费种类库依据历史数据建立,在所述税费种类库中存储有特征信息和税费种类的对应关系;对待处理的经营范围信息进行切词处理,得到特征向量;根据所述特征向量和所述税费种类库中特征信息的匹配度,确定出所述经营范围信息所对应的税费种类。2.根据权利要求1所述的方法,其特征在于,所述税费种类库包括行业字典库和征收品目模型;相应的,所述税费种类包括行业类别和征收品目;其中,所述行业字典库中存储有行业类别和特征词的对应关系;所述征收品目模型基于经营范围信息和征收品目的对应关系建立。3.根据权利要求2所述的方法,其特征在于,所述行业字典库的建立过程包括:对获取的历史数据进行预处理,得到各目标行业所对应的样本集;其中,每个所述目标行业都有其对应的至少预设条数的经营范围信息;利用tf-idf算法对各所述样本集进行处理,为每个所述目标行业建立相应的行业字典库;利用k-means原理对所述行业字典库进行迭代更新,直到行业整体预测偏差值小于偏差阈值。4.根据权利要求3所述的方法,其特征在于,所述利用k-means原理对所述行业字典库进行迭代更新包括:依据各所述行业字典库对待检测的经营范围信息进行预测,确定出所述待检测的经营范围信息对应的行业类别;根据所述行业类别以及相应的实际行业类别,确定出行业整体预测偏差值;依据所述行业整体预测偏差值所对应的规则,对所述行业字典库进行更新。5.根据权利要求4所述的方法,其特征在于,所述依据各所述行业字典库对待检测的经营范围信息进行预测,确定出所述待检测的经营范围信息对应的行业类别包括:对第一经营范围信息进行切词处理,得到第一特征向量;其中,所述第一经营范围信息为所有所述待检测的经营范围信息中的任意一个待检测的经营范围信息;依据所述第一特征向量与各所述行业字典库的匹配度,确定出所述第一经营范围信息所对应的行业类别。...
【专利技术属性】
技术研发人员:钱鹏,刘红玉,徐富盛,
申请(专利权)人:税友软件集团股份有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。