一种住宿业纳税人风险模型分析方法及装置制造方法及图纸

技术编号:27107223 阅读:56 留言:0更新日期:2021-01-25 18:58
本发明专利技术提供一种住宿业纳税人风险模型分析方法及装置,定期采集互联网上住宿业纳税人发布的房间信息,计算房间最低价格;定期采集公安系统登记的住宿业纳税人的房间入住信息,计算入住天数;将互联网的住宿业纳税人信息、公安系统的住宿业纳税人信息、税务系统的住宿业纳税人税务登记信息进行匹配;计算住宿业纳税人的实际收入,并与申报收入比对,完成住宿业风险纳税人预测模型的建立,预测纳税人风险程度。本发明专利技术基于互联网信息、公安系统信息、税务系统信息通过模型算法进行住宿业纳税人实际收入的测算,与税务系统纳税人的申报收入进行比对,通过数据分析以及时准确的发现少报、漏报、隐瞒销售收入的风险纳税人。隐瞒销售收入的风险纳税人。隐瞒销售收入的风险纳税人。

【技术实现步骤摘要】
一种住宿业纳税人风险模型分析方法及装置


[0001]本专利技术属于税务风险管理领域,特别是涉及到一种住宿业纳税人风险模型分析方法及装置。

技术介绍

[0002]在税务风险管理领域中,对于住宿业纳税人税务风险的分析和管理还存在很多问题,住宿业纳税人的营业额往往比较大,而且缺少必要的数据监管,也没有具有针对性的住宿业税务信息分析方法,导致不能准确的发现少报、漏报、隐瞒销售收入的情况,不能准确定位存在偷漏税风险的纳税人。

技术实现思路

[0003]本专利技术提出一种住宿业纳税人风险模型分析方法及装置,能够使用数据分析及时准确的发现少报、漏报、隐瞒销售收入的风险纳税人。
[0004]为了实现上述目的,本专利技术的技术方案是这样实现的:
[0005]一种住宿业纳税人风险模型分析方法,包括:
[0006]S1、定期采集互联网上住宿业纳税人发布的房间信息,计算房间最低价格;
[0007]S2、定期采集公安系统登记的住宿业纳税人的房间入住信息,计算入住天数;
[0008]S3、将互联网的住宿业纳税人信息、公安系统的住宿业纳税人信息、税务系统的住宿业纳税人税务登记信息进行匹配;
[0009]S4、计算住宿业纳税人的实际收入,并与申报收入比对,完成住宿业风险纳税人预测模型的建立,预测纳税人风险程度。
[0010]进一步的,步骤S1的具体采集方法为:
[0011]S101、使用爬虫技术,定期采集互联网上发布的房间信息,包括宾馆、房型、房间价格等信息;
[0012]S102、采集频率根据旅游淡季和旺季中住宿业纳税人在互联网更新频率进行对应设定;
[0013]S103、按照房间最低价格进行取样。
[0014]更进一步的,步骤S101中,每采集一个住宿业纳税人的信息,休眠一次,根据随机数算法生成50秒以内的随机数作为休眠时长;该步骤是用于模拟人工,不增加互联网网站的压力。
[0015]进一步的,步骤S2的具体方法包括:
[0016]S201、采集公安系统登记的入住信息包括:住宿业纳税人代码、名称、入住房间号、入住时间、退房时间;
[0017]S202、基于入住信息计算入住天数,计算的规则如下:
[0018](1)凌晨4点之前入住当天中午12点计算为1天;
[0019](2)凌晨4点之后入住次日中午12点计算为1天;
[0020](3)对于多人同一时间段入住同一房间且同一时间段退房按1间房计算;
[0021](4)对于多人不同时间入住但同一时间退房的:按最长时间计算;
[0022](5)对于多人不同时间入住而且是不同时间退房的:按最早入住人员计算入住开始时间,按最晚退房人员计算退房时间,从上述入住时间、退房时间计算总体入住天数。
[0023]进一步的,步骤S3的具体方法包括:
[0024]S301、比较名称是否完全一致,名称完全一致的自动匹配;
[0025]S302、名称不一致的使用相似度算法进行计算,相似度达到阈值的自动匹配;
[0026]S303、相似度低于阈值的,提供匹配界面由人工匹配。
[0027]本专利技术另一方面还提供了一种住宿业纳税人风险模型分析装置,包括:
[0028]互联网信息采集模块,用于定期采集互联网上住宿业纳税人发布的房间信息,计算房间最低价格;
[0029]公安系统信息采集模块,用于定期采集公安系统登记的住宿业纳税人的房间入住信息,计算入住天数;
[0030]匹配模块,用于将互联网的住宿业纳税人信息、公安系统的住宿业纳税人信息、税务系统的住宿业纳税人税务登记信息进行匹配;
[0031]计算模块,用于计算住宿业纳税人的实际收入,并与申报收入比对,完成住宿业风险纳税人预测模型的建立,预测纳税人风险程度。
[0032]进一步的,互联网信息采集模块包括:
[0033]爬虫采集单元,用于使用爬虫技术,定期采集互联网上发布的房间信息,包括宾馆、房型、房间价格等信息;
[0034]频率设定单元,用于将采集频率根据旅游淡季和旺季中住宿业纳税人在互联网更新频率进行对应设定;
[0035]最低取样单元,用于控制按照房间最低价格进行取样。
[0036]更进一步的,爬虫采集单元设有休眠子单元和随机时长子单元,所述休眠子单元控制每采集一个住宿业纳税人的信息休眠一次,所述随机时长子单元根据随机数算法生成50秒以内的随机数作为休眠时长;该步骤是用于模拟人工,不增加互联网网站的压力。
[0037]进一步的,公安系统信息采集模块包括:
[0038]信息采集单元,用于采集公安系统登记的入住信息包括:住宿业纳税人代码、名称、入住房间号、入住时间、退房时间;
[0039]天数计算单元,基于入住信息计算入住天数,计算的规则如下:
[0040](1)凌晨4点之前入住当天中午12点计算为1天;
[0041](2)凌晨4点之后入住次日中午12点计算为1天;
[0042](3)对于多人同一时间段入住同一房间且同一时间段退房按1间房计算;
[0043](4)对于多人不同时间入住但同一时间退房的:按最长时间计算;
[0044](5)对于多人不同时间入住而且是不同时间退房的:按最早入住人员计算入住开始时间,按最晚退房人员计算退房时间,从上述入住时间、退房时间计算总体入住天数。
[0045]进一步的,匹配模块包括:
[0046]比较单元,用于比较名称是否完全一致,名称完全一致的自动匹配;
[0047]相似度计算单元,用于将名称不一致的使用相似度算法进行计算,相似度达到阈
值的自动匹配;
[0048]人工匹配单元,相似度低于阈值的,提供匹配界面由人工匹配。
[0049]与现有技术相比,本专利技术具有如下的有益效果:
[0050]本专利技术基于互联网信息、公安系统信息、税务系统信息通过模型算法进行住宿业纳税人实际收入的测算,与税务系统纳税人的申报收入进行比对,通过数据分析以及时准确的发现少报、漏报、隐瞒销售收入的风险纳税人。
附图说明
[0051]图1是本专利技术实施例的风险预测模型建立流程图。
具体实施方式
[0052]需要说明的是,在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。
[0053]下面将参考附图并结合实施例来详细说明本专利技术。
[0054]住宿业纳税人,包括宾馆、酒店、民宿等等类型,本专利技术实施例即是以宾馆作为例举,结合附图对本专利技术详细说明。
[0055]如图1所示是本专利技术实施例的风险预测模型建立流程图,其中:
[0056]步骤一:定期采集互联网上宾馆的房间信息,计算房间最低价格;
[0057]使用爬虫技术,根据宾馆的发布频率,可每月至少采集一次互联网上发布的宾馆信息,包括宾馆、房型、房间价格等信息。在旅游旺季可以适当增加采集频率。为保证模型结果的准本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种住宿业纳税人风险模型分析方法,其特征在于,包括:S1、定期采集互联网上住宿业纳税人发布的房间信息,计算房间最低价格;S2、定期采集公安系统登记的住宿业纳税人的房间入住信息,计算入住天数;S3、将互联网的住宿业纳税人信息、公安系统的住宿业纳税人信息、税务系统的住宿业纳税人税务登记信息进行匹配;S4、计算住宿业纳税人的实际收入,并与申报收入比对,完成住宿业风险纳税人预测模型的建立,预测纳税人风险程度。2.根据权利要求1所述的一种住宿业纳税人风险模型分析方法,其特征在于,步骤S1的具体采集方法为:S101、使用爬虫技术,定期采集互联网上发布的房间信息;S102、采集频率根据旅游淡季和旺季中住宿业纳税人在互联网更新频率进行对应设定;S103、按照房间最低价格进行取样。3.根据权利要求2所述的一种住宿业纳税人风险模型分析方法,其特征在于,步骤S101中,每采集一个住宿业纳税人的信息,休眠一次,根据随机数算法生成50秒以内的随机数作为休眠时长。4.根据权利要求1所述的一种住宿业纳税人风险模型分析方法,其特征在于,步骤S2的具体方法包括:S201、采集公安系统登记的入住信息包括:住宿业纳税人代码、名称、入住房间号、入住时间、退房时间;S202、基于入住信息计算入住天数,计算的规则如下:(1)凌晨4点之前入住当天中午12点计算为1天;(2)凌晨4点之后入住次日中午12点计算为1天;(3)对于多人同一时间段入住同一房间且同一时间段退房按1间房计算;(4)对于多人不同时间入住但同一时间退房的:按最长时间计算;(5)对于多人不同时间入住而且是不同时间退房的:按最早入住人员计算入住开始时间,按最晚退房人员计算退房时间,从上述入住时间、退房时间计算总体入住天数。5.根据权利要求1所述的一种住宿业纳税人风险模型分析方法,其特征在于,步骤S3的具体方法包括:S301、比较名称是否完全一致,名称完全一致的自动匹配;S302、名称不一致的使用相似度算法进行计算,相似度达到阈值的自动匹配;S303、相似度低于阈值的,提供匹配界面由人工匹配。6.一种住宿业纳税人风险模型分析装置,其特征在于,包括:互联网信息采集模块,用于定期采集互联网上住...

【专利技术属性】
技术研发人员:杨为琛伺彦伟刘欢欢高阳王晨光徐爱华张俊霞霍庆生范鑫刘卫强范国华
申请(专利权)人:河北航天信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1