【技术实现步骤摘要】
一种海关报关单据信息风险规则生成方法及系统
[0001]本专利技术涉及数据挖掘
,具体为一种海关报关单据信息风险规则生成方法及系统。
技术介绍
[0002]自我国加入世界贸易组织,海关进口贸易出现大幅增长,根据中国海关的统计,我国2022年进口货物贸易额18.1万亿元,进口规模再次创造历史新高,为海关安全准入货物入境查验带来非常大的挑战。在进口规模体量激增、贸易主体数量增长以及通关时间紧张的影响下,目前海关在货物入境查验上面临人工资源紧张、风险查验效率低、查验压力大的问题,海关需要进一步提高查验效率并推动智能化建设。
[0003]目前关于提高海关风险查验效率的研究主要是从流程简化与管理等角度出发的,无法真正缓解海关大量的入境查验需求。针对该问题,海关方面采用基于专家经验的风险规则辅助查验,解决安全准入场景下货物入境的查验需求,一线业务人员利用风险规则作为查验依据对货物入境的风险性进行判断,提高通关查验效率。此外,基于风险规则的查验方法具有重要的意义,为口岸负责查验的业务人员提供风险研判的基础规则支撑。海关方面提出拟采用关联规则等机器学习方法,基于报关单查验数据进行风险规则的自动挖掘工作。
[0004]风险规则自动挖掘算法可以从报关单查验黑样本中发现潜在风险因素,自动发现挖掘产生共性较强的风险规则,解决专家规则数量少、可扩展性低的问题,降低对专家的依赖程度。目前的海关风险规则挖掘算法难以满足较大规模的报关单查验数据要求,在时间效率、空间效率上仍需改进。
技术实现思路
[0005]本 ...
【技术保护点】
【技术特征摘要】
1.一种海关报关单据信息风险规则生成方法,其特征在于:该方法包括以下步骤:S1、根据时间周期,设置定期生成的间隔周期,输出所述间隔周期;S2、根据动态权值Can
‑
Tree海关风险规则增量挖掘算法和所述间隔周期,生成风险规则;S3、对所述风险规则进行审核,审核所述风险规则的有效性,输出有效风险规则;S4、对所述有效风险规则进行维护与管理。2.根据权利要求1所述的一种海关报关单据信息风险规则生成方法,其特征在于:在步骤S2中,动态权值Can
‑
Tree海关风险规则增量挖掘算法包括:S2
‑
1、根据海关大数据资源池和查验系统获取海关报关单数据,处理所述海关报关单数据,生成Can
‑
Tree;S2
‑
2、根据所述Can
‑
Tree中的数据项,计算所述数据项的计算量预估值;S2
‑
3、计算所述Can
‑
Tree的节点性能,输出负载均衡策略;S2
‑
4、根据所述计算量预估值和所述负载均衡策略,生成并行挖掘方案;S2
‑
5、根据所述并行挖掘方案,生成所述风险规则。3.根据权利要求2所述的一种海关报关单据信息风险规则生成方法,其特征在于:在步骤S2
‑
1中,处理所述海关数据包括:S3
‑
1、对所述海关报关单数据进行去重操作,得到去重海关报关单数据;S3
‑
2、获得所述去重海关报关单数据的数值型数据属性,通过聚类算法进行划分,获得特征区间;S3
‑
3、根据所述特征区间,构建所述数值型数据属性的模糊值,所述模糊值为所述风险规则的部分表示属性;S3
‑
4、将单一的所述数值型数据属性进行组合,生成扩展属性;S3
‑
5、将所述部分表示属性和所述扩展属性作为所述海关报关单数据的数据属性;S3
‑
6、对所述数据属性进行权值分配,建立对应所述数据属性的权值网络;S3
‑
7、根据所述权值网络,排序所述数据属性,获得所述数据属性的重要性排序;S3
‑
8、根据所述重要性排序,计算动态支持度,生成数据项动态支持度;S3
‑
9、将所述数据项动态支持度进行逆序排序,得到数据项动态风险权值排序顺序。4.根据权利要求3所述的一种海关报关单据信息风险规则生成方法,其特征在于:在步骤S2
‑
2中,计算所述数据项的计算量预估值包括:S4
‑
1、根据所述数据项动态风险权值排序顺序,生成全量频繁1
‑
项集F1
‑
list;S4
‑
2、获取数据项i在所述路径F1
‑
list中的顺序L
di
,获取所述全量频繁1
‑
项集F1
‑
list的总长度L
d
,计算深度计算量预估值C
di
:S4
‑
3、获取所述数据项i在所述Can
‑
Tree中所处的分支数E
bi
,获取所述数据项i在所述Can
‑
Tree中所处的总分支数E
b
,获得计算量预估值C
i
:λ为所述分支数E
bi
的权重因子,μ为所述总分支数E
b
的权重因子。5.根据权利要求4所述的一种海关报关单据信息风险规则生成方法,其特征在于:在步骤S2
‑
3中,输出负载均衡策略包括:
S5
‑
1、获取集群的节点数量N,服务器处理器的核心数A1,所述服务器处理器的线程数A2,所述服务器处理器的主频A3,内存规则B,硬盘规格C,带宽大小D,计算服务器P
i
的静态性能:其中a1为所述核心数A1的权重因子,a2为所述线程数A2的权重因子,a3为所述主频A3的权重因子,且a1+a2+a3=1,α为所述服务器处理器的权重因子,β为所述内存规则B的权重因子,ω为所述硬盘规格C的权重因子、ψ...
【专利技术属性】
技术研发人员:廖梦洁,张健,韩定,李博,于志文,宋罗娜,
申请(专利权)人:北京信息科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。