基于大数据的缉私案件情报抽取方法技术

技术编号：25087702 阅读：24 留言：0更新日期：2020-07-31 23:31

本发明专利技术公开了基于大数据的缉私案件情报抽取方法，提出了面向大数据的缉私信息抽取模型，并对该模型在真实案件复盘中的具体应用效果进行验证。首先基于缉私案件信息，构建缉私案件的情报要素表达模型；然后通过自然语言处理技术和深度学习算法模型，实现各类缉私情报要素的自动抽取；最后结合单据链、资金链和货物链证据链条，实现大数据环境下智能化的缉私情报抽取效果验证。本发明专利技术通过借鉴要素模型、自然语言处理技术，以缉私案件相关的信息为数据源，构建大数据环境下的缉私情报抽取模型，形成一种缉私案件情报自动抽取的缉私情报服务方法，并开展实验验证分析，实现了情报自动抽取，有效节省了人力物力的投入。

全部详细技术资料下载

【技术实现步骤摘要】
基于大数据的缉私案件情报抽取方法
本专利技术属于基于计算模型的数据处理
，具体涉及一种基于大数据的缉私案件情报抽取方法。
技术介绍
在大数据时代背景下，不法分子在进行走私违法犯罪活动的过程中应用的信息化手段也越来越多，交易的相关信息被存储在各种各样的媒体和介质中，具有数据量大，且被隐蔽于不同领域存储器中的特点。具体的数据来源主要包括海关业务数据、公安内部数据、其他行政管理数据和互联网资源。走私犯罪行为普遍会涉及报关单证、运单、舱单、提单和销售合同等文本信息材料，还有走私犯罪分子的基本人员信息、通话记录、资金来往以及相关的线索信息。面对这种长时间跨度的各种数据类型的案件海量复杂信息，海关缉私警察必须从相关材料中快速高效地抽取出与案件有关的有效情报，以及时整理出案件的资金流、货物流、单证流等证据链条，达到帮助迅速梳理案情助力破案的目的。这其中的每一个环节都对大数据时代海关缉私情报的抽取能力提出了硬性要求，对于传统缉私情报工作而言，情报抽取已经构成瓶颈。基于以上分析，有必要构建面向大数据技术背景下的可适用于多层次、广视角的大量缉私案件数据研究的缉私案件情报抽取方法。
技术实现思路
本专利技术针对海关传统缉私情报工作存在的情报抽取瓶颈问题，提出了面向大数据的缉私信息抽取模型，并对该模型在真实案件复盘中的具体应用效果进行验证。为实现上述目的，本专利技术采用的技术方案为基于大数据的缉私案件情报抽取方法，包含以下步骤：S1：基于缉私案件信息，构建缉私案件的情报要素表达模型；...

【技术保护点】
1.基于大数据的缉私案件情报抽取方法，其特征在于包含以下步骤：/nS1：基于缉私案件信息，构建缉私案件的情报要素表达模型；/nS2：通过自然语言处理技术和深度学习算法模型，实现各类缉私情报要素的自动抽取；/nS3：结合单据链、资金链和货物链证据链条，实现大数据环境下智能化的缉私情报抽取效果验证。/n

【技术特征摘要】
1.基于大数据的缉私案件情报抽取方法，其特征在于包含以下步骤：
S1：基于缉私案件信息，构建缉私案件的情报要素表达模型；
S2：通过自然语言处理技术和深度学习算法模型，实现各类缉私情报要素的自动抽取；
S3：结合单据链、资金链和货物链证据链条，实现大数据环境下智能化的缉私情报抽取效果验证。

2.根据权利要求1所述的基于大数据的缉私案件情报抽取方法，其特征在于步骤S1具体包括以下步骤：
S11：缉私案件的要素表达
基于缉私案件的案件特征和数据来源，构建缉私案件的要素表达模型；
S12：字符向量化
参照上述要素表达模型的组成及其关系，对缉私案事件文本进行情报的要素标注，得到已标注数据集，基于该已标注数据集及未标注的案件文本语料，利用产生词向量的相关模型工具对分好词的文本进行无监督训练学习。

3.根据权利要求2所述的基于大数据的缉私案件情报抽取方法，其特征在于所述产生词向量的相关模型工具为word2vec。

4.根据权利要求1所述的基于大数据的缉私案件情报抽取方法，其特征在于上述步骤S2中所述深度学习算法模型的建模流程具体包括以下步骤：
S21：扩张卷积
将卷积神经网络层应用到序列标注问题，对序列向量进行卷积运算，对输入序列做仿射变换，对于其子序列向量xt的输出，其定义为

(1)式中：r为卷积半径；为向量链接运算，扩张卷积在普通卷积的滤波器上增加了扩张宽度，当有输入序列向量时，扩张卷积会自动跳过扩张宽度中间所有的输入数据，使得有效输入变得更宽，可以获得更多的输入数据，扩张卷积用于序列标注问题时，子序列向量xt的输出定义为

(2)式中：σ为扩张宽度，当σ＝1时，扩张卷积同普通的卷积操作一样，而当σ>1时，扩张宽度使得感受野范围更大，由此带来的空洞问题，通过过滤器的平移可以使之加入到卷积运算之中；
S22：迭代扩张卷积神经网络...

【专利技术属性】
技术研发人员：邱明月，吴育宝，王新猛，
申请(专利权)人：南京森林警察学院，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人