内件品名与寄递地址的关联关系的识别方法和系统技术方案

技术编号:34333098 阅读:20 留言:0更新日期:2022-07-31 02:27
本公开实施例公开了一种内件品名与寄递地址的关联关系的识别方法和系统。其中,所述内件品名与寄递地址的关联关系的识别方法包括:获取英语语境的寄递面单数据;对所述寄递面单数据的英文内件品名和英文寄递地址进行自然语言处理;对自然语言处理得到的数据进行关注词分析;根据关注词分析结果,寄递面单数据以及业务规则库构建识别模型,所述业务规则库对不同类型的英文风险内件品的识别规则进行预设定;通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系。件品名与英文风险寄递地址的关联关系。件品名与英文风险寄递地址的关联关系。

【技术实现步骤摘要】
内件品名与寄递地址的关联关系的识别方法和系统


[0001]本公开涉及人工智能
,尤其涉及一种内件品名与寄递地址的关联关系的识别方法和系统。

技术介绍

[0002]随着我国国际快递物流体系建设不断完善,我国跨境寄递业务量逐年上升,通过跨境寄递产生的安全防控难度也在加大,不法分子利用跨境寄递渠道实施违法犯罪活动高发、多发。
[0003]专利技术人发现,通过在相关场景中对英语语境的寄递面单数据之间的联系进行系统性分析,可以有助于实现风险查询和预警。但这种方式对前期线索情报(即英语语境的寄递面单数据之间的联系)的依赖程度较高,目前,前期线索情报主要通过海关人员在检查入境快递包裹时对寄递面单数据进行初筛获得,但人工初筛效率较低且准确率较低,无法满足在相关场景中对英语语境的寄递面单数据之间的联系进行系统性分析的需求。

技术实现思路

[0004]有鉴于此,本公开实施例提供了一种内件品名与寄递地址的关联关系的识别方法和系统,通过该识别方法能够满足对英语语境的寄递面单数据中的内件品名和寄递地址的关联关系进行系统性分析的需求。
[0005]第一方面,本公开实施例提供了一种内件品名与寄递地址的关联关系的识别方法,采用如下技术方案:所述内件品名与寄递地址的关联关系的识别方法包括:获取英语语境的寄递面单数据;对所述寄递面单数据的英文内件品名和英文寄递地址进行自然语言处理;对自然语言处理得到的数据进行关注词分析;根据关注词分析结果,寄递面单数据以及业务规则库构建识别模型,所述业务规则库对不同类型的英文风险内件品的识别规则进行预设定;通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系。
[0006]可选地,所述通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系包括:向所述识别模型输入一个英文风险内件品名,所述识别模型输出相关的多个英文风险寄递地址及各英文风险寄递地址的出现概率;或,向所述识别模型输入一个英文风险寄递地址,所述识别模型输出相关的多个英文风险内件品名及各英文风险内件品名的出现概率。
[0007]可选地,所述识别模型为Skip

gram模型。
[0008]可选地,所述通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系包括:向所述识别模型输入多个英文风险内件品名,所述识别模型输出相关的一个英文风险寄递地址;或,向所述识别模型输入多个英文风险寄递地址,所述识别模型输出
相关的一个英文风险内件品名。
[0009]可选地,所述识别模型为CBOW模型。
[0010]可选地,通过NLTK方法对所述寄递面单数据的英文内件品名和英文寄递地址进行自然语言处理。
[0011]可选地,所述内件品名与寄递地址的关联关系的识别方法还包括:在所述对自然语言处理得到的数据进行关注词分析之前,建立特征词库,所述特征词库中包括至少一类危险内件品的英文内件品名;所述对自然语言处理得到的数据进行关注词分析包括:从所述特征词库中选择英文内件品名作为关注词,或,自定义词语进行关注词分析;在自定义词语进行关注词分析时,所述内件品名与寄递地址的关联关系的识别方法还包括:将关注词分析结果与所述特征词库中的英文内件品名进行匹配,在匹配失败后,确认所述关注词分析结果是否为危险内件品,在确认为风险内件品后,将所述关注词分析结果更新至所述特征词库中。
[0012]可选地,所述对自然语言处理得到的数据进行关注词分析包括:统计关注词数量,统计关注词密度,搜索单个关注词,统计关注词出现位置的上下文中的相似词,搜索多个关注词的共同上下文,统计关注词出现的频率,统计出现次数高于第一预设值的关注词,统计出现次数低于第二预设值的关注词,多维度选择关注词,以及,图形化展示多个关注词中的一种或多种。
[0013]可选地,所述内件品名与寄递地址的关联关系的识别方法还包括:在所述通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系之后,查找与所述英文风险寄递地址或英文风险内件品名对应的寄递面单,并为所述寄递面单设置风险识别标识。
[0014]第二方面,本公开实施例提供一种内件品名与寄递地址的关联关系的识别系统,采用如下技术方案:所述内件品名与寄递地址的关联关系的识别系统包括:获取模块,用于获取英语语境的寄递面单数据;处理模块,用于对所述寄递面单数据的英文内件品名和英文寄递地址进行自然语言处理;分析模块,用于对自然语言处理得到的数据进行关注词分析;构建模块,用于根据关注词分析结果,寄递面单数据以及业务规则库构建识别模型,所述业务规则库对不同类型的英文风险内件品的识别规则进行预设定;识别模块,用于通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系。
[0015]第三方面,本公开实施例提供一种电子设备,采用如下技术方案:所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行以上任一所述的内件品名与寄递地址的
关联关系的识别方法。
[0016]第四方面,本公开实施例提供一种计算机可读存储介质,采用如下技术方案:该计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行以上任一所述的内件品名与寄递地址的关联关系的识别方法。
[0017]本公开实施例提供的内件品名与寄递地址的关联关系的识别方法和系统,在该识别方法中,通过获取英语语境的寄递面单数据,对寄递面单数据的英文内件品名和英文寄递地址进行自然语言处理,对自然语言处理得到的数据进行关注词分析,并根据关注词分析结果,寄递面单数据以及业务规则库构建识别模型,业务规则库对不同类型的英文风险内件品的识别规则进行预设定,与现有技术中的人工初筛相比,大大提升了获得内件品名和寄递地址的关联关系的效率和准确性,当需要对英语语境的寄递面单数据进行系统性分析时,通过该识别模型,即可获得英文风险内件品名与英文风险寄递地址的关联关系,因此,能够很好地满足对英语语境的寄递面单数据中的内件品名和寄递地址的关联关系进行系统性分析的需求。
[0018]上述说明仅是本公开技术方案的概述,为了能更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为让本公开的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
[0019]为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0020]图1为本公开实施例提供的识别方法的流程图;图2为本公开实施例提供的多个关注词的图形化展示的效果图;图3为本公开实施例提供的one

hot encoding的模型图;图4为本公开实施例提供的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内件品名与寄递地址的关联关系的识别方法,其特征在于,包括:获取英语语境的寄递面单数据;对所述寄递面单数据的英文内件品名和英文寄递地址进行自然语言处理;对自然语言处理得到的数据进行关注词分析;根据关注词分析结果,所述寄递面单数据以及业务规则库构建识别模型,所述业务规则库对不同类型的英文风险内件品的识别规则进行预设定;通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系。2.根据权利要求1所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,所述通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系包括:向所述识别模型输入一个英文风险内件品名,所述识别模型输出相关的多个英文风险寄递地址及各英文风险寄递地址的出现概率;或,向所述识别模型输入一个英文风险寄递地址,所述识别模型输出相关的多个英文风险内件品名及各英文风险内件品名的出现概率。3.根据权利要求2所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,所述识别模型为Skip

gram模型。4.根据权利要求1所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,所述通过所述识别模型,获得英文风险内件品名与英文风险寄递地址的关联关系包括:向所述识别模型输入多个英文风险内件品名,所述识别模型输出相关的一个英文风险寄递地址;或,向所述识别模型输入多个英文风险寄递地址,所述识别模型输出相关的一个英文风险内件品名。5.根据权利要求4所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,所述识别模型为CBOW模型。6.根据权利要求1所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,通过NLTK方法对所述寄递面单数据的英文内件品名和英文寄递地址进行自然语言处理。7.根据权利要求1所述的内件品名与寄递地址的关联关系的识别方法,其特征在于,还包括:在所述对自然语言处理...

【专利技术属性】
技术研发人员:许良锋王丰高黎明杨阳任仰奇张彬杨韬杨睿闻克宇张倾城
申请(专利权)人:国家邮政局邮政业安全中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1