System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于静态信息的异常进货行为检测方法和系统技术方案_技高网

一种基于静态信息的异常进货行为检测方法和系统技术方案

技术编号:41219102 阅读:2 留言:0更新日期:2024-05-09 23:39
公开了一种基于静态信息的异常进货行为检测方法和系统,包括从烟草机构获取零售户的静态信息;对静态信息进行数据分析、处理,获得基础特征,包括创建特征、缺失值填充和归一化处理;根据历史案件数据对零售户进行标注获取样本数据,对样本数据进行增强,进行文本编码模型训练输出文本特征,将基础特征和文本特征融合后得的特征输入分类器进行模型训练;利用训练后的模型对零售户进行风险等级评估。该检测方法大大降低了现场检查的成本,同时异常识别的准确率也得到了提高。

【技术实现步骤摘要】

本专利技术涉及的应用领域,尤其是一种基于静态信息的异常进货行为检测方法和系统


技术介绍

1、根据中国的烟草专卖的相关规定,只有通过当地烟草专卖批发企业购买的烟草产品才是合法的。这意味着零售商或其他经销商必须从当地烟草专卖批发企业购买烟草产品,而不能直接从其他渠道或来源获得。这项规定的背景是为了监管和控制烟草市场,确保烟草产品的合法销售和管控。通过限制只有授权的专卖批发企业能够提供烟草产品,可以更好地监督和管理烟草销售,控制烟草制品的流通,以减少非法贸易和控制烟草消费。

2、在过去,监管机构普遍做法是通过群众举报和随机抽查来进行管控。然而这种方法往往人工成本高,效率低,容易遗漏。利用机器学习的方法,又由于缺乏零售户动态信息而难以进行。


技术实现思路

1、为了解决现有技术中人工检测的成本高、效率低、容易遗漏、机器学习缺乏零售户动态信息难以进行的技术问题,本专利技术提出了一种基于静态信息的异常进货行为检测方法和系统,用以解决上述技术问题。

2、根据本专利技术的一个方面,提出了一种基于静态信息的异常进货行为检测方法,包括:

3、s1:从烟草机构获取零售户的静态信息;

4、s2:对静态信息进行数据分析、处理,获得基础特征,包括创建特征、缺失值填充和归一化处理;

5、s3:根据历史案件数据对零售户进行标注获取样本数据,对样本数据进行增强,进行文本编码模型训练输出文本特征,将基础特征和文本特征融合后得的特征输入分类器进行模型训练;p>

6、s4:利用训练后的模型对零售户进行风险等级评估。

7、在一些具体的实施例中,静态信息包括许可证号、企业字号名称、经营地址、负责人经营者姓名、联系人电话、联系人姓名、身份证号、工商营业执照编号、工商营业执照有效期、供货单位、制证日期、发证日期、领证送达日期、发证机关、许可范围、经营场地权属、租赁开始期限、租赁截止期限、零售户身份证类型、零售户身份证号码、零售户身份证地址、零售户地址、特殊群体类型、零售业态、地区类别、企业类型组成形式、经营面积、首次制证日期、注册资本、许可证开始期限、许可证截止期限、当前状态、所属单位和专卖管理所。

8、在一些具体的实施例中,s2具体包括对静态信息中的:

9、经营面积通过平均值填充缺失值,并做归一化处理;对企业类型组成形式和零售业态做one-hot编码,获取对应特征;对当前状态进行二值化处理;

10、创建特征same_id,响应于零售户身份证号码与身份证号相同时取1,否则取0;

11、创建特征same_user,响应于负责人经营者姓名与联系人姓名相同时取1,否则取0;

12、创建特征long_term,响应于工商营业执照有效期为长期时取1,否则取0;

13、创建特征juanyan、xuejia、dianzi,响应于经营范围分别对应包括卷烟、雪茄、电子烟时取1,否则取0;

14、创建特征same_address,响应于零售户身份证地址与零售户地址相同时取1,否则取0;

15、创建特征id_card,取值为一个身份证号对应的许可证数量;

16、创建特征user_id_address、user_live_address,该特征值其中,x代表零售户身份证地址或零售户地址,i是指示函数,i和j代表许可证号;

17、创建特征is_local,当零售户身份证地址是在当地时,取值1,否则0;

18、创建特征diff_tel,取值为联系人电话对应的许可证数量;

19、创建新特征tel_count,取值为联系人电话的数量。

20、在一些具体的实施例中,s3中采用random、smote或adasyn的过采样算法对样本数据进行样本增强。

21、在一些具体的实施例中,s3中以bert模型为底座,拼接上均值池化层和全连接层,输出16维向量作为文本特征,文本编码模型训练以异常检测为任务,以二分类为目标进行模型学习。

22、在一些具体的实施例中,s3中分类器的模型训练采用encoder+gbdt算法。

23、在一些具体的实施例中,s4具体包括利用训练好的模型对零售户进行预测,并按照模型预测的得分,对零售户划分风险等级,并对不同的风险等级进行不同监察。

24、在一些具体的实施例中,记录核查并保存风险用户,利用风险用户的样本重复s2-s4对模型进行迭代训练。

25、根据本专利技术的第二方面,一种计算机可读存储介质,其上存储有一或多个计算机程序,该一或多个计算机程序被计算机处理器执行时实施上述方法。

26、根据本专利技术的第二方面,提出了一种基于静态信息的异常进货行为检测系统,系统包括:

27、信息采集单元:配置用于从烟草机构获取零售户的静态信息;

28、数据处理单元:配置用于对静态信息进行数据分析、处理,获得基础特征,包括创建特征、缺失值填充和归一化处理;

29、模型训练单元:配置用于根据历史案件数据对零售户进行标注获取样本数据,对样本数据进行增强,进行文本编码模型训练输出文本特征,将基础特征和文本特征融合后获得的特征输入分类器进行模型训练;

30、评估单元:配置用于利用训练后的模型对零售户进行风险等级评估。

31、本专利技术的一种基于静态信息的异常进货行为检测方法和系统,基于零售户静态信息,给出一种模型冷启动时的解决方案,引入机器学习算法来识别零售户是否存在“未在当地烟草专卖批发企业进货”的异常进货。本专利技术相较于传统的群众举报和随机抽查方法,我们的方法不仅在成本上大大降低,同时在异常识别的准确率上得到了提高。

本文档来自技高网...

【技术保护点】

1.一种基于静态信息的异常进货行为检测方法,其特征在于,包括:

2.根据权利要求1所述的基于静态信息的异常进货行为检测方法,其特征在于,所述静态信息包括许可证号、企业字号名称、经营地址、负责人经营者姓名、联系人电话、联系人姓名、身份证号、工商营业执照编号、工商营业执照有效期、供货单位、制证日期、发证日期、领证送达日期、发证机关、许可范围、经营场地权属、租赁开始期限、租赁截止期限、零售户身份证类型、零售户身份证号码、零售户身份证地址、零售户地址、特殊群体类型、零售业态、地区类别、企业类型组成形式、经营面积、首次制证日期、注册资本、许可证开始期限、许可证截止期限、当前状态、所属单位和专卖管理所。

3.根据权利要求1所述的基于静态信息的异常进货行为检测方法,其特征在于,所述S2具体包括对所述静态信息中的:

4.根据权利要求1所述的基于静态信息的异常进货行为检测方法,其特征在于,所述S3中采用RANDOM、SMOTE或ADASYN的过采样算法对所述样本数据进行样本增强。

5.根据权利要求1所述的基于静态信息的异常进货行为检测方法,其特征在于,所述S3中以bert模型为底座,拼接上均值池化层和全连接层,输出16维向量作为文本特征,所述文本编码模型训练以异常检测为任务,以二分类为目标进行模型学习。

6.根据权利要求5所述的基于静态信息的异常进货行为检测方法,其特征在于,所述S3中所述分类器的模型训练采用encoder+GBDT算法。

7.根据权利要求1所述的基于静态信息的异常进货行为检测方法,其特征在于,所述S4具体包括利用训练好的模型对所述零售户进行预测,并按照模型预测的得分,对所述零售户划分风险等级,并对不同的所述风险等级进行不同监察。

8.根据权利要求5所述的基于静态信息的异常进货行为检测方法,其特征在于,记录核查并保存风险用户,利用所述风险用户的样本重复所述S2-S4对所述模型进行迭代训练。

9.一种计算机可读存储介质,其上存储有一或多个计算机程序,其特征在于,该一或多个计算机程序被计算机处理器执行时实施权利要求1至8中任一项所述的方法。

10.一种基于静态信息的异常进货行为检测系统,其特征在于,所述系统包括:

...

【技术特征摘要】

1.一种基于静态信息的异常进货行为检测方法,其特征在于,包括:

2.根据权利要求1所述的基于静态信息的异常进货行为检测方法,其特征在于,所述静态信息包括许可证号、企业字号名称、经营地址、负责人经营者姓名、联系人电话、联系人姓名、身份证号、工商营业执照编号、工商营业执照有效期、供货单位、制证日期、发证日期、领证送达日期、发证机关、许可范围、经营场地权属、租赁开始期限、租赁截止期限、零售户身份证类型、零售户身份证号码、零售户身份证地址、零售户地址、特殊群体类型、零售业态、地区类别、企业类型组成形式、经营面积、首次制证日期、注册资本、许可证开始期限、许可证截止期限、当前状态、所属单位和专卖管理所。

3.根据权利要求1所述的基于静态信息的异常进货行为检测方法,其特征在于,所述s2具体包括对所述静态信息中的:

4.根据权利要求1所述的基于静态信息的异常进货行为检测方法,其特征在于,所述s3中采用random、smote或adasyn的过采样算法对所述样本数据进行样本增强。

5.根据权利要求1所述的基于静态信息的异常进货行为...

【专利技术属性】
技术研发人员:陈佳谦宋峥晨陈俊兴吴少华吴江煌
申请(专利权)人:厦门美亚亿安信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1