System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及异常操作检测,尤其涉及一种基于apriori算法检测客户异常操作的方法及系统。
技术介绍
1、在金融领域,特别是在银行和其他金融机构中,客户的异常操作可能暗示着潜在的风险或欺诈。这些异常操作可能包括大额转账、非常规的取款行为、异地登录等。检测这些异常操作对于维护金融系统的安全性至关重要。
2、现有技术中,cn112148715a公开了一种基于用户行为规则的数据库安全检测方法及系统。该方法包括:获取用户向数据库提交的正常sql语句;将正常sql语句拆分成用户操作行为向量,用户操作行为向量包括用户名、操作行为和操作对象;以各用户操作行为向量构成的集合为数据集,以最大置信度作为相关性度量标准,采用apriori算法筛选数据集中大于相关度阈值的用户操作行为向量,记为正常操作行为向量,将各正常操作行为向量构成的集合记为用户正常行为库;获取待检测sql语句;将待检测sql语句拆分为待检测用户操作行为向量;将待检测用户操作行为向量与用户正常行为库中的各向量进行匹配,以检测异常行为。
3、综上,现有技术虽然能够通过apriori算法对客户操作进行检测,但对置信度的评估较为简单,未考虑到不同用户的操作习惯差异,因此,需要一种方法弥补现有技术中存在的不足。
技术实现思路
1、本专利技术实施例提供一种基于apriori算法检测客户异常操作的方法及系统,用于基于客户的操作数据分析客户行为的关联性和检测异常操作。
2、本专利技术实施例的第一方面,提供一种基于
3、对于所述频繁项集中的项,通过计算信息增益确定每个项对应的重要性得分,将所述重要性得分与预设的得分阈值比较,去除重要性得分小于所述得分阈值的项,对于保留的项,通过规则生成算法确定对应的子关联规则,组合所述子关联规则得到关联规则;
4、对于每个操作数据,遍历关联规则,确定所述操作数据中是否存在与所述关联规则对应的前项,若不存在,则返回无异常,若存在,则检测所述操作数据中是否不存在与所述前项对应的后项或存在不符合这一关联规则的项,若是,则将所述操作数据标记为异常,并返回存在异常。
5、在一种可选的实施方式中,
6、所述获取操作数据,通过对所述操作数据预处理,基于事务数据库中的项生成位图,基于所述位图,通过位运算构建位图索引,基于所述位图索引,结合预设的综合压缩算法生成候选项集合包括:
7、将所述操作数据中事务数据库的每个事务用位图表示;
8、基于所述位图,为所述操作数据中的每个项分配随机生成的唯一标识符,基于所述唯一标识符构建映射表,遍历所述操作数据,通过所述映射表将每个项对应的标识符转换为位图索引;基于所述位图索引,将所述操作数据中的每个项中连续重复数据进行压缩,生成第一压缩输出,通过对所述第一压缩输出中的非连续数据根据出现频率分配编码,得到综合压缩输出,汇总所述综合压缩输出,得到候选项集合。
9、在一种可选的实施方式中,
10、所述通过构建频繁树确定所述候选项集合中每个项的条件模式基,基于所述位图索引和所述条件模式基,通过遍历所述事务数据库确定条件模式基的支持度,重复迭代,得到频繁项集包括:
11、基于所述候选项集合,确定所述操作数据中的事务数量,根据事务数量初始化频繁树,对于所述频繁树中的项分别构建项头表,结合所述项头表,确定所述事务数据库中每个事务的频繁度,并根据所述频繁度对所述事务进行降序排列;
12、将所述事务数据库中的事务添加至所述频繁树中,对于所述事务中的项,基于所述频繁树的结构进行插入或扩展,并更新对应的项头表,统计所述事务中的频繁项,对于每个频繁项,在所述频繁树中找到以当前频繁项为结尾的路径并去除当前频繁项,得到每个项对应的条件模式基,重复操作得到初始频繁项集,对所述初始频繁项集,检查其子集是否频繁,如果存在子集不是频繁的,则删除这一初始频繁项集;
13、对于保留的初始频繁项集,构建对应的位图,初始化位图计数器,记录包含该初始频繁项集的事务,遍历所述事务数据库,通过位运算检查包含的频繁项集,基于所述位图计数器的数据,确定对应的频繁项集的支持度,重复迭代直至频繁项集的支持度大于预设的支持度阈值,输出对应的频繁项集。
14、在一种可选的实施方式中,
15、所述对于所述频繁项集中的项,通过计算信息增益确定每个项对应的重要性得分,将所述重要性得分与预设的得分阈值比较,去除重要性得分小于所述得分阈值的项包括:
16、确定所述事务数据库中的总事务数,基于所述总事务数计算所述事务数据库对应的数据库信息熵,对于所述频繁项集中的每个项,计算对应的项信息熵,基于所述数据库信息熵和所述项信息熵,计算得到所述信息增益;
17、对所述信息增益进行归一化处理,得到每个项对应的重要性得分,基于所述重要性得分对所述频繁项集中的项进行降序排列,并将所述重要性得分与预设的得分阈值比较,若所述重要性得分小于所述得分阈值,则去除这一重要性得分对应的项。
18、在一种可选的实施方式中,
19、所述基于所述数据库信息熵和所述项信息熵,计算得到所述信息增益如下公式所示:
20、
21、其中,g表示信息增益,c表示事务数据库中类别数量,i表示第i个类,p(classi)表示类别i在数据集中的频率,p(k)表示项在当前类别下的出现概率,k表示事务数据库中的一个类别。
22、在一种可选的实施方式中,
23、所述对于保留的项,通过规则生成算法确定对应的子关联规则,组合所述子关联规则得到关联规则包括:
24、获取经过阈值筛选的频繁项集,对于所述频繁项集中每个保留的项,初始化对应的子关联规则并设置所述子关联规则的最大长度;
25、对于根据重要性得分进行排序的项,选择第一个项作为所述子关联规则的前项,计算所述前项的支持度,对于未被选择的项,计算每个项与前项组合后的第一置信度,选择具有最大的第一置信度值的项作为所述子关联规则的下一项;
26、重复选择,直至所述子关联规则的长度达到预设的最大长度,输出所述子关联规则,对于每个子关联规则,计算每个子关联规则对应的第二置信度,并将所述子关联规则根据所述第二置信度进行降序排列,选择位于前50%的子关联规则,组合得到所述关联规则。
27、在一种可选的实施方式中,
28、所述对于每个操作数据,遍历关联规则,确定所述操作数据中是否存在与所述关联规则对应的前项,若本文档来自技高网...
【技术保护点】
1.基于apriori算法检测客户异常操作的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述获取操作数据,通过对所述操作数据预处理,基于事务数据库中的项生成位图,基于所述位图,通过位运算构建位图索引,基于所述位图索引,结合预设的综合压缩算法生成候选项集合包括:
3.根据权利要求1所述的方法,其特征在于,所述通过构建频繁树确定所述候选项集合中每个项的条件模式基,基于所述位图索引和所述条件模式基,通过遍历所述事务数据库确定条件模式基的支持度,重复迭代,得到频繁项集包括:
4.根据权利要求1所述的方法,其特征在于,所述对于所述频繁项集中的项,通过计算信息增益确定每个项对应的重要性得分,将所述重要性得分与预设的得分阈值比较,去除重要性得分小于所述得分阈值的项包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述数据库信息熵和所述项信息熵,计算得到所述信息增益如下公式所示:
6.根据权利要求1所述的方法,其特征在于,所述对于保留的项,通过规则生成算法确定对应的子关联规则,组合所述子关联规则得到关联规
7.根据权利要求1所述的方法,其特征在于,所述对于每个操作数据,遍历关联规则,确定所述操作数据中是否存在与所述关联规则对应的前项,若不存在,则返回无异常,若存在,则检测所述操作数据中是否不存在与所述前项对应的后项或存在不符合这一关联规则的项,若是,则将所述操作数据标记为异常,并返回存在异常包括:
8.基于apirori算法检测客户异常操作的系统,用于实现前述权利要求1-7中任一项所述的基于apirori算法检测客户异常操作的方法,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1至7中任意一项所述的方法。
...【技术特征摘要】
1.基于apriori算法检测客户异常操作的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述获取操作数据,通过对所述操作数据预处理,基于事务数据库中的项生成位图,基于所述位图,通过位运算构建位图索引,基于所述位图索引,结合预设的综合压缩算法生成候选项集合包括:
3.根据权利要求1所述的方法,其特征在于,所述通过构建频繁树确定所述候选项集合中每个项的条件模式基,基于所述位图索引和所述条件模式基,通过遍历所述事务数据库确定条件模式基的支持度,重复迭代,得到频繁项集包括:
4.根据权利要求1所述的方法,其特征在于,所述对于所述频繁项集中的项,通过计算信息增益确定每个项对应的重要性得分,将所述重要性得分与预设的得分阈值比较,去除重要性得分小于所述得分阈值的项包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述数据库信息熵和所述项信息熵,计算得到所述信息增益如...
【专利技术属性】
技术研发人员:王锟,任纪刚,蔺心臣,
申请(专利权)人:兵器装备集团财务有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。