业务操作的风险检测方法和装置制造方法及图纸

技术编号:14874498 阅读:40 留言:0更新日期:2017-03-23 22:09
本发明专利技术提出一种业务操作的风险检测方法和装置,该业务操作的风险检测方法包括获取待检测的业务操作的初始特征;根据预先获取的映射函数,对所述初始特征进行映射,获取映射后的特征,其中,所述映射后的特征的个数小于所述初始特征的个数,且,所述映射后的特征与所述初始特征具有局部流形保持特性;根据所述映射后的特征判断所述业务操作是否存在风险。该方法能够实现业务操作风险检测,并且在小样本问题下依然保持有效。

【技术实现步骤摘要】

本专利技术涉及互联网安全
,尤其涉及一种业务操作的风险检测方法和装置
技术介绍
目前,业务操作的风险检测方法通常有两类,一类是基于规则策略,即设置安全的业务操作应该满足的规则,将不符合规则的业务操作判断为存在风险的业务操作。但是,这种方式需要根据业务和场景变化进行调整,智能化程度较低。另一类是采用二类智能判别方法,该方法可以建立二类模型,根据模型将业务操作划分为正常业务操作和危险业务操作。以业务操作是互联网交易为例,互联网交易中,相比于海量的正常交易,危险交易在量级上极小且形态各异,也即存在小样本问题:白样本海量而黑样本稀缺。在小样本场景下,为了解决样本不均衡的问题,在建模时需要采用大类(正常交易)欠采样,或者小类(危险交易)过采样,但是,这种方式会导致数据过学习等问题,检测方式可能失效。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种业务操作的风险检测方法,该方法可以实现业务操作的风险检测,并且在小样本问题下依然保持有效。本专利技术的另一个目的在于提出一种业务操作的风险检测装置。为达到上述目的,本专利技术第一方面实施例提出的业务操作的风险检测方法,包括:获取待检测的业务操作的初始特征;根据预先获取的映射函数,对所述初始特征进行映射,获取映射后的特征,其中,所述映射后的特征的个数小于所述初始特征的个数,且,所述映射后的特征与所述初始特征具有局部流形保持特性;根据所述映射后的特征判断所述业务操作是否存在风险。本专利技术第一方面实施例提出的业务操作的风险检测方法,通过对初始特征进行降维处理,且降维后的特征与初始特征具有局部流形保持特性,可以最大化的不丢失原始数据业务操作,并且可以选择少量数据进行运算,实现业务操作风险检测,并且不需要根据不同类别的样本进行建模,不需要考虑数据不均衡问题,在小样本问题下依然适用。为达到上述目的,本专利技术第二方面实施例提出的业务操作的风险检测装置,包括:第一获取模块,用于获取待检测的业务操作的初始特征;映射模块,用于根据预先获取的映射函数,对所述初始特征进行映射,获取映射后的特征,其中,所述映射后的特征的个数小于所述初始特征的个数,且,所述映射后的特征与所述初始特征具有局部流形保持特性;判断模块,用于根据所述映射后的特征判断所述业务操作是否存在风险。本专利技术第二方面实施例提出的业务操作的风险检测装置,通过对初始特征进行降维处理,且降维后的特征与初始特征具有局部流形保持特性,可以最大化的不丢失原始数据业务操作,并且可以选择少量数据进行运算,实现业务操作风险检测,并且不需要根据不同类别的样本进行建模,不需要考虑数据不均衡问题,在小样本问题下依然适用。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术一实施例提出的业务操作的风险检测方法的流程示意图;图2是本专利技术实施例中多种维度的特征的示意图;图3是本专利技术实施例中基于局部流形保持的交易采样点的示意图;图4是本专利技术另一实施例提出的业务操作的风险检测方法的流程示意图;图5是本专利技术另一实施例提出的业务操作的风险检测方法的流程示意图;图6是本专利技术实施例中采用F分布统计量检测风险的示意图;图7是本专利技术另一实施例提出的业务操作的风险检测方法的流程示意图;图8是本专利技术另一实施例提出的业务操作的风险检测装置的结构示意图;图9是本专利技术另一实施例提出的业务操作的风险检测装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本专利技术一实施例提出的业务操作的风险检测方法的流程示意图,该方法包括:S11:获取待检测的业务操作的初始特征。本专利技术实施例中,将以业务操作具体为交易进行说明。例如,数据库中记录交易的标识信息与交易的特征之间的对应关系,通过该对应关系以及待检测的交易的标识信息,可以获取相应的初始特征。S12:根据预先获取的映射函数,对所述初始特征进行映射,获取映射后的特征,其中,所述映射后的特征的个数小于所述初始特征的个数,且,所述映射后的特征与所述初始特征具有局部流形保持特性。在互联网交易场景下,每个交易的初始特征是具有多个维度的特征。参见图2,特征可以分为客户主体、行为、交易、时间频次等多个维度。两个维度之间都可以笛卡尔积叠加而成,因此会引发海量的特征集,特别是时间维度的引入,每个交易样本所带有的特征可能达到上万种。现有技术中,需要在海量的特征中进行选择,从而根据选择后的特征建模。现有技术中通常是采用人工方式选择特征,也即建模研究人员和工程师对业务的理解对最终的模型性能起到了决定性的作用。因此,极大地影响业务快速扩展,模型体系变得越来越重。虽然初始特征具有海量维度,但是,这些海量的初始特征往往只受少数内置的约束变量所控制,高维数据虽外在表现为高维,但内在存在着线性或非线性相关关系。也即真正驱动过程数据的自由隐变量数往往大幅小于原始变量数,即其内在核心结构往往是低维的。变量之间的这种相关性可认为其在几何上表现为数据点散布在低维光滑流形上或者附近。也就是说,一些高维数据虽外在表现为高维,但内在本质上可以映射到低维数据,且高维数据和相应的低维数据具有局部流形保持特性。局部流形保持特性的具体含义可以参见各种已有流形学习算法,大概含义是指:局部特征点在高维和低维上具有相同的空间特性,局部特征点是指在所有的采样点中选择的目标点,相同的空间特性例如两个目标点在高维空间的欧式距离与其在低维空间上的欧式距离相同。例如,目标点分别是A、B、C,如果满足局部保持特性,那么,在高维空间上,A、B、C这三个点两两之间的空间距离,与映射后,在低维空间上,这三个点两两之间的空间距离是相同的,而这三个目标点与其他采样点或其他采样点之间在映射前后的距离关系可以改变。可以理解的是,相同可以是指完全一致或者在预设误差范围内的相同。为此,本实施例中,采用映射函数的方式,实现初始特征的降维,一方面可以实现特征个数的减少,另一方面,通过局部流形保持特性,可以使得高维中两点之间(具有相似购买习惯的群体、相似年龄、收入层和社交圈的一类个体)的距离能够在降维后依旧保持(那些相似特征个体在经过维度降解后也应聚集在同处或者相近处),实现数据特征的最大化保持。在局部流形保持时,将一个交易的采样点作为目标点,该目标点所在的邻接域内的采样点之间的空间距离结构,在高维空间与低维空间具有一致性。例如,参见图3,便于可视化且不失一般性,假设原始空间的特征集为3维空间(实际交易风险特征维度为超高维),各圆圈点表示交易采样点。假设图3(1)中的采样点Xi为目标点,该采样点的邻接域内的采样点包括另外三个采样点,且参见图3(2)另外三个采样点与目标点之间的距离分别为R1i本文档来自技高网...
业务操作的风险检测方法和装置

【技术保护点】
一种业务操作的风险检测方法,其特征在于,包括:获取待检测的业务操作的初始特征;根据预先获取的映射函数,对所述初始特征进行映射,获取映射后的特征,其中,所述映射后的特征的个数小于所述初始特征的个数,且,所述映射后的特征与所述初始特征具有局部流形保持特性;根据所述映射后的特征判断所述业务操作是否存在风险。

【技术特征摘要】
1.一种业务操作的风险检测方法,其特征在于,包括:获取待检测的业务操作的初始特征;根据预先获取的映射函数,对所述初始特征进行映射,获取映射后的特征,其中,所述映射后的特征的个数小于所述初始特征的个数,且,所述映射后的特征与所述初始特征具有局部流形保持特性;根据所述映射后的特征判断所述业务操作是否存在风险。2.根据权利要求1所述的方法,其特征在于,所述根据所述映射后的特征判断所述业务操作是否存在风险,包括:对所述映射后的特征进行统计运算,得到统计量;根据所述统计量与预设的阈值,判断所述业务操作是否存在风险。3.根据权利要求2所述的方法,其特征在于,所述统计量是F分布统计量,所述根据所述统计量与预设的阈值,判断所述业务操作是否存在风险,包括:当所述F分布统计量大于所述阈值时,判断出所述业务操作存在风险。4.根据权利要求1-3任一项所述的方法,其特征在于,还包括:获取映射函数,所述获取映射函数,包括:收集历史业务操作的初始特征,并根据所述初始特征确定第一业务操作采样点,所述第一业务操作采样点是历史业务操作在初始特征所在的高维空间内的业务操作采样点;确定邻接域;确定同一个邻接域内的第一业务操作采样点,根据待求解的映射函数和第一业务操作采样点确定第二业务操作采样点,所述第二业务操作采样点是第一业务操作采样点映射到低维空间内的业务操作采样点,以及,确定目标函数,所述目标函数使得第二业务操作采样点之间的空间距离关系与所述第一业务操作采样点之间的空间距离关系相同;求解所述目标函数,得到映射函数。5.根据权利要求1-3任一项所述的方法,其特征在于,还包括:当判断结果是不存在风险时,对所述业务操作进行放行处理;或者,当判断结果是存在风险时,对所述业务操作进行异常处理。6.一种业务操作...

【专利技术属性】
技术研发人员:祝志博杨志雄张英
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1