【技术实现步骤摘要】
数据分析方法、装置、设备、介质和产品
[0001]本专利技术实施例涉及大数据领域,尤其涉及一种数据分析方法、装置、设备、介质和产品。
技术介绍
[0002]用户行为风险检测是互联网系统风险控制的重要一环。随着互联网系统用户数量的增长,系统每日为数百万在线用户提供服务,收集的数据规模和复杂性不断增加,使得对用户行为风险评估变得越来越困难,隐藏在大量正常网络流量的恶意行为越难越被发现,如非本人登录操作、高危命令执行、虚假账号、僵尸账号等。现有技术中,通常使用关键字搜索或规则匹配手动检查系统应用日志,再通过人工溯源的方式对其他数据源进行关联分析,这种方法需要人工匹配关键字查询,人工工作量大,且基于人工对操作日志进行筛选排查,有成本高、效率低、准确率低等缺点,而且在用户异常行为分析中,往往单一的检测方法不适用于复杂的场景,在数据更新后也会出现准确率下降现象、缺乏模型迭代,从而造成识别效果下降的现象。机器学习技术被认为是海量恶意行为自动化分析的重要方法,但是现有机器学习模型在部分场景下,存在误报率过高的情况。
技术实现思路
r/>[0003]有本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种数据分析方法,其特征在于,包括:确定在当前时间窗口中接收到的每个触发操作对应的应用场景;其中,所述应用场景包括:按照粗颗粒度进行划分得到的第一应用场景,以及按照细颗粒度进行划分得到的第二应用场景,其中,所述第二应用场景包含在所述第一应用场景之内,并且所述第二应用场景是对所述第一应用场景进行划分得到的场景;将每个所述触发操作对应的待评估数据输入至预先创建的与所述第二应用场景对应的数据分析模型,得到对应的中间态结果;将每个所述中间态结果输入至预先创建的风险评分模型中,得到对应的风险视图。2.根据权利要求1所述的方法,其特征在于,在所述确定在当前时间窗口中接收到的每个触发操作对应的应用场景之后,所述将每个所述触发操作对应的待评估数据输入至预先创建的与所述第二应用场景对应的数据分析模型之前,还包括:获取所述当前时间窗口内的原始数据和上一个时间窗口的风险评分结果;对所述原始数据和所述风险评分结果进行数据预处理,得到目标数据格式的中间数据;对所述中间数据进行特征构建操作,得到对应的待评估数据。3.根据权利要求1所述的方法,其特征在于,在所述将每个所述触发操作对应的待评估数据输入至预先创建的与所述第二应用场景对应的数据分析模型之前,还包括:根据所述应用场景和所述触发操作所对应原始数据的数据特征确定对应的数据分析模型。4.根据权利要求2或3所述的方法,其特征在于,所述原始数据包括下述之一:应用日志数据、用户行为数据、设备指纹、网络环境信息。5.根据权利要求1所述的方法,其特征在于,所述确定在当前时间窗口中接收到的每个触发操作对应的应用场景,包括:确定在当前时间窗口中接收到的每个触发操作对应的第一应用场景;确定每个触发操作在所述第一应用场景中的第二应用场景;其中,所述第二应用场景包含在所述第一应用场景之内。6.根据权利要求1所述的方法,其特征在于,所述将每个所述触发操作对应的待评估数据输入至预先创建的与所述第二应用场景对应的数据分析模型,得到对应的中间态结果,包括:将每个所述触发操作对应的待评估数据输入至预先创建的与所述第二应用场景对应的数据分析模型;通过所述数据分析模型对所述待评估数据进行聚类和筛选,得到对应的中间态结果。7.根据权利要求5或6所述的方法,其特征在于,所述将每个所述中间态结果输入至预先创建的风险评分模型中,得到对应的风险视图,包括:将每个所述第二应用场景所对应数据分析模型输出的中间态结果输入至预先创建的风险评分模型中,得到每个所述数据分析模型对应的风险评分;根据每个所述数据分析模型对应的风险评分、预先确定的异常评分和上一时间窗口的风险评分结果确定当前时间窗口的风险评分结果;根据所述当前时间窗口的风险评分结果得到对应的风险视图。
8.根据权利要求7所述的方法,其特征在于,所述根据每个所述数据分析模型对应的风险评分、预先确定的异常评分和上一时间窗口的风险评分结果确定当前时间窗口的风险评分结果,包括:对所述数据分析模型对应的风险评分、预先确定的异常评分和上一时间窗口的风险评分结果进行加权平均,得到当前时间窗口的风险评分结果。9.根据权利要求1所述的方法,其特征在于,在所述将每个所述中间态结果输入至预先创建的风险评分模型中,得到对应的风险视图之后,还包括:根据所述风险评分模型输出的风险评分结果对所对应的原始数据进行标签处理,得到对应的第一类型标签数据;将所述第一类型标签数据存储至预先创建的用户行为样本库中。10.根据权利要求9所述的方法,其特征在于,所述预先创建的用户行为样本库的创建方式,包括:通过非监督学习模型和规则分析模型自动对原始数据进行标签处理,得到对应的第二类型标签数据;根据所述第二类型标签数据创建对应的用户行为样本库。11.根据权利要求9或10所述的方法,其特征在于,所述方法,还包括:获取所述用户行为样本库中的第...
【专利技术属性】
技术研发人员:袁晟,廖敏飞,吴孟晴,梁伟韬,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。