一种用户画像评分方法、装置和存储介质制造方法及图纸

技术编号:25758143 阅读:21 留言:0更新日期:2020-09-25 21:06
本发明专利技术提出了一种用户画像评分方法、装置和存储介质,用以提高用户画像评价的准确性和时效性。用户画像评分方法,包括:获取目标用户的当前行为数据序列,所述当前行为数据序列中包含若干行为数据;基于所述当前行为数据序列,利用预先训练得到的行为分类器集合确定所述目标用户对应的异常评分,所述行为分类器集合包含若干个行为分类器,每一行为分类器为使用所述目标用户历史单类行为数据序列训练得到的;根据所述当前行为数据序列对应的观测状态,查找其对应的第一隐状态;根据所述第一隐状态向第二隐状态的转移概率和所述异常评分确定所述目标用户对应的画像评分。

【技术实现步骤摘要】
一种用户画像评分方法、装置和存储介质
本专利技术涉及人工智能
,尤其涉及一种用户画像评分方法、装置和存储介质。
技术介绍
用户画像是用来刻画用户和联系用户需求与产品设计的一种方式,旨在通过从海量用户行为数据中尽可能全面细致地抽取出一个用户的信息全貌,从而使收集到的数据具有现实意义和价值。随着应用领域的不断扩展,用户画像的概念也正在逐渐发生变化。一般而言,用户画像就是对用户信息的标签化,是将用户的个人信息、社交信息、行为信息等一系列内容进行综合挖掘,实现不同用户分类的一种技术。它的核心是将用户潜在意图和兴趣进行表示和存储,根据用户的基础信息、浏览信息、行为偏好等归纳出可读取、可计算的用户模型。在网络安全领域中,用户画像技术也被用来检测和分析潜在的恶意行为。采用用户画像技术对正常操作建立行为基线,并加以对比分析,可以有效检测用户行为模式的变化,从而在一定程度上降低企业的安全风险。从技术方案来看,基于用户画像的行为建模技术方案整体分为三部分,分别是数据收集、数据预处理和综合分析。首先通过收集多类别的数据,输出统一格式的标准化数据;然后对不同标签的属性类型定义一系列的用户标签,实现对采集数据的预先处理;最后通过一系列属性生成标签值,构成用户的画像标签。在基于画像标签的基础上,可以使用规则或者算法的评分方式来构建相应的模型。使用评分机制来对画像数据进行处理,可以完成对用户的打分。打分分为模板规则法和基于评分算法两种。模板规则法的打分标准由当前管理特权账号的工程人员或平台给出,根据每一种超过基线标准的异常行为的异常得分,可以得到用户画像的异常得分值,上报高危的特权用户以及其高危的行为。传统的基于模板规则法的画像评分机制,首先由当前管理特权账号的工程人员或者平台给出打分标准,然后根据用户拥有的异常访问操作类标签来获得风险评分,最终上报评分排名较高的用户及其高危行为。但是由于模板规则法依赖于人工定义,不能和用户行为动态跟随,会带来异常行为误报、漏报的问题,降低了画像评价的准确性,另一方面,现有的评价方法无法够快速的检测和检查异常人员和异常被利用的账号,影响了画像评价的时效性。
技术实现思路
本专利技术实施例提供一种用户画像评分方法、装置和存储介质,用以提高用户画像评价的准确性和时效性。第一方面,提供一种用户画像评分方法,包括:获取目标用户的当前行为数据序列,所述当前行为数据序列中包含若干行为数据;基于所述当前行为数据序列,利用预先训练得到的行为分类器集合确定所述目标用户对应的异常评分,所述行为分类器集合包含若干个行为分类器,每一行为分类器为使用所述目标用户历史单类行为数据序列训练得到的;根据所述当前行为数据序列对应的观测状态,查找其对应的第一隐状态;根据所述第一隐状态向第二隐状态的转移概率和所述异常评分确定所述目标用户对应的画像评分。在一种实施方式中,使用所述目标用户历史单类行为数据序列按照以下流程训练所述行为分类器集合中的任一行为分类器:将所述目标用户历史单类行为数据序列按照时间顺序,以固定时间间隔划分为若干个行为块,每一行为块中包含所述固定时间间隔内的行为数据;分别利用每一行为块中的行为数据进行训练得到相应的行为分类器。在一种实施方式中,分别利用每一行为块中的行为数据进行训练得到相应的行为分类器,具体包括:分别利用每一行为块中的行为数据,使用单类支持向量机OC-SVM进行训练得到相应的行为分类器。在一种实施方式中,基于所述当前行为数据序列,利用预先训练得到的行为分类器集合确定所述目标用户对应的异常评分,具体包括:将所述当前行为数据序列中包含的每一行为数据,分别输入所述行为分类器集合包含的每一行为分类器;确定每一行为分类器输出的评分均值为所述行为数据对应的异常评分。在一种实施方式中,根据所述第一隐状态向第二隐状态的转移概率和所述异常评分按照以下方法确定所述目标用户对应的画像评分:其中:S表示所述目标用户对应的画像评分;P12表示第一隐状态向第二隐状态的转移概率;m表示当前行为数据序列中包含的行为数据的数量;Si表示当前行为数据序列中包含的第i个行为数据对应的异常评分。第二方面,提供一种用户画像评分装置,包括:获取单元,用于获取目标用户的当前行为数据序列,所述当前行为数据序列中包含若干行为数据;第一确定单元,用于基于所述当前行为数据序列,利用预先训练得到的行为分类器集合确定所述目标用户对应的异常评分,所述行为分类器集合包含若干个行为分类器,每一行为分类器为使用所述目标用户历史单类行为数据序列训练得到的;查找单元,用于根据所述当前行为数据序列对应的观测状态,查找其对应的第一隐状态;第二确定单元,用于根据所述第一隐状态向第二隐状态的转移概率和所述异常评分确定所述目标用户对应的画像评分。在一种实施方式中,本专利技术实施例提供的用户画像评分装置,还包括:训练单元,用于将所述目标用户历史单类行为数据序列按照时间顺序,以固定时间间隔划分为若干个行为块,每一行为块中包含所述固定时间间隔内的行为数据;分别利用每一行为块中的行为数据进行训练得到相应的行为分类器。在一种实施方式中,所述训练单元,具体用于分别利用每一行为块中的行为数据,使用单类支持向量机OC-SVM进行训练得到相应的行为分类器。在一种实施方式中,所述第一确定单元,具体用于将所述当前行为数据序列中包含的每一行为数据,分别输入所述行为分类器集合包含的每一行为分类器;确定每一行为分类器输出的评分均值为所述行为数据对应的异常评分。在一种实施方式中,所述第二确定单元,具体用于按照以下方法确定所述目标用户对应的画像评分:其中:S表示所述目标用户对应的画像评分;P12表示第一隐状态向第二隐状态的转移概率;m表示当前行为数据序列中包含的行为数据的数量;Si表示当前行为数据序列中包含的第i个行为数据对应的异常评分。第三方面,提供一种计算装置,所述计算装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述任一方法所述的步骤。第四方面,提供一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一方法所述的步骤。采用上述技术方案,本专利技术至少具有下列优点:本专利技术所述的用户画像评分方法、装置和存储介质,利用目标用户历史单类行为数据序列训练得到行为分类器集合,随着时间推移学习目标用户行为模式变化,实现行为模式的在线更新,提高了用户画像评价的时效性,另一方面基于历史行为偏离度和单分类模型相结合来判断用户行为的偏离度,作为异常评分,使用用户正常历史行为中的信息,便于当前行为与历史行为比对,提高了用户画像评价的准确性。附图说明图1为根据本专利技术实施方式的行为分类器集合训练流程示意图;本文档来自技高网
...

【技术保护点】
1.一种用户画像评分方法,其特征在于,包括:/n获取目标用户的当前行为数据序列,所述当前行为数据序列中包含若干行为数据;/n基于所述当前行为数据序列,利用预先训练得到的行为分类器集合确定所述目标用户对应的异常评分,所述行为分类器集合包含若干个行为分类器,每一行为分类器为使用所述目标用户历史单类行为数据序列训练得到的;/n根据所述当前行为数据序列对应的观测状态,查找其对应的第一隐状态;/n根据所述第一隐状态向第二隐状态的转移概率和所述异常评分确定所述目标用户对应的画像评分。/n

【技术特征摘要】
1.一种用户画像评分方法,其特征在于,包括:
获取目标用户的当前行为数据序列,所述当前行为数据序列中包含若干行为数据;
基于所述当前行为数据序列,利用预先训练得到的行为分类器集合确定所述目标用户对应的异常评分,所述行为分类器集合包含若干个行为分类器,每一行为分类器为使用所述目标用户历史单类行为数据序列训练得到的;
根据所述当前行为数据序列对应的观测状态,查找其对应的第一隐状态;
根据所述第一隐状态向第二隐状态的转移概率和所述异常评分确定所述目标用户对应的画像评分。


2.根据权利要求1所述的方法,其特征在于,使用所述目标用户历史单类行为数据序列按照以下流程训练所述行为分类器集合中的任一行为分类器:
将所述目标用户历史单类行为数据序列按照时间顺序,以固定时间间隔划分为若干个行为块,每一行为块中包含所述固定时间间隔内的行为数据;
分别利用每一行为块中的行为数据进行训练得到相应的行为分类器。


3.根据权利要求2所述的方法,其特征在于,分别利用每一行为块中的行为数据进行训练得到相应的行为分类器,具体包括:
分别利用每一行为块中的行为数据,使用单类支持向量机OC-SVM进行训练得到相应的行为分类器。


4.根据权利要求3所述的方法,其特征在于,基于所述当前行为数据序列,利用预先训练得到的行为分类器集合确定所述目标用户对应的异常评分,具体包括:
将所述当前行为数据序列中包含的每一行为数据,分别输入所述行为分类器集合包含的每一行为分类器;
确定每一行为分类器输出的评分均值为所述行为数据对应的异常评分。


5.根据权利要求1~4任一权利要求所述的方法,其特征在于,根据所述第一隐状态向第二隐状态的转移概率和所述异常评分按照以下方法确定所述目标用户对应的画像评分:



其中:

【专利技术属性】
技术研发人员:雷璟
申请(专利权)人:中国电子科技集团公司电子科学研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1