【技术实现步骤摘要】
行为标记模型训练系统及方法
本专利技术涉及一种信息处理技术,且尤其涉及一种行为标记模型训练方法及系统。
技术介绍
在现今数字化、网络发达的时代,信息安全变成相当重要的议题。特别是,对于企业而言,由于公司内部文件涉及重要的营业秘密,数据的外流会导致公司无法恢复的损害,因此各公司无不积极采用严格的数据控管与防护措施。举例来说,设置存取人员的权限、在公司的内部网络与外部网络间设置防火墙等,以避免数据外流。虽然如此,在员工执行各项业务的时候,必然需要存取机密数据。纵使采取了严谨的安全措施,设定了严格的存取标准,还是难保具有合法存取权限的有心员工窃取数据。因此,如何监控内部员工的异常登入行为为本领域技术人员所致力的课题。
技术实现思路
本专利技术提供一种行为标记模型训练系统及方法,通过训练可靠的标记模型,进而通过标记模型监控内部员工的异常登入。在本专利技术一实施例中,行为标记模型训练系统具有输入单元、储存单元以及处理单元。输入单元接收已标记数据组。已标记数据组具有训练数据组以及验证数据组,且训练数据组的每一笔以及验证数据组的每一笔具有第一标记信息。储存单元储存多个学习模块。处理单元连接于输入单元与储存单元,分别输入训练数据组的每一笔至多个学习模块,以建立多个标记模型。处理单元还依据标记模型分别获取相应验证数据组数据的每一笔的多个第二标记信息,依据相应验证数据组的每一笔对应的第二标记信息,分别产生相应验证数据组的每一笔的行为标记结果。处理单元还由该验证数据组的每一笔相应的行为标记结果以及第一标 ...
【技术保护点】
1.一种行为标记模型训练系统,包括:/n输入单元,接收已标记数据组,其中所述已标记数据组包括训练数据组以及验证数据组,且所述训练数据组的每一笔以及所述验证数据组的每一笔分别包括第一标记信息;/n储存单元,储存多个学习模块;/n处理单元,连接于所述输入单元与所述储存单元,分别输入所述训练数据组的每一笔至多个学习模块,以建立多个标记模型,/n其中所述处理单元还依据所述多个标记模型分别获取相应所述验证数据组数据的每一笔的多个第二标记信息,依据相应所述验证数据组的每一笔对应的所述多个第二标记信息,分别产生相应所述验证数据组的每一笔的行为标记结果,/n其中所述处理单元还由所述验证数据组的每一笔相应的所述行为标记结果以及所述第一标记信息获取标记变动幅度值,并判断所述标记变动幅度值是否大于变动门槛值,且当所述标记变动幅度值大于所述变动门槛值,依据所述多个行为标记结果更新所述验证数据组的每一笔对应的所述第一标记信息,交换所述训练数据组及所述验证数据组,并依据交换后的所述训练数据组重新建立所述多个标记模型。/n
【技术特征摘要】
1.一种行为标记模型训练系统,包括:
输入单元,接收已标记数据组,其中所述已标记数据组包括训练数据组以及验证数据组,且所述训练数据组的每一笔以及所述验证数据组的每一笔分别包括第一标记信息;
储存单元,储存多个学习模块;
处理单元,连接于所述输入单元与所述储存单元,分别输入所述训练数据组的每一笔至多个学习模块,以建立多个标记模型,
其中所述处理单元还依据所述多个标记模型分别获取相应所述验证数据组数据的每一笔的多个第二标记信息,依据相应所述验证数据组的每一笔对应的所述多个第二标记信息,分别产生相应所述验证数据组的每一笔的行为标记结果,
其中所述处理单元还由所述验证数据组的每一笔相应的所述行为标记结果以及所述第一标记信息获取标记变动幅度值,并判断所述标记变动幅度值是否大于变动门槛值,且当所述标记变动幅度值大于所述变动门槛值,依据所述多个行为标记结果更新所述验证数据组的每一笔对应的所述第一标记信息,交换所述训练数据组及所述验证数据组,并依据交换后的所述训练数据组重新建立所述多个标记模型。
2.根据权利要求1所述的行为标记模型训练系统,所述处理单元还于所述标记变动幅度值不大于所述变动门槛值时,储存所述多个标记模型于所述储存单元中。
3.根据权利要求1所述的行为标记模型训练系统,其中所述第二标记信息相应于正常标记与异常标记,且所述处理单元还用以判断所述验证数据组的每一笔对应的所述多个第二标记信息中,属于所述正常标记的数量与所述异常标记的数量,并依据所述正常标记的数量与所述异常标记的数量中较多的产生所述行为标记结果。
4.根据权利要求1所述的行为标记模型训练系统,其中所述处理单元还执行:
获取所述行为标记结果为正常,且所述第一标记信息为正常的第一数量,
获取所述行为标记结果为异常,且所述第一标记信息为异常的第二数量,
依据所述第一数量与所述第二数量的总和与所述验证数据组的数据数量的比值,以获取准确率衡量值,
依据所述第一数量与所述第一标记信息为正常的数量的比值,以获取特异性衡量值,
依据所述第二数量与所述第一标记信息为异常的数量的比值,以获取敏感度衡量值,以及
分别判断所述准确率衡量值、所述特异性衡量值以及所述敏感度衡量值与历史准确率衡量值、历史特异性衡量值以及历史敏感度衡量值的差异值,以获取所述标记变动幅度值。
5.根据权利要求1所述的行为标记模型训练系统,其中所述输入单元还接收历史数据组,其中所述历史数据组包括第一数据组及第二数据组,且所述第一数据组中的每一笔分别包括第三标记信息,
其中所述处理单元还输入所述第一数据组至初始学习模块,以获取初始标记模型,并依据所述初始标记模型标记所述第二数据组,以产生包括所述第一标记信息的所述已标记数据组。
6.根据权利要求5所述的行为标记模型训练系统,其中所述初始标记模型以及所述多个标记模型的每一个分别包括相应多个时间区间的行为特征,
其中所述处理单元还分别依据所述第二数据组的每一笔相应的登入时间以及所述初始标记模型中的所述多个时间区间找出相应的所述行为特征,并依据所述相应的所述行为特征标记所述第二数据组的每一笔,以产生所述已标记数据组,
其中所述处理单元还分别依据所述验证数据组的每一笔相应的登入时间以及标记模型中的所述多个时间区间找出相应的所述行为特征,并依据所述行为特征标记所述验证数据组的每一笔,以获取相应所述验证数据组数据的每一笔的所述多个第二标记信息。
7.根据权利要求1所述的行为标记模型训练系统,其中所述输入单元还接收历史数据组,其中所述历史数据组包括相应于多个使用者的每一个的使用者数据组,
其中所述处理单元还执行:
分别依据所述多个使用者数据组的每一个,判断所述多个使用者的每一个在多个时间区间中分别的使用量异常程度,并依据所述多个第一历史数据组的每一个及所述多个标记模型判断所述多个使用者在所述多个时间区间中分别的异常比率,
依据所述多个使用者的每一个的所述使用量异常程度及所述异常比率,分别判断所述多个使用者在时间区段中的使用量异常程度及异常比率,并获取所述多个使用者的每一个相应的综合异常指标,
依据所述多个使用者的每一个相应的综合异常指...
【专利技术属性】
技术研发人员:李俊贤,许银雄,利建宏,蔡宗宪,黄琼莹,孙明功,张宗铨,
申请(专利权)人:安碁资讯股份有限公司,
类型:发明
国别省市:中国台湾;71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。