【技术实现步骤摘要】
样本数据构建方法、装置、设备和介质
本申请涉及计算机
,尤其涉及机器学习,具体涉及一种样本数据构建方法、装置、设备和介质。
技术介绍
随着人工智能技术的发展,利用机器学习对设备的运行状态进行检测日益普遍。训练样本库的充足性,是机器学习得以有效实施的重要前提。以汽车为例,通过人工智能技术来实现针对汽车的异常检测逐步成为汽车安全研究人员努力尝试的一个方向。然而,由于目前实际公开或实施的汽车安全攻击事件相对较少,也即车辆处于异常运行状态的行为监测数据较少,导致机器学习过程所需的训练样本库存在缺失。训练样本库的缺乏,使得机器学习在汽车运行状态的异常检测中无法发挥应有的价值。
技术实现思路
本申请提供一种样本数据构建方法、装置、设备和介质,以实现快速构建丰富的训练样本数据。根据本申请实施例的一方面,提供了一种样本数据构建方法,包括:对检测对象在目标操作类型下的运行状态进行监测,得到与所述目标操作类型对应的至少两个目标运行行为数据;对所述目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据;其中,所述样本数据用于训练针对所述检测对象的异常检测模型。根据本申请实施例的另一方面,提供了一种样本数据构建装置,包括:运行监测模块,用于对检测对象在目标操作类型下的运行状态进行监测,得到与所述目标操作类型对应的至少两个目标运行行为数据;样本数据确定模块,用于对所述目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据;其中,所 ...
【技术保护点】
1.一种样本数据构建方法,包括:/n对检测对象在目标操作类型下的运行状态进行监测,得到与所述目标操作类型对应的至少两个目标运行行为数据;/n对所述目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据;其中,所述样本数据用于训练针对所述检测对象的异常检测模型。/n
【技术特征摘要】
1.一种样本数据构建方法,包括:
对检测对象在目标操作类型下的运行状态进行监测,得到与所述目标操作类型对应的至少两个目标运行行为数据;
对所述目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据;其中,所述样本数据用于训练针对所述检测对象的异常检测模型。
2.根据权利要求1所述的方法,其中,与所述目标操作类型对应的至少两个目标运行行为数据包括所述检测对象在正常运行状态下的运行行为数据;
所述样本数据包括所述检测对象在异常运行状态下的运行行为数据。
3.根据权利要求1所述的方法,其中,对所述目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据,包括:
对所述目标运行行为数据进行组合排列,得到预设数量的组合行为序列;其中,所述组合行为序列中运行行为数据的位置排列顺序表示运行行为数据在所述组合行为序列中的运行顺序;
按照所述目标操作类型下相邻运行行为数据之间的预设运行顺序,对所述组合行为序列进行样本标记,得到所述样本数据;其中,样本数据包括正样本和负样本。
4.根据权利要求3所述的方法,其中,按照所述目标操作类型下相邻运行行为数据之间的预设运行顺序,对所述组合行为序列进行样本标记,得到所述样本数据,包括:
如果所述组合行为序列中包括的运行行为数据的数量为至少两个,且任意相邻的两个运行行为数据在所述组合行为序列中的运行标识满足以下关系,则将所述组合行为序列标记为正样本:
j=k·n+i%n+1
其中,所述运行标识是按照所述预设运行顺序为运行行为数据预先分配,并且在运行标识分配过程中符合所述预设运行顺序的相邻运行行为数据的运行标识取值具有连续性,j表示所述组合行为序列中相邻的两个运行行为数据中位置在后的运行行为数据的运行标识,i表示所述组合行为序列中相邻的两个运行行为数据中位置在前的运行行为数据的运行标识,n表示所述组合行为序列中包括的运行行为数据总数,i%n表示i对n进行取模运算,k表示所述组合行为序列中的最小运行标识m除以n得到的整数商。
5.根据权利要求4所述的方法,其中,按照所述目标操作类型下相邻运行行为数据之间的预设运行顺序,对所述组合行为序列进行样本标记,得到所述样本数据,还包括:
如果所述组合行为序列中包括的运行行为数据的数量为一个,且该运行行为数据的运行标识为预设标识,则将所述组合行为序列标记为正样本;其中,所述预测标识用于表示所述目标操作类型下处于运行首位的运行行为数据。
6.根据权利要求1所述的方法,其中,所述对检测对象在目标操作类型下的运行状态进行监测,得到与所述目标操作类型对应的至少两个目标运行行为数据,包括:
根据所述目标操作类型,对所述检测对象的运行过程进行切分,并分段监测所述运行状态,得到与所述目标操作类型对应的至少两个目标运行行为数据。
7.根据权利要求1所述的方法,其中,所述检测对象包括车辆,所述目标操作类型包括与车辆运行相关的操作。
8.一种样本数据构建装置,包括:
运行监测模块,用于对检测对象在目标操作类型下的运行状态进行监测,得到与所述目标操作类型...
【专利技术属性】
技术研发人员:王业君,云朋,汪明伟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。