样本数据构建方法、装置、设备和介质制造方法及图纸

技术编号:26690619 阅读:45 留言:0更新日期:2020-12-12 02:41
本申请实施例公开了一种样本数据构建方法、装置、设备和介质,涉及机器学习技术领域。其中,该样本数据构建方法包括:对检测对象在目标操作类型下的运行状态进行监测,得到与目标操作类型对应的至少两个目标运行行为数据;对目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据;其中,样本数据用于训练针对检测对象的异常检测模型。本申请实施例可以实现快速构建丰富的训练样本数据的效果。

【技术实现步骤摘要】
样本数据构建方法、装置、设备和介质
本申请涉及计算机
,尤其涉及机器学习,具体涉及一种样本数据构建方法、装置、设备和介质。
技术介绍
随着人工智能技术的发展,利用机器学习对设备的运行状态进行检测日益普遍。训练样本库的充足性,是机器学习得以有效实施的重要前提。以汽车为例,通过人工智能技术来实现针对汽车的异常检测逐步成为汽车安全研究人员努力尝试的一个方向。然而,由于目前实际公开或实施的汽车安全攻击事件相对较少,也即车辆处于异常运行状态的行为监测数据较少,导致机器学习过程所需的训练样本库存在缺失。训练样本库的缺乏,使得机器学习在汽车运行状态的异常检测中无法发挥应有的价值。
技术实现思路
本申请提供一种样本数据构建方法、装置、设备和介质,以实现快速构建丰富的训练样本数据。根据本申请实施例的一方面,提供了一种样本数据构建方法,包括:对检测对象在目标操作类型下的运行状态进行监测,得到与所述目标操作类型对应的至少两个目标运行行为数据;对所述目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据;其中,所述样本数据用于训练针对所述检测对象的异常检测模型。根据本申请实施例的另一方面,提供了一种样本数据构建装置,包括:运行监测模块,用于对检测对象在目标操作类型下的运行状态进行监测,得到与所述目标操作类型对应的至少两个目标运行行为数据;样本数据确定模块,用于对所述目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据;其中,所述样本数据用于训练针对所述检测对象的异常检测模型。根据本申请实施例的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如本申请实施例任一所述的样本数据构建方法。根据本申请实施例的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使计算机执行如本申请实施例任一所述的样本数据构建方法。根据本申请实施例的技术方案,通过对检测对象的运行状态进行监测,并对监测得到的与目标操作类型对应的目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据,实现了快速构建丰富的训练样本数据的效果。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请实施例公开的一种样本数据构建方法的流程图;图2是根据本申请实施例公开的另一种样本数据构建方法的流程图;图3是根据本申请实施例公开的一种车辆异常检测的流程示意图;图4是根据本申请实施例公开的一种样本数据构建装置的结构示意图;图5是根据本申请实施例公开的一种电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1是根据本申请实施例公开的一种样本数据构建方法的流程图,本申请实施例可以适用于快速构建用于模型训练的样本数据的情况。本申请实施例公开的方法可以由样本数据构建装置执行,该装置可以采用软件和/或硬件实现,并可集成在任意具有计算能力的电子设备上。如图1所示,本申请实施例公开的样本数据构建方法可以包括:S101、对检测对象在目标操作类型下的运行状态进行监测,得到与目标操作类型对应的至少两个目标运行行为数据。其中,检测对象可以是任意的机械设备或者电子设备,目标操作类型与检测对象的运行功能有关,可以是检测对象的运行生命周期中的任意操作类型。示例性的,检测对象可以包括但不限于车辆,目标操作类型可以包括但不限于与车辆运行相关的操作,例如车辆启动、开车门、开空调、刹车制动等,相应的,利用本申请实施例技术方案构建的样本数据可以用于训练针对车辆的异常检测模型,从而准确定位车辆的异常运行行为数据。通过对检测对象的运行状态进行监测,可以监测得到目标操作类型下检测对象的至少两个目标运行行为数据,该至少两个目标运行行为数据用于从检测对象的角度描述目标操作的实现过程。在目标操作类型下,目标运行行为数据的数量可以根据检测对象的实际运行而定,本申请实施例不作具体限定。示例性的,可以通过对检测对象的运行状态进行监测,得到运行日志;然后对运行日志中用于表征运行行为数据的字段进行识别,得到与目标操作类型对应的至少两个目标运行行为数据。此外,还可以通过分析预先设置的用于记录目标操作实现过程的数据结构,得到与目标操作类型对应的至少两个目标运行行为数据。以检测对象为车辆,目标操作类型为开车门为例,检测对象的目标运行行为数据可以包括:1)接收用户端发送的开车门指令,2)解析该开车门指令,3)控制车门开启。可选的,对检测对象在目标操作类型下的运行状态进行监测,得到与目标操作类型对应的至少两个目标运行行为数据,包括:根据目标操作类型,对检测对象的运行过程进行切分,并分段监测运行状态,得到与目标操作类型对应的至少两个目标运行行为数据。也即根据具体的目标操作类型,可以对目标操作的实现过程进行切分,具体可以依据目标操作的实现过程发生时产生的接口函数调用情况进行切分,对于其中不太重要的接口函数可不参与过程切分,然后在每个切分点上设置相应的信息采集输出点,当检测对象的运行状态达到每个切分点时,便输出相应的运行信息,最终将输出的运行信息进行整合,得到与目标操作类型对应的至少两个目标运行行为数据。通过对检测对象的运行过程进行切分,实现了对检测对象的运行过程的细粒度监测,实现了准确、高效地确定检测对象在目标操作类型下的目标运行行为数据的效果。S102、对目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据;其中,样本数据用于训练针对检测对象的异常检测模型。在得到检测对象在目标操作类型下的目标运行行为数据后,可以对目标运行行为数据进行组合排列,具体可以采用全排列技术,得到与监测的多个目标运行行为数据之间运行顺序不一样的组合行为集合。每个组合行为集合中包括至少一个目标运行行为数据。每个组合行为集合中运行行为数据之间的运行顺序可以是对应目标操作类型的一种正常运行状态(即指符合常规执行逻辑的标准运行状态),也可以是一种异常运行状态。无论是对应正常运行状态还是对应异常运行状态,通过对目标运行行为数据进行组合排列后得到的组合行为集合,均作为本申请实施例中的样本数据,后续可以通过样本数据识别与分类标记,从而用于异常检测模型的训本文档来自技高网...

【技术保护点】
1.一种样本数据构建方法,包括:/n对检测对象在目标操作类型下的运行状态进行监测,得到与所述目标操作类型对应的至少两个目标运行行为数据;/n对所述目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据;其中,所述样本数据用于训练针对所述检测对象的异常检测模型。/n

【技术特征摘要】
1.一种样本数据构建方法,包括:
对检测对象在目标操作类型下的运行状态进行监测,得到与所述目标操作类型对应的至少两个目标运行行为数据;
对所述目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据;其中,所述样本数据用于训练针对所述检测对象的异常检测模型。


2.根据权利要求1所述的方法,其中,与所述目标操作类型对应的至少两个目标运行行为数据包括所述检测对象在正常运行状态下的运行行为数据;
所述样本数据包括所述检测对象在异常运行状态下的运行行为数据。


3.根据权利要求1所述的方法,其中,对所述目标运行行为数据进行组合排列,并对组合排列结果进行样本标记得到样本数据,包括:
对所述目标运行行为数据进行组合排列,得到预设数量的组合行为序列;其中,所述组合行为序列中运行行为数据的位置排列顺序表示运行行为数据在所述组合行为序列中的运行顺序;
按照所述目标操作类型下相邻运行行为数据之间的预设运行顺序,对所述组合行为序列进行样本标记,得到所述样本数据;其中,样本数据包括正样本和负样本。


4.根据权利要求3所述的方法,其中,按照所述目标操作类型下相邻运行行为数据之间的预设运行顺序,对所述组合行为序列进行样本标记,得到所述样本数据,包括:
如果所述组合行为序列中包括的运行行为数据的数量为至少两个,且任意相邻的两个运行行为数据在所述组合行为序列中的运行标识满足以下关系,则将所述组合行为序列标记为正样本:
j=k·n+i%n+1
其中,所述运行标识是按照所述预设运行顺序为运行行为数据预先分配,并且在运行标识分配过程中符合所述预设运行顺序的相邻运行行为数据的运行标识取值具有连续性,j表示所述组合行为序列中相邻的两个运行行为数据中位置在后的运行行为数据的运行标识,i表示所述组合行为序列中相邻的两个运行行为数据中位置在前的运行行为数据的运行标识,n表示所述组合行为序列中包括的运行行为数据总数,i%n表示i对n进行取模运算,k表示所述组合行为序列中的最小运行标识m除以n得到的整数商。


5.根据权利要求4所述的方法,其中,按照所述目标操作类型下相邻运行行为数据之间的预设运行顺序,对所述组合行为序列进行样本标记,得到所述样本数据,还包括:
如果所述组合行为序列中包括的运行行为数据的数量为一个,且该运行行为数据的运行标识为预设标识,则将所述组合行为序列标记为正样本;其中,所述预测标识用于表示所述目标操作类型下处于运行首位的运行行为数据。


6.根据权利要求1所述的方法,其中,所述对检测对象在目标操作类型下的运行状态进行监测,得到与所述目标操作类型对应的至少两个目标运行行为数据,包括:
根据所述目标操作类型,对所述检测对象的运行过程进行切分,并分段监测所述运行状态,得到与所述目标操作类型对应的至少两个目标运行行为数据。


7.根据权利要求1所述的方法,其中,所述检测对象包括车辆,所述目标操作类型包括与车辆运行相关的操作。


8.一种样本数据构建装置,包括:
运行监测模块,用于对检测对象在目标操作类型下的运行状态进行监测,得到与所述目标操作类型...

【专利技术属性】
技术研发人员:王业君云朋汪明伟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1