一种自训练方法、系统、装置、电子设备及存储介质制造方法及图纸

技术编号:26846480 阅读:24 留言:0更新日期:2020-12-25 13:09
本申请实施例提供了一种自训练方法、系统、装置、电子设备及存储介质,涉及人工智能技术领域,包括:获得数据采集设备采集的多媒体数据,并获得第一对象检测模型对各个多媒体数据中对象进行检测得到的属性信息;基于所获得的每一多媒体数据中对象的属性信息,从各个多媒体数据中选择包含具有目标属性的对象的数据,作为第一样本数据,其中,目标属性为:第一对象检测模型对多媒体数据中对象进行检测时,检测结果的准确度满足预设的自训练条件的多媒体数据中对象所具有的属性;利用第一样本数据对第一对象检测模型进行训练,得到第二对象检测模型。应用本申请实施例提供的方案,可以提高对象检测模型进行对象检测的准确度。

【技术实现步骤摘要】
一种自训练方法、系统、装置、电子设备及存储介质
本申请涉及人工智能
,特别是涉及一种自训练方法、系统、装置、电子设备及存储介质。
技术介绍
随着人工智能技术的快速发展,对象检测模型的应用越来越广泛,其中,上述对象检测模型用于针对图像、音频等中的对象进行检测。现有技术中,在获得对象检测模型时,通常需要搜集大量样本数据,利用所搜集的样本数据对初始模型进行训练,从而得到训练后的对象检测模型。为得到能够兼顾各种应用场景的对象检测模型,在搜集样本数据时,一般会从多个场景中分别搜集包含不同属性的对象的多种样本数据。然而在实际应用场景中,对象检测模型的输入数据主要集中在包含某些属性的对象的数据中。例如,上述对象为车辆时,对象的属性包括货车、卡车、商务车、轿车等,在对车辆检测模型进行训练时,所搜集的样本数据可以是货车图像、卡车图像、商务车图像、轿车图像等,若训练得到的车辆检测模型应用在城市交通道路场景中,则上述车辆检测模型的输入数据主要为商务车图像、轿车图像。由于训练上述对象检测模型时,所采用的样本数据为包含不同属性的对象的多种数据,对于包含特定属性的对象的数据而言,针对性相对较弱。而实际应用场景中对象检测模型的输入数据一般为包含特定属性的对象的数据,所以,应用上述对象检测模型进行对象检测时,得到的检测结果准确度较低。
技术实现思路
本申请实施例的目的在于提供一种自训练方法、系统、装置、电子设备及存储介质,以提高对象检测模型进行对象检测的准确度。具体技术方案如下:第一方面,本申请实施例提供了一种自训练方法,所述方法包括:获得数据采集设备采集的多媒体数据,并获得第一对象检测模型对各个多媒体数据中对象进行检测得到的属性信息,其中,所述第一对象检测模型为:所述数据采集设备当前使用的模型;基于所获得的每一多媒体数据中对象的属性信息,从各个多媒体数据中选择包含具有目标属性的对象的数据,作为第一样本数据,其中,所述目标属性为:所述第一对象检测模型对多媒体数据中对象进行检测时,检测结果的准确度满足预设的自训练条件的多媒体数据中对象所具有的属性;利用所述第一样本数据对所述第一对象检测模型进行训练,得到第二对象检测模型。本申请的一个实施例中,所述方法还包括:基于测试数据,测试所述第二对象检测模型进行对象检测的准确度,得到测试结果,其中,所述测试数据包括已有测试数据和/或新测试数据,所述已有测试数据为:已使用过的、用于测试所述第一对象检测模型进行对象检测的准确度的数据,所述新测试数据为:未使用过的测试数据;根据所述测试结果,确定是否将所述数据采集设备中的所述第一对象检测模型更新为所述第二对象检测模型。本申请的一个实施例中,所述新测试数据包括以下数据中的至少一种:用户通过客户端输入的带有标注信息的数据;由用户对候选数据进行标注得到的数据,其中,所述候选数据为:从所述数据采集设备采集的多媒体数据中抽取的数据。本申请的一个实施例中,所述基于测试数据,测试所述第二对象检测模型进行对象检测的准确度,得到测试结果,包括:将测试数据输入所述第一对象检测模型进行对象检测,得到第一输出结果,并将所述测试数据输入所述第二对象检测模型进行对象检测,得到第二输出结果;计算所述第一输出结果相对标注信息的第一差异值,并计算所述第二输出结果相对所述标注信息的第二差异值,其中,所述标注信息为:预先对所述测试数据进行标注的信息;基于所述第一差异值与第二差异值,判断所述第二对象检测模型进行对象检测的准确度是否高于所述第一对象检测模型进行对象检测的准确度,得到判断结果,作为测试结果。本申请的一个实施例中,所述方法还包括:在确定将所述数据采集设备中的所述第一对象检测模型更新为所述第二对象检测模型的情况下,按照预设的量化方式对所述第二对象检测模型进行量化;利用预设的校验数据,校验量化后第二对象检测模型相对量化前第二对象检测模型的一致性;在检验结果表征量化后第二对象检测模型相对量化前第二对象检测模型一致的情况下,将量化后的第二对象检测模型的格式转化为所述数据采集设备支持的格式,并将所述数据采集设备中的所述第一对象检测模型更新为格式转化后的第二对象检测模型。本申请的一个实施例中,所述方法还包括:在确定将所述数据采集设备中的所述第一对象检测模型更新为所述第二对象检测模型的情况下,将同类数据采集设备中的所述第一对象检测模型更新为所述第二对象检测模型,其中,所述同类数据采集设备为:使用所述第一对象检测模型的数据采集设备。本申请的一个实施例中,所述利用所述第一样本数据对所述第一对象检测模型进行训练,得到第二对象检测模型,包括:利用所述第一样本数据和第二样本数据,对所述第一对象检测模型进行训练,得到第二对象检测模型,其中,所述第二样本数据为:用户通过客户端输入的多媒体数据。本申请的一个实施例中,通过以下方式获得所述目标属性:获得候选属性的出现频次,其中,所述候选属性为:所述第一对象检测模型对各多媒体数据进行对象检测的结果中置信度低于预设置信度阈值的对象的属性信息;确定出现频次达到预设的频次条件的候选属性,作为目标属性。第二方面,本申请实施例提供了一种自训练系统,所述系统包括自训练服务器和数据采集设备,其中:所述数据采集设备,用于采集多媒体数据,基于第一对象检测模型检测各个多媒体数据中对象的属性信息,并向所述服务器发送所采集的多媒体数据及各个多媒体数据中对象的属性信息,其中,所述第一对象检测模型为:所述数据采集设备当前使用的模型;所述服务器,用于接收所述数据采集设备发送的多媒体数据及各个多媒体数据中对象的属性信息,基于所获得的每一多媒体数据中对象的属性信息,从各个多媒体数据中选择包含具有目标属性的对象的数据,作为第一样本数据,利用所述第一样本数据对所述第一对象检测模型进行训练,得到第二对象检测模型,其中,所述目标属性为:所述第一对象检测模型对多媒体数据中对象进行检测时,检测结果的准确度满足预设的自训练条件的多媒体数据中对象所具有的属性。第三方面,本申请实施例提供了一种自训练装置,所述装置包括:数据获得模块,用于获得数据采集设备采集的多媒体数据,并获得第一对象检测模型对各个多媒体数据中对象进行检测得到的属性信息,其中,所述第一对象检测模型为:所述数据采集设备当前使用的模型;数据选择模块,用于基于所获得的每一多媒体数据中对象的属性信息,从各个多媒体数据中选择包含具有目标属性的对象的数据,作为第一样本数据,其中,所述目标属性为:所述第一对象检测模型对多媒体数据中对象进行检测时,检测结果的准确度满足预设的自训练条件的多媒体数据中对象所具有的属性;模型训练模块,用于利用所述第一样本数据对所述第一对象检测模型进行训练,得到第二对象检测模型。本申请的一个实施例中,所述装置还包括:准确度测试模块,用于基于测试数据,测试所述第二对象检测模型进本文档来自技高网...

【技术保护点】
1.一种自训练方法,其特征在于,所述方法包括:/n获得数据采集设备采集的多媒体数据,并获得第一对象检测模型对各个多媒体数据中对象进行检测得到的属性信息,其中,所述第一对象检测模型为:所述数据采集设备当前使用的模型;/n基于所获得的每一多媒体数据中对象的属性信息,从各个多媒体数据中选择包含具有目标属性的对象的数据,作为第一样本数据,其中,所述目标属性为:所述第一对象检测模型对多媒体数据中对象进行检测时,检测结果的准确度满足预设的自训练条件的多媒体数据中对象所具有的属性;/n利用所述第一样本数据对所述第一对象检测模型进行训练,得到第二对象检测模型。/n

【技术特征摘要】
1.一种自训练方法,其特征在于,所述方法包括:
获得数据采集设备采集的多媒体数据,并获得第一对象检测模型对各个多媒体数据中对象进行检测得到的属性信息,其中,所述第一对象检测模型为:所述数据采集设备当前使用的模型;
基于所获得的每一多媒体数据中对象的属性信息,从各个多媒体数据中选择包含具有目标属性的对象的数据,作为第一样本数据,其中,所述目标属性为:所述第一对象检测模型对多媒体数据中对象进行检测时,检测结果的准确度满足预设的自训练条件的多媒体数据中对象所具有的属性;
利用所述第一样本数据对所述第一对象检测模型进行训练,得到第二对象检测模型。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
基于测试数据,测试所述第二对象检测模型进行对象检测的准确度,得到测试结果,其中,所述测试数据包括已有测试数据和/或新测试数据,所述已有测试数据为:已使用过的、用于测试所述第一对象检测模型进行对象检测的准确度的数据,所述新测试数据为:未使用过的测试数据;
根据所述测试结果,确定是否将所述数据采集设备中的所述第一对象检测模型更新为所述第二对象检测模型。


3.根据权利要求2所述的方法,其特征在于,所述新测试数据包括以下数据中的至少一种:
用户通过客户端输入的带有标注信息的数据;
由用户对候选数据进行标注得到的数据,其中,所述候选数据为:从所述数据采集设备采集的多媒体数据中抽取的数据。


4.根据权利要求2所述的方法,其特征在于,所述基于测试数据,测试所述第二对象检测模型进行对象检测的准确度,得到测试结果,包括:
将测试数据输入所述第一对象检测模型进行对象检测,得到第一输出结果,并将所述测试数据输入所述第二对象检测模型进行对象检测,得到第二输出结果;
计算所述第一输出结果相对标注信息的第一差异值,并计算所述第二输出结果相对所述标注信息的第二差异值,其中,所述标注信息为:预先对所述测试数据进行标注的信息;
基于所述第一差异值与第二差异值,判断所述第二对象检测模型进行对象检测的准确度是否高于所述第一对象检测模型进行对象检测的准确度,得到判断结果,作为测试结果。


5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在确定将所述数据采集设备中的所述第一对象检测模型更新为所述第二对象检测模型的情况下,按照预设的量化方式对所述第二对象检测模型进行量化;
利用预设的校验数据,校验量化后第二对象检测模型相对量化前第二对象检测模型的一致性;
在检验结果表征量化后第二对象检测模型相对量化前第二对象检测模型一致的情况下,将量化后的第二对象检测模型的格式转化为所述数据采集设备支持的格式,并将所述数据采集设备中的所述第一对象检测模型更新为格式转化后的第二对象检测模型。


6.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在确定将所述数据采集设备中的所述第一对象检测模型更新为所述第二对象检测模型的情况下,将同类数据采集设备中的所述第一对象检测模型更新为所述第二对象检测模型,其中,所述同类数据采集设备为:使用所述第一对象检测模型的数据采集设备。


7.根据权利要求1-6中任一项所述的方法,其特征在于,所述利用所述第一样本数据对所述第一对象检测模型进行训练,得到第二对象检测模型,包括:
利用所述第一样本数据和第二样本数据,对所述第一对象检测模型进行训练,得到第二对象检测模型,其中,所述第二样本数据为:用户通过客户端输入的多媒体数据。


8.根据权利要求1-6中任一项所述的方法,其特征在于,通过以下方式获得所述目标属性:
获得候选属性的出现频次,其中,所述候选属性为:所述第一对象检测模型对各多媒体数据进行对象检测的结果中置信度低于预设置信度阈值的对象的属性信息;
确定出现频次达到预设的频次条件的候选属性,作为目标属性。


9.一种自训练系统,其特征在于,所述系统包括自训练服务器和数据采集设备,其中:
所述数据采集设备,用于采集多媒体数据,基于第一对象检测模型检测各个多媒体数据中对象的属性信息,并向所述服务器发送所采集的多媒体数据及各个多媒体数据中对象的属性信息,其中,所述第一对象检测模型为:所述数据采集设备当前使用的模型;
所述服务器,用于接收所述数据采集设备发送的多媒体数据及各个多媒体数据中对象的属性信息...

【专利技术属性】
技术研发人员:董茂飞
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1