一种数据模型的训练方法及装置制造方法及图纸

技术编号:24995943 阅读:20 留言:0更新日期:2020-07-24 17:58
本申请公开了一种数据模型的训练方法,该方法包括,在网络侧,统计来自各用户侧网络设备上报的差异信息,该差异信息为用户侧网络设备部署的第一数据模型输出结果与期望结果的差异,将统计的差异信息作为训练依据,调整第一数据模型的模型参数,将调整后的模型参数分发至各用户侧网络设备,使得用户侧网络设备部署的第一数据模型按照分发的模型参数更新。解决了训练数据模型所需训练数据的隐私问题,有效地保护了私有数据,并丰富了训练数据的来源;通过差异信息的收集可实现定期对数据模型的训练,更新数据模型的模型参数,使得数据模型的训练更有效、更准确。

【技术实现步骤摘要】
一种数据模型的训练方法及装置
本专利技术涉及计算机数据挖掘领域,特别地,涉及一种数据模型的训练方法及装置。
技术介绍
通过人工智能、机器学习、统计学和数据库的交叉方法以发现数据内在关系、潜在信息和价值的数据挖掘是计算机应用之一,其本质是在相对较大型的数据集中发现模式的计算过程。数据挖掘过程中用于训练数据挖掘模型的数据被称为训练数据。训练数据选择一般有以下要求:数据样本尽可能大、数据多样化,数据样本质量较高。目前数据模型的训练按照训练数据来源方式大致有两类:第一类:利用来源于各开发团队搜集到的数据作为训练数据来训练数据模型。这种方法的效果取决于开发团队搜集到的样本数据来源,由于数据可能与用户实际应用场景有差别,训练后数据模型识别率低,对不同场景的识别效果适应性差。且训练一旦结束之后,除非搜集到新的一批数据,通常不会对训练结果进行更新。例如,用于图像识别的卷积神经网络(CNN)模型,目前采取的CNN识别训练算法,其数据来源为各开发团队搜集到的数据,基于对收集的图片进行标的,再进行训练,训练完成之后进行部署。而在部署之后,如果没有收集到大量的新数据,通常不会对训练结果进行更新,用户则一直沿用原始部署的模型来进行图像的识别。第二类:是利用公有云所存储的数据作为训练数据来训练数据模型。由于这些公有云上存储了用户大量的数据,数据具有多样性,且用户会不断地更新和增加,可以不断进行训练以得到训练结果的改进。但这种方式用户数据的隐私性无法完全保证,并且用户也可能不会将部分数据上传,某些特殊样式的数据有可能无法统计。
技术实现思路
本专利技术提供了一种数据模型的训练方法,以提高数据模型训练结果的准确性。本申请提供的一种数据模型的训练方法,该方法包括,在网络侧,统计来自各用户侧网络设备上报的差异信息,该差异信息为用户侧网络设备部署的第一数据模型输出结果与期望结果的差异;将统计的差异信息作为训练依据,调整第一数据模型的模型参数,;将调整后的模型参数分发至各用户侧网络设备,使得用户侧网络设备部署的第一数据模型按照分发的模型参数更新。其中,所述差异信息通过用户侧设备捕获对于所述输出结果的纠错操作而获得。所述通过用户侧设备捕获对于所述输出结果的纠错操作包括,捕获用户侧设备应用程序对于输出结果的纠错操作,基于纠错操作生成上报的差异信息。较佳地,所述统计来自各用户侧网络设备上报的差异信息包括,根据所述差异信息,定期统计来自各用户侧网络设备中具有第p代子孙模型参数的第一数据模型所输出样本特征值;所述将统计的差异信息作为训练依据,调整第一数据模型的模型参数包括,将统计的样本特征值作为训练依据,统计各所述样本特征值与预设第一阈值的误差;按照所述误差最小的原则,定期选择出m对第一数据模型的模型参数,将m对第一数据模型的模型参数按照遗传算法分别进行杂交,得到第p+1代子孙模型参数,将所述第p+1代子孙模型参数作为所述调整后的模型参数;重复上述步骤进行迭代,直至符合迭代结束条件;其中,p、m为自然数。较佳地,当所述第一数据模型的模型参数为初始模型参数时,所述将统计的样本特征值作为训练依据,统计各所述样本特征值与预设的第一阈值的误差还包括,根据统计的误差,计算所有误差的方差,以方差为变化区间为参考,对所述初始模型参数进行随机计算,得到N个第一代子孙模型参数;所述第p+1代子孙模型参数为N个,其中,N为自然数。较佳地,所述N个第p+1代子孙模型参数按照一定规则或策略分发至各用户侧网络设备。较佳地,所述数据模型为用于识别图片中的文字信息的卷积神经网络CNN模型;所述捕获用户侧设备应用程序对于输出结果的纠错操作,基于纠错操作生成上报的差异信息包括,通过应用程序以编辑的方式修正根据图片识别结果所生成的文本中的文字,并记录文本中每个文字在图片中的坐标区域,将识别有误的文字所在坐标区域进行抠图,将识别有误的文字、修正后的文字、以及抠图作为上报的差异信息;或者,将抠图之后的图片应用所述用于识别图片中的文字信息的CNN模型进行识别,将该模型输出的图片特征向量作为上报的差异信息。较佳地,所述数据模型为用于识别语音中的文字信息的CNN模型;所述捕获用户侧设备应用程序对于输出结果的纠错操作,基于纠错操作生成上报的差异信息包括,通过应用程序以编辑的方式修正根据语音识别所生成的文本中的文字,并记录文字和语音时间段的对应关系,根据记录的对应关系查找识别有误的文字所在语音时间段;将识别的错误文字、修正后的文字、以及查找的语音时间段内的语音频谱特征向量作为上报的差异信息。较佳地,所述数据模型为用于人脸识别的CNN模型;所述用户侧网络设备部署的第一数据模型输出结果为,通过人工智能算法应用部署的人脸识别CNN模型对图片进行人脸识别、且按照人脸识别所得到分组,其中,识别结果相同的为同一分组;所述捕获用户侧设备应用程序对于输出结果的纠错操作,基于纠错操作生成上报的差异信息包括,如果是合并操作,则将合并分组后的各图片i的特征向量Oi作为上报的差异信息,并标识该差异信息为过敏;如果是删除操作,则将所删除图片其隶属分组中各图片i的特征向量Oi、以及所删除图片的特征向量作为上报的差异信息,并标识该差异信息为低敏;其中,i为自然数。较佳地,所述数据模型为用于图片分类识别的CNN模型;所述用户侧网络设备部署的第一数据模型输出结果为,通过人工智能算法应用部署的图片分类识别CNN模型对图片进行识别、且按照识别类别所得到的分类,其中,识别结果相同的为同一分类;所述捕获用户侧设备应用程序对于输出结果的纠错操作,基于纠错操作生成上报的差异信息包括,如果是分类错误操作,则将被移动图片移动前所属第一分类中所有图片的特征向量、移动后的所属第二分类中所有图片的特征向量、以及被移动图片的特征向量作为上报的差异信息,并标识该差异信息为过敏;如果是不包含在分类操作,则将删除前所属第一分类中所有图片的特征向量、以及被删除的图片的特征向量作为上报的差异信息,并标识该差异信息为低敏。较佳地,所述数据模型为用于视频中物体识别的CNN模型;所述用户侧网络设备部署的第一数据模型输出结果为,通过人工智能算法应用部署用于视频中物体识别CNN模型将视频中的I帧作为图片进行识别、且按照识别类别所得到的分类,其中,识别结果相同的为同一分类。较佳地,所述将统计的样本特征值作为训练依据,统计各所述样本特征值与预设的第一阈值的误差包括,分析每一图片i的特征向量Oi与作为理想值的所述第一阈值Oi’的差值Di,其中,所述第一阈值基于分类正确图片的特征向量统计信息进行计算得到,当错误信息为过敏标识时,则降低所述第一阈值;当错误信息为低敏时,则提高所述第一阈值。本专利技术一方面提供的一种数本文档来自技高网
...

【技术保护点】
1.一种数据模型的训练方法,其特征在于,该方法包括,在网络侧,/n统计来自各用户侧网络设备上报的差异信息,该差异信息为用户侧网络设备部署的第一数据模型输出结果与期望结果的差异;/n将统计的差异信息作为训练依据,调整第一数据模型的模型参数;/n将调整后的模型参数分发至各用户侧网络设备,使得用户侧网络设备部署的第一数据模型按照分发的模型参数更新。/n

【技术特征摘要】
1.一种数据模型的训练方法,其特征在于,该方法包括,在网络侧,
统计来自各用户侧网络设备上报的差异信息,该差异信息为用户侧网络设备部署的第一数据模型输出结果与期望结果的差异;
将统计的差异信息作为训练依据,调整第一数据模型的模型参数;
将调整后的模型参数分发至各用户侧网络设备,使得用户侧网络设备部署的第一数据模型按照分发的模型参数更新。


2.如权利要求1所述的方法,其特征在于,所述差异信息通过用户侧设备捕获对于所述输出结果的纠错操作而获得。


3.如权利要求2所述的方法,其特征在于,所述通过用户侧设备捕获对于所述输出结果的纠错操作包括:捕获用户侧设备应用程序对于输出结果的纠错操作,基于纠错操作生成上报的差异信息。


4.如权利要求3所述的方法,其特征在于,所述统计来自各用户侧网络设备上报的差异信息包括,
根据所述差异信息,统计来自各用户侧网络设备中具有第p代子孙模型参数的第一数据模型所输出样本特征值;
所述将统计的差异信息作为训练依据,调整第一数据模型的模型参数包括:
将统计的样本特征值作为训练依据,统计各所述样本特征值与预设第一阈值的误差;
按照所述误差最小的原则,选择出m对第一数据模型的模型参数,
将m对第一数据模型的模型参数按照遗传算法分别进行杂交,得到第p+1代子孙模型参数,
将所述第p+1代子孙模型参数作为所述调整后的模型参数,并执行所述将调整后的模型参数分发至各用户侧网络设备的步骤;
其中,p、m为自然数。


5.如权利要求4所述的方法,其特征在于,当所述第一数据模型的模型参数为初始模型参数时,所述将统计的样本特征值作为训练依据,统计各所述样本特征值与预设的第一阈值的误差还包括,
根据统计的误差,计算所有误差的方差,以方差为变化区间为参考,对所述初始模型参数进行随机计算,得到N个第一代子孙模型参数;
所述第p+1代子孙模型参数为N个,
其中,N为自然数。


6.如权利要求1所述的方法,其特征在于,所述统计来自各用户侧网络设备上报的差异信息按照定期进行统计。


7.如权利要求4所述的方法,其特征在于,所述选择出m对第一数据模型的模型参数按照定期进行选择。


8.如权利要求4所述的方法,其特征在于,所述统计来自各用户侧网络设备中具有第p代子孙模型参数的第一数据模型所输出样本特征值按照定期进行统计。


9.如权利要求4所述的方法,其特征在于,所述将所述第p+1代子孙模型参数作为所述调整后的模型参数、并执行所述将调整后的模型参数分发至各用户侧网络设备的步骤之后进一步包括:
判断遗传算法当前迭代次数是否到达预设的迭代阈值,或者统计的所述误差值是否达到预期并稳定,如果是,则结束遗传算法的迭代,并结束模型参数更新;否则,返回执行所述将统计的样本特征值作为训练依据,统计各所述样本特征值与预设第一阈值的误差的步骤。


10.如权利要求3所述的方法,其特征在于,所述差异信息为样本特征值;
所述将统计的差异信息作为训练依据,调整第一数据模型的模型参数包括,
将统计的样本特征值作为训练依据,统计各所述样本特征值与预设第二阈值的误差;
根据统计的误差,计算所有误差的方差,以方差为参考值,对第一数据模型参数进行随机计算,得到N个模型参数,其中,N为自然数。


11.如权利要求5或10所述的方法,其特征在于,所述N个模型参数分发至各用户侧网络设备。


12.如权利要求3所述的方法,其特征在于,所述数据模型为用于识别图片中的文字信息的卷积神经网络CNN模型;
所述捕获用户侧设备应用程序对于输出结果的纠错操作,基于纠错操作而生成的差异信息包括:
识别有误的文字、修正后的文字、以及
基于识别有误的文字所在坐标区域进行的抠图;或者,原始图片抠图之后的图片和/或抠图本身图片应用所述用于识别图片中的文字信息的CNN模型进行识别所输出的图片特征向量;其中,
所述识别有误的文字所在坐标区域通过应用程序以编辑的方式修正根据图片识别结果所生成的文本中的文字、并记录每个文字在图片中的坐标区域确定。


13.如权利要求3所述的方法,其特征在于,所述数据模型为用于识别语音中的文字信息的CNN模型;
所述捕获用户侧设备应用程序对于输出结果的纠错操作,基于纠错操作生成的差异信息包括:识别的错误文字、修正后的文字、以及识别有误文字所在语音时间段内的语音频谱特征向量;其中,
识别有误文字所在语音时间段通过应用程序以编辑的方式修正根据语音识别所生成的文本中的文字、根据记录文字和语音时间段的对应关系查找得到。


14.如权利要求3所述的方法,其特征在于,所述数据模型为用于人脸识别的CNN模型;
所述用户侧网络设备部署的第一数据模型输出结果为,通过人工智能算法应用部...

【专利技术属性】
技术研发人员:戚世葛孙承华
申请(专利权)人:杭州海康存储科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1