一种数据处理方法、装置及设备制造方法及图纸

技术编号：25951581 阅读：28 留言：0更新日期：2020-10-17 03:43

本申请提供一种数据处理方法、装置及设备，该方法包括：从服务器获取初始基线模型和样本数据对应的第一特征分布信息；获取初始噪声数据，将初始噪声数据输入给初始基线模型，得到初始噪声数据对应的第二特征分布信息；基于第一特征分布信息和第二特征分布信息对初始噪声数据进行训练，得到目标噪声数据；基于目标噪声数据和终端设备的场景数据对初始基线模型进行优化，得到优化后的目标基线模型；在所述终端设备部署所述目标基线模型，以通过所述目标基线模型对所述终端设备的应用数据进行处理。通过本申请的技术方案，目标噪声数据能够反映样本数据的特性，从而基于样本数据的特性对初始基线模型进行优化，解决样本数据缺失的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法、装置及设备
本申请涉及人工智能
，尤其是一种数据处理方法、装置及设备。
技术介绍
机器学习是实现人工智能的一种途径，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习用于研究计算机如何模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习更加注重算法设计，使计算机能够自动地从数据中学习规律，并利用规律对未知数据进行预测。机器学习已经有了十分广泛的应用，如深度学习、数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用等。为了采用机器学习实现人工智能处理，服务器需要获取大量样本数据，并基于这些样本数据训练出机器学习模型，并将该机器学习模型部署到终端设备(如摄像机等)，以使终端设备基于该机器学习模型实现人工智能处理。由于数据隐私性，终端设备不会将自身所处环境的数据提供给服务器，服务器无法基于终端设备所处环境的数据训练机器学习模型，导致部署到终端设备的机器学习模型无法匹配终端设备所处环境，机器学习模型的性能较低。
技术实现思路
本申请提供一种数据处理方法，应用于终端设备，所述方法包括：从服务器获取初始基线模型和样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的，所述第一特征分布信息是将所述样本数据输入给所述初...

【技术保护点】
1.一种数据处理方法，其特征在于，应用于终端设备，所述方法包括：/n从服务器获取初始基线模型和样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的，所述第一特征分布信息是将所述样本数据输入给所述初始基线模型后得到的；/n获取初始噪声数据，将所述初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；/n基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型；/n在所述终端设备部署所述目标基线模型，以通过所述目标基线模型对所述终端设备的应用数据进行处理。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，应用于终端设备，所述方法包括：
从服务器获取初始基线模型和样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的，所述第一特征分布信息是将所述样本数据输入给所述初始基线模型后得到的；
获取初始噪声数据，将所述初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；
基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型；
在所述终端设备部署所述目标基线模型，以通过所述目标基线模型对所述终端设备的应用数据进行处理。

2.根据权利要求1所述的方法，其特征在于，
所述基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据，包括：
基于所述第一特征分布信息和所述第二特征分布信息，确定预配置的损失函数的目标损失值，并基于所述目标损失值确定所述损失函数是否已收敛；
若是，则将当前的初始噪声数据确定为所述目标噪声数据；
若否，则对当前的初始噪声数据进行调整，得到调整后的初始噪声数据；
基于调整后的初始噪声数据，返回执行将所述初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息的操作。

3.根据权利要求2所述的方法，其特征在于，所述基于所述第一特征分布信息和所述第二特征分布信息，确定预配置的损失函数的目标损失值，包括：
若所述第一特征分布信息包括第一特征值，所述第二特征分布信息包括第二特征值，则基于所述第一特征值和所述第二特征值确定特征损失值，并根据所述特征损失值确定所述目标损失值；或者，
若所述第一特征分布信息包括第一统计值，所述第二特征分布信息包括第二统计值，则基于所述第一统计值和所述第二统计值确定统计损失值，并根据所述统计损失值确定所述目标损失值；或者，
若所述第一特征分布信息包括第一特征值和第一统计值，所述第二特征分布信息包括第二特征值和第二统计值，基于所述第一特征值和所述第二特征值确定特征损失值，基于所述第一统计值和所述第二统计值确定统计损失值，并根据所述特征损失值和所述统计损失值确定所述目标损失值。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：基于所述初始噪声数据中的最大噪声值和最小噪声值，确定范围损失值；
所述根据所述特征损失值确定所述目标损失值，包括：
根据所述特征损失值和所述范围损失值确定所述目标损失值；
所述根据所述统计损失值确定所述目标损失值，包括：
根据所述统计损失值和所述范围损失值确定所述目标损失值；
所述根据所述特征损失值和所述统计损失值确定所述目标损失值，包括：
根据所述特征损失值，所述统计损失值和所述范围损失值确定目标损失值。

5.根据权利要求1所述的方法，其特征在于，
所述基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型，包括：
基于所述终端设备的场景数据对所述初始基线模型内的各网络参数进行参数值训练，得到已训练基线模型；
基于所述目标噪声数据和所述终端设备的场景数据对所述已训练基线模型内的各网络参数进行参数值量化，得到所述目标基线模型。

6.一种数据处理方法，其特征在于，应用于服务器，所述方法包括：
将样本数据输入给初始基线模型，得到所述样本数据对应的第一特征分布信息；其中，所述初始基线模型是基于所述样本数据或所述样本数据的同源数据训练得到的；
获取初始噪声数据，将所述初始噪声数据输入给所述初始基线模型，得到所述初始噪声数据对应的第二特征分布信息；基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据；
将所述初始基线模型和所述目标噪声数据发送给终端设备，以使所述终端设备基于所述目标噪声数据和所述终端设备的场景数据对所述初始基线模型进行优化，得到优化后的目标基线模型。

7.根据权利要求6所述的方法，其特征在于，
所述基于所述第一特征分布信息和所述第二特征分布信息对所述初始噪声数据进行训练，得到目标噪声数据，包括：
基于所述第一特征分布信息和所述第二特征分布信息，确定预配置的损失函数的目标损失值，并基于所述目标损失值确定所述损失函数是否已收敛；
若是，则将当前的初始噪声数据确定为所述目标噪声数据；
...

【专利技术属性】
技术研发人员：林晨，彭博，李哲暘，谭文明，任烨，
申请(专利权)人：杭州海康威视数字技术股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人