【技术实现步骤摘要】
【国外来华专利技术】机器学习模型的环境特定训练
技术介绍
[0001]强大的机器学习模型可以被用来执行诸如图像分析
、
语音识别
、
自然语言处理
、
数据分析之类的任务
。
在给予足够的时间和计算资源来执行这种任务的情况下,经训练的机器学习模型可以提供准确
、
可复现的分析
。
对于期望实时分析的场景和
/
或当本地计算资源有限时,来自大型机器学习模型的知识可以被蒸馏成小型模型以用于本地部署,而不牺牲有效性
。
技术实现思路
[0002]一种用于机器学习模型的环境特定训练的方法,包括:接收针对本地环境的
、
包括多个顺序数据片段的数据流
。
使用学生版机器学习模型为每个数据片段生成编程标记
。
选择用于由教师版机器学习模型进行评估的数据片段的一部分和相关联的编程标记并将其上传到服务器侧计算设备
。
从服务器侧计算设备接收环境特定训练更新
。
该训练更新是基于对所选编程标记与由教师版为数据片段的所选部分生成的伪标记的比较
。
将环境特定训练更新应用于学生版以生成更新的学生版
。
然后,更新的学生版机器学习模型被用来为新接收数据片段生成编程标记
。
[0003]提供本
技术实现思路
是为了以简化的形式介绍概念的选择,这些概念将在下面的具体实施方式中被进一步描述
。
本
技术实现思路
并不旨在识别所 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.
一种用于机器学习模型的环境特定训练的方法,所述方法包括:接收针对本地环境的
、
包括多个顺序数据片段的数据流;使用学生版机器学习模型,为每个数据片段生成编程标记;选择用于由教师版机器学习模型进行评估的数据片段的一部分;将数据片段的所选部分和相关联的编程标记上传到包括所述教师版机器学习模型的服务器侧计算设备;从所述服务器侧计算设备接收环境特定训练更新,所述环境特定训练更新至少是基于与数据片段的所述所选部分相关联的所述编程标记和由所述教师版机器学习模型为数据片段的所述所选部分生成的伪标记的比较;将所述环境特定训练更新应用于所述学生版机器学习模型以生成更新的学生版机器学习模型;使用所述更新的学生版机器学习模型,为新接收数据片段生成编程标记;以及将所述新接收数据片段和生成的编程标记中的至少一些提供给本地输出以用于在评估所述本地环境内的事件中使用
。2.
根据权利要求1所述的方法,还包括:迭代地执行更新程序,所述更新程序包括选择新接收数据片段的一部分并且将新接收数据片段的所选部分上传到所述服务器侧计算设备以供所述教师版机器学习模型进行评估,从所述服务器侧计算设备接收新的环境特定训练更新,以及应用所述新的环境特定训练更新以生成更新的学生版机器学习模型
。3.
根据权利要求1所述的方法,其中,所述环境特定训练更新包括一个或多个选择参数,所述一个或多个选择参数能够用于确定新接收数据片段的一部分以选择用于供所述教师版机器学习模型进行评估
。4.
根据权利要求3所述的方法,其中,在所述训练更新中包括的所述一个或多个选择参数包括选择频率
。5.
根据权利要求1所述的方法,其中,被选择用于评估的数据片段的所述部分是被随机选择的
。6.
根据权利要求1所述的方法,其中,被选择用于评估的数据片段的所述部分至少部分地基于所述编程标记被选择
。7.
根据权利要求6所述的方法,其中,被选择用于评估的数据片段的所述部分至少部分地基于被分配给一个或多个编程标记的置信度评级被选择
。8.
一种用于在本地环境中部署机器学习模型的系统,所...
【专利技术属性】
技术研发人员:于沛,刘自成,金赢,陈寅鹏,罗琨,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。