【技术实现步骤摘要】
【国外来华专利技术】利用分布式计算设备的半监督式数据收集和机器学习的方法
相关申请
[0002]本申请涉及以下文献并要求其优先权:于2020年4月27日提交的名称为“Semi
‑
Supervised Data Collection and Machine Learning Leveraging Distributed Computing Devices[利用分布式计算设备的半监督式数据收集和机器学习]”的美国临时专利申请序列号63/016,003,以及于2021年4月26日提交的名称为“Method of Semi
‑
Supervised Data Collection and Machine Learning Leveraging Distributed Computing Devices[利用分布式计算设备的半监督式数据收集和机器学习的方法]”的美国临时专利申请序列号63/179,950,这些申请的披露内容通过引用并入本文。
[0003]本披露涉及用于标识可能需要额外关注的数据收集区域以用于分布式和主动收集此类数据的系统和方法,以及用于改进计算设备(比如机器人计算设备)中所述数据收集的机器学习技术。
技术介绍
[0004]机器学习性能和神经网络训练在很大程度上依赖于在生态有效的环境中收集的数据(即,尽可能接近实际使用情况而收集的数据)。然而,为了收集用于将出现在如Alexa、Google Home、具身机器人或数字伴侣等家庭设备上的机器学习模型的数据、参数和测量值,所收集的数据集仅 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种系统,该系统被配置为从多模态输入设备自动捕获数据,该系统包括:一个或多个硬件处理器,该一个或多个硬件处理器通过机器可读指令被配置为:从多个机器人计算设备的一个或多个多模态输入设备接收视频、音频和传感器参数、数据和/或测量值;将从该多个机器人计算设备的该一个或多个多模态输入设备接收的所接收视频、音频和传感器参数、数据和/或测量值存储在一个或多个云计算设备的一个或多个存储器设备中;分析从该一个或多个多模态输入设备接收的所捕获的视频、音频和传感器参数、数据和/或测量值,以确定对概念、时间序列、物体、面部表情和/或口语的识别质量;以及标识识别质量较低的概念、时间序列、物体、面部表情和/或口语。2.如权利要求1所述的系统,其中,所接收的视频、音频和传感器参数、数据和/或测量值是从被确定与该机器人计算设备互动的一个或多个用户捕获的。3.如权利要求1所述的系统,其中,所接收的视频、音频和传感器参数、数据和/或测量值是从被确定未与该机器人计算设备互动的一个或多个用户捕获的。4.如权利要求1所述的系统,该一个或多个硬件处理器通过机器可读指令被配置为:至少部分基于参数或测量值收集的需要、识别性能和/或类型来为所标识的识别质量较低的概念、时间序列、物体、面部表情和/或口语中的每一个生成用于自动收集新的视频、音频和传感器参数、数据和/或测量值的优先级值。5.如权利要求1所述的系统,该一个或多个硬件处理器通过机器可读指令被配置为:为该多个机器人计算设备生成利用该多个机器人计算设备的该一个或多个多模态输入设备自动收集所标识的识别质量较低的概念、时间序列、物体、面部表情和/或口语的时间表。6.如权利要求5所述的系统,其中,所生成的时间表至少部分地基于为所标识的识别质量较低的概念、时间序列、物体、面部表情和/或口语生成的优先级值。7.如权利要求5所述的系统,其中,该时间表被生成为使得该自动收集发生在该自动收集能够捕获更好的质量参数和/或测量值的时刻期间。8.如权利要求5所述的系统,其中,该一个或多个硬件处理器通过机器可读指令进一步被配置为:将所生成的自动收集时间表传送到该多个机器人计算设备,所生成的自动收集时间表包括用于该多个机器人计算设备请求用户执行一个或多个动作以生成要由该多个机器人计算设备的该一个或多个多模态输入设备捕获的一个或多个数据点的指令和/或命令。9.如权利要求8所述的系统,其中,该一个或多个动作可以是取得物体;做出面部表情;说出词语、短语或发出声音;或者创作绘图。10.如权利要求8所述的系统,其中,该一个或多个硬件处理器通过机器可读指令进一步被配置为:在该一个或多个云计算设备处从该多个机器人计算设备接收提取的特性和/或经处理的参数、测量值和/或数据点。11.如权利要求10所述的系统,其中,该一个或多个硬件处理器通过机器可读指令进一步被配置为:
对所接收的参数、测量值和/或数据点以及相关的所提取特性执行附加处理。12.如权利要求11所述的系统,其中,该一个或多个硬件处理器通过机器可读指令进一步被配置为:从所接收的参数、测量值和/或数据点中滤除所提取特性中的异常特性以及异常的参数、测量值和/或数据点,以生成过滤后的参数、测量值和/或数据点以及相关的过滤后的特性。13.如权利要求12所述的系统,其中,该一个或多个硬件处理器通过机器可读指令进一步被配置为:利用该相关的过滤后的特性和/或过滤后的参数、测量值和/或数据点来训练机器学习模型,以生成更新的机器人计算设备机器学习模型。14.如权利要求13所述的系统,其中,该一个或多个硬件处理器通过机器可读指令进一步被配置为:从该一个或多个云计算设备将该更新的机器人计算设备机器学习模型传送到该多个机器人计算设备。15.如权利要求1所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。