【技术实现步骤摘要】
【国外来华专利技术】
示例涉及用于基于自动化设备的环境状态确定自动化设备的动作的方法、计算机程序和装置,更具体地,但不排他地,涉及用于实现自动化设备的确定动作的统计信息的概念。
技术介绍
1、人工智能和机器学习概念已经发展和应用于许多不同的
,例如,在自主车辆或工业机器人领域。例如,出于稍后描述的目的,训练数据用于训练神经网络,其中,训练的神经网络的稍后性能还取决于训练的质量和训练数据的质量。训练的神经网络基于来自环境的输入(例如,基于来自环境的传感器数据)提供其输出。一些概念利用持续学习或训练,例如,强化学习可使用奖励或其他质量测量判断神经网络做出的决策。根据奖励或质量测量,神经网络保持对其决策的学习,并且由此可建立持续学习或训练概念。
技术实现思路
1、示例是基于以下发现:环境数据的统计特性可用于改善机器学习方法的使用。例如,关于环境的置信度信息可用于生成或确定神经网络的改进的输出。另一发现是,环境状态可使用两个或更多个中间状态表示,该中间状态还表示环境的统计特性。这些中间状态随后可用于确定神经网络的
...【技术保护点】
1.一种用于基于自动化设备的环境状态确定所述自动化设备的动作的方法,所述方法包括:
2.根据权利要求1所述的方法,还包括确定所述动作的置信度信息。
3.根据权利要求1所述的方法,其中,所述两个或更多个中间状态中的每一个包括表示关于所述环境状态的信息的统计特性的一个或多个sigma点。
4.根据权利要求1所述的方法,还包括使用一个或多个策略以基于所述两个或更多个中间状态获得两个或更多个中间动作。
5.根据权利要求4所述的方法,还包括使用相同的策略来为所述中间状态中的每一个获得一个中间动作。
6.根据权利要求5所
...【技术特征摘要】
【国外来华专利技术】
1.一种用于基于自动化设备的环境状态确定所述自动化设备的动作的方法,所述方法包括:
2.根据权利要求1所述的方法,还包括确定所述动作的置信度信息。
3.根据权利要求1所述的方法,其中,所述两个或更多个中间状态中的每一个包括表示关于所述环境状态的信息的统计特性的一个或多个sigma点。
4.根据权利要求1所述的方法,还包括使用一个或多个策略以基于所述两个或更多个中间状态获得两个或更多个中间动作。
5.根据权利要求4所述的方法,还包括使用相同的策略来为所述中间状态中的每一个获得一个中间动作。
6.根据权利要求5所述的方法,其中,所述一个或多个策略涉及非线性变换,以基于所述两个或更多个中间状态获得所述两个或更多个中间动作。
7.根据权利要求6所述的方法,还包括确定所述两个或更多个中间动作的分布的统计特性。
8.根据权利要求7所述的方法,还包括使用无迹变换用于确定所述两个或更多个中间动作的所述统计特性。
9.根据权利要求8所述的方法,其中,确定关于所述动作的信息还基于所述两个或更多个中间动作的分布的统计特性,并且其中,所述两个或更多个中间动作的分布的统计特性包括关于所述中间动作的置信...
【专利技术属性】
技术研发人员:彼得·迪尔,萨姆·罗伯特·艾伦·布莱克曼,
申请(专利权)人:索尼集团公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。