当前位置: 首页 > 专利查询>康奈尔大学专利>正文

具有维度数据缩减的机器视觉制造技术

技术编号:28592404 阅读:24 留言:0更新日期:2021-05-28 15:43
描述一种方法,包括接收对应于一系列原始图像的原始图像数据,和用处理装置的编码器处理所述原始图像数据以生成经编码数据。所述编码器的特征在于基本上模拟脊椎动物视网膜的至少一个视网膜细胞的输入/输出转换的输入/输出转换。所述方法还包括通过对所述经编码数据应用减维算法处理所述经编码数据以生成减维经编码数据。所述减维算法被配置成压缩包含于所述经编码数据中的信息的量。此外描述可与这类方法一起使用的设备和系统。

【技术实现步骤摘要】
具有维度数据缩减的机器视觉本申请是2016年4月20日提交的、名称为“具有维度数据缩减的机器视觉”、申请号为201680032611.1的专利技术专利申请的分案申请。相关申请的交叉引用本申请根据35U.S.C.§119要求2015年4月20日提交的美国临时专利申请第62/150,068号的优先权,其全部内容以引用的方式并入本文中。本申请此外以引用的方式并入美国临时申请第61/527493号(2011年8月25日提交)、第61/657406号(2012年6月8日提交)、第61/308,681号(2010年2月26日提交)、第61/359,188号(2010年6月28日提交)、第61/378,793号(2010年8月31日提交)、第61/382,280号(2010年9月13日提交)和第13/230,488号(2011年9月12日提交)。本申请此外以引用的方式并入在本文中被称作“假体应用(ProsthesisApplications)”的国际专利申请第PCT/US2011/026526号(2011年2月28日提交)和PCT/US2011/049188(2011年8月25日提交)、在本文中被称作“机器视觉应用(MachineVisionApplication)”的国际专利申请第PCT/US2012/052348号(2012年8月24日提交)。前述申请中的每一个的内容均以其对应的全文引用的方式并入。
技术介绍
提供以下描述来帮助读者理解。所提供信息或所引用参考文献均不承认为现有技术。机器视觉(或计算机视觉)是指允许机器(例如计算机)使用视觉信息例如从图像提取信息以宽的或有限的含义解决一些任务,或“理解”情况的技术。一般来说,机器视觉关注从图像数据提取信息。图像数据可采取许多形式,如单个图像、视频序列、来自多个相机的视图,或更高维数据(例如来自医学扫描仪的三维图像)。已经提出若干方法用于发展基于视觉系统的操作的抽象模型的机器视觉的图像数据预处理方案,但是其效用受到限制。仍存在许多改善机器视觉的空间,使得其可更有效并且实用。
技术实现思路
前述专利技术概括仅仅是说明性的,且并不旨在以任何方式作为限制。除了上文描述的说明性方面、实施例和特征之外,通过参考以下图式以及详细描述,另外的方面、实施例以及特征将变得显而易见。在说明性中,描述了包括通过处理装置接收对应于一系列原始图像的原始图像数据和用处理装置的编码器处理原始图像数据以生成经编码数据的方法。编码器的特征在于基本上模拟脊椎动物视网膜的至少一个视网膜细胞的输入/输出转换的输入/输出转换。方法还包括通过对经编码数据应用减维算法,通过处理器处理经编码数据以生成减维经编码数据。此后者减维算法被配置成进一步压缩包含于经编码数据中的信息以使其适用于机器视觉算法。具体地说,此附加压缩允许从经编码数据抽出特征-适用于机器视觉但是在初始原始图像中不可获得的特征。此外,在一些实施方案中,可建立通过附加减维生成的特征以产生特征标记。特征标记包括与多个经编码图像区域相关的信息。特征标记可通过多个经编码图像区域携带比其分量特征更多(即,更具描述性)的信息。举例来说,在一些实施例中,通过对经编码数据应用减维的抽出特征可包括速度信息,所述速度信息包括不与不同光照条件和环境混淆的特定种类的速度信息。在标记中的多个区域可为对应于人体区域的区域集合。在此实例中,特征标记可通过创建其分量为单个区域中的速度(即,与单个身体部位的运动相关联的速度,如使用经编码数据所测量)的向量来生成。应注意,如上所述,通过使用经编码数据而不是原始图像,可在每个区域中计算速度而不与其它因素(如人在其中移动的光照条件或环境等)混淆。此向量、此标记可随后用于在标记捕获人体移动的许多识别特征(如步态、热量倾斜、身体部位的相对大小等)时识别人,即,区分他或她与其他人。类似地,多个区域或扇区可对应于物体的区域,使得区分人类或其它生物与无生命(即,刚性)物质。在一些实施方案中,经编码数据可表示为一个或一系列经编码图像(通常被称作一系列视网膜图像或经编码视网膜图像),并且处理经编码数据包括处理经编码的一系列视网膜图像以生成特征或特征标记。如上,特征标记可包括与多个视网膜图像区域相关的信息。在一些实施方案中,处理经编码数据包括对经编码数据应用经训练的算法。经训练的算法可包括卷积神经网络(CNN)。经训练的算法可已在经编码训练数据的训练数据集上训练,并且经编码训练数据可已使用特征在于基本上模拟脊椎动物视网膜的一个或多个视网膜细胞的输入/输出转换的输入/输出转换的训练编码器编码。在另一实施方案中,经编码训练数据的训练集包括虚拟环境的经编码图像,并且原始图像数据包括现实环境的原始图像。经编码训练数据的训练集可包括在第一组条件下获得的图像,并且原始图像数据可包括在不同于第一组条件的第二组条件下获得的原始图像。第一组条件和第二组条件可包括不同光照条件。在另一个实施方案中,方法可包括对减维经编码数据应用机器视觉算法。处理经编码数据以生成减维经编码数据可在处理原始图像数据以生成经编码数据之后并且在对减维经编码数据应用机器视觉算法之前执行。处理原始图像数据以生成经编码数据可包括生成相对于原始图像数据在维度上缩减的经编码数据,并且处理经编码数据以生成减维经编码数据可包括另外压缩相对于原始图像数据在维度上已经缩减的经编码数据。包含于经编码数据中的信息的量被至少压缩为所述对应的原始图像数据的约1/2,并且其中所述减维经编码数据被至少压缩为所述对应的经编码数据的约1/2。包含于经编码数据中的信息的量被至少压缩为所述对应的原始图像数据的约1/10,并且其中所述减维经编码数据被至少压缩为所述对应的经编码数据的约1/10。在另一个实施方案中,设备包括被配置成存储原始图像数据的至少一个存储器存储装置和可操作地与存储器耦接的至少一个处理器。处理器被编程以接收对应于一系列原始图像的原始图像数据并且使用基本上模拟脊椎动物视网膜的至少一个视网膜细胞的输入/输出转换的输入/输出转换处理原始图像数据以生成经编码数据。处理器进一步被编程以通过对经编码数据应用减维算法处理经编码数据以生成减维经编码数据。减维算法可被配置成压缩包含于经编码数据中的信息的量。设备可进一步包括可操作地耦接到至少一个处理器的机器人装置,其中机器人装置包含被配置成生成原始图像数据的至少一个图像传感器。在另一个实施方案中,具有计算机可执行指令的非暂时性计算机可读介质在通过计算装置执行时使计算装置执行包括接收对应于一系列原始图像的原始图像数据,使用基本上模拟脊椎动物视网膜的至少一个视网膜细胞的输入/输出转换的输入/输出转换的处理原始图像数据以生成经编码数据,和通过对经编码数据应用减维算法处理经编码数据以生成减维经编码数据的操作。减维算法被配置成压缩包含于经编码数据中的信息的量。附图说明通过以下描述和所附权利要求书结合附图理解,本公开的前述和其它特征将变得更加完全清楚。应理解,这些图式只描绘了根据本公开的若干实施例,并且因此不应被视为限制了本公开的范围,将通过使用这些附图用额外的特本文档来自技高网
...

【技术保护点】
1.一种方法,其特征在于,所述方法包括:/n通过处理装置处理图像数据以生成经编码数据;和/n通过所述处理装置从经编码数据中生成减维数据,其中所述生成减维数据包括生成所述经编码数据的多个区域的特征标记数据,并且所述特征标记数据包括多个分量,所述多个分量具有与所述经编码数据的多个区域的各个区域相关联的值。/n

【技术特征摘要】
20150420 US 62/150,0681.一种方法,其特征在于,所述方法包括:
通过处理装置处理图像数据以生成经编码数据;和
通过所述处理装置从经编码数据中生成减维数据,其中所述生成减维数据包括生成所述经编码数据的多个区域的特征标记数据,并且所述特征标记数据包括多个分量,所述多个分量具有与所述经编码数据的多个区域的各个区域相关联的值。


2.根据权利要求1所述的方法,其特征在于,所述特征标记数据包括具有多个分量的向量,所述向量具有的多个分量包括与多个图像区域的各个区域相关联的特征的子集的值。


3.根据权利要求1所述的方法,其特征在于,所述生成减维数据包括对所述经编码数据应用减维算法,并且其中所述减维算法为了特定机器视觉任务选择所述经编码数据的特征的子集并且忽略所述经编码数据的其他特征。


4.根据权利要求1所述的方法,其特征在于,所述处理图像数据以生成经编码数据包括在维度上缩减所述图像数据,并且所述从经编码数据中生成减维数据包括额外的减维操作,所述额外的减维操作包括额外地压缩相对于所述图像数据在维度上已经缩减的所述经编码数据。


5.根据权利要求1所述的方法,其特征在于,所述特征标记数据包括对应于多个图像区域中的每个的运动数据,其中所述运动数据包括对应于所述多个图像区域中的每个的速度数据。


6.根据权利要求1所述的方法,其特征在于,所述方法进一步包括对所述经编码数据应用经训练的算法,其中所述经训练的算法已在经编码训练数据的训练数据集上训练,并且其中所述经编码训练数据已使用训练编码器编码,所述训练编码器的特征在于基本上模拟脊椎动物视网膜的一个或多个视网膜细胞的输入/输出转换的输入/输出转换,其中所述经编码训练数据的训练集包括虚拟环境的经编码图像,并且所述图像数据包括现实环境的原始图像。

【专利技术属性】
技术研发人员:S·尼伦伯格
申请(专利权)人:康奈尔大学
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1