属性判定方法技术

技术编号:2936548 阅读:146 留言:0更新日期:2012-04-11 18:40
本发明专利技术揭示一种属性判定方法,该方法包括比较输入图像包含输入图形的复数的特征数据和从标准图形求得的特征数据的成员函数,对于全部的特征数据求得对于该输入图形的各特征数据的各成员函数的输出值,并对全部特征数据求得输出值的综合值,对应该判定的多数的各标准图形,根据判别综合值最高的标准图形,判定输入图形中类似度最高的标准图形,此方法解决了进行正确解答率高且可靠性高的属性判定问题。(*该技术在2015年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及,该方法用电视摄像机等信号输入装置和具有计算机的信号处理装置,判定输入图象中含有图形属于什么样的种类。近年来,在工业产品等的检查工序中,产品的正确种类分类与不良种类分类等,成为重要课题之一。这些都期望自动化高且广泛使用电视摄像机等的图像输入装置和具有计算机的图像处理装置。例如,使用自动识别写在产品上的制造号码等的电视摄像机的文字识别装置,就是其中一例。下面,对用以往电视摄像机的文字识别装置的技术例进行说明。附图说明图15表示装置的大概结构。通过半透镜14,在将光源15来的照明光照射于对象11的表面的同时,通过半透镜14,采用电视摄像机12,对对象11的表面进行摄像。该电视摄像机12具有电荷耦合器件传感器,对获得的每个像素的浓淡信号,用数字化形式在识别处理部13中处理。又,识别处理部13当然设有记忆图像数据的记忆部和存储实行文字识别处理程序的存储部。图16表示识别处理部的结构。从电视摄像机12输出的图像信号a,被输入到模/数(A/D)转换电路21中,在A/D转换电路21中数字化后输出的信号b,被存储在图像存储器22中。从图像存储器22输出的图像数据c,在二进制化电路23中转换成二进制图像d。如图17所示,在二进制化电路23中,按照图像数据27的“黑”是文字部分、“白”是背景部分,进行二进制化。二进制图像d输入到文字截出电路24,输出截出图像e。如图18所示,在文字截出电路24中,检出外接每个字的外接矩形28,将文字列分离成字。文字的截出大多以被投影于水平轴和垂直轴的投影数据为依据进行文字的分离。被分离后的每个文字的截出图像,被输入到标准化电路25,输出网格图形数据f。在标准化电路25中,各文字外接矩形内存在的像素被标准化变换成适当的网格大小的图形。对应于各网格的复数像素的变换,按它们的平均值、最大值、最小值、中心值、最多频率值等进行。图19中,被分离后的每个文字的图像29表示成变换为横5×纵9的网格大小的网格图形30的样子。网格图形数据f输入到文字判定电路26,输出文字判定结果g。作为文字,在工业应用场合,常用的是英文数字“0”~“9”和字母“A”~“Z”以及特殊字符“-”共37个文字。文字判定电路26,是将网格图形数据与哪一个文字相近,作为结果进行输出。图20表示前述37个文字的标准图形数据。文字判定电路26中,常用的有神经网络(下面记为NN)。关于NN,有各种结构(参考文献饭沼编、“神经元计算机”、技术评论社、平成元年9月刊),图21所示的是实际中常被应用的视感控器型NN的结构。这种NN由输入层、中间层和输出层的三层组成,采用称为各自多数的神经元的非线性元件构成。在输入层中有用“0”表示背景部分和用“1”表示文字部分的值的45个(横5×纵9)神经元。在输出层中有对应于被判定的文字的英文数字“0”~“9”和字母“A”~“Z”以及特殊字符“-”的37个神经元。在这里,输入层与中间层、中间层与输出层,在各自神经元间连线,连线上定义权重ω。各神经元对所有的连线,总和被连接的神经元的输出y与其连线上定义的权重ω的积,然后用非线性函数处理后,输出0.0到1.0的值。这里,根据权重ω的值,该NN持有各自的特性。该权重的决定中,给予实际的数据,输出层的神经元,视输出是否为期待的输出,多次反复进行对该误差部分权重的修正。作为这种修正方法,反向传播常被使用。(D.E.Rumelhart等通过反向传播错误的学习表示,自然杂志323号,533~536页,(1986))。给予输入层标准图形数据,假设输出层的期待输出为对应于该文字的神经元是1.0,其余的神经元是0.0,多次反复进行对该误差部分权重的修正。在实施例中,反复修正作业直至所有输出层神经元的值与期待的输出值的误差小于0.1。对于修正作业完成后的NN,进行判定作业的情况,如图22所示,当输入层中输入“A”,对应于输出层的“A”的神经元的输出比其它神经元要大,理想情况下,对应于“A”的神经元是接近1.0的值,其余神经元是接近0.0的值。在实施例中,文字的判定条件如下。1)当输出层的神经元的值大于0.7时,以该对应文字为判定文字(判定条件1)。2)当输出层的神经元中第一号中的最大值与第二号中的最大值的差大于0.3时,以与第一号对应的文字为判定文字(判定条件2)。3)输出层的任一神经元均不能输出前述那样的值时,作为“?”为不能判定。用前述以往NN的判定方法,存在不能用被要求的可靠性进行属性判定(文字判定)的问题。下面根据实际的技术例进行说明。在图20所示的标准图形数据中,对于由输入层45(横5×纵9的二进制(0,1)图形)、中间层45、输出层37(英文数字“0”~“9”、字母“A”~“Z”、特殊字符“-”)三层所成的网络,进行学习后的结果实施所成。图23~图26是用于文字判定的检定的文字图形,“2”、“9”、“A”、“F”四种文字每种各有30个。图中用“*”表示黑的“1”,用“_”表示白的“0”。关于文字“2”代表的结果所示,在图23中,对于(1),最大输出的神经元是“2”,其值是0.86,满足判定条件1。对于(2),最大输出的神经元是“2”,其值是0.63,第二号中的最大输出的神经元是“Z”,其值是0.12,因它们的差是0.51,满足判定条件2。但对于(4),最大输出的神经元是“2”,其值是0.34,第二号中的最大输出的神经元是“S”,其值是0.15,因它们的差是0.19,故不能判定。同样对于(9),最大输出的神经元是“2”,其值是0.58,第二号中的最大输出的神经元是“C”,其值是0.48,因它们的差是0.10,故不能判定。关于文字“9”代表的结果所示,在图24中,对于(1),最大输出的神经元是“9”,其值是0.90,满足判定条件1。对于(3),最大输出的神经元是“9”,其值是0.37,第二号中的最大输出的神经元是“5”,其值是0.07,因它们的差是0.30,满足判定条件2。但对于(2),最大输出的神经元是“9”,其值是0.27,第二号中的最大输出的神经元是“3”,其值是0.07,因它们的差是0.20,故不能判定。同样对于(8),最大输出的神经元是“9”,其值是0.38,第二号中的最大输出的神经元是“S”,其值是0.18,因它们的差是0.20,故不能判定。关于文字“A”代表的结果所示,在图25中,对于(1),最大输出的神经元是“A”,其值是0.91,满足判定条件1。对于(3),最大输出的神经元是“A”,其值是0.66,第二号中的最大输出的神经元是“4”,其值是0.11,因它们的差是0.55,满足判定条件2。但对于(22),最大输出的神经元是“A”,其值是0.22,第二号中的最大输出的神经元是“M”,其值是0.08,因它们的差是0.14,故不能判定。同样对于(26),最大输出的神经元是“Q”,其值是0.52,第二号中的最大输出的神经元是“A”,其值是0.38,因它们的差是0.14,故不能判定。关于文字“F”代表的结果所示,在图26中,对于(1),最大输出的神经元是“F”,其值是0.91,满足判定条件1。对于(3),最大输出的神经元是“F”,其值是0.65,第二号中的最大输出的神经元是“P”,其值是0.27,因它们的差是0.39,满足判定条件本文档来自技高网...

【技术保护点】
一种属性判定方法,其特征在于包括:比较输入图像包含的输入图形的复数的特征数据和从多数的标准图形中求得的特征数据的成员函数,在输入图形中判定类似度最高的标准图形的属性判定方法,对全部特征数据求得对于输入图形各特征数据的各成员函数的输出值,求得对于全部特征数据的输出值的综合值,对应该判定的各标准图形,判别综合值最高的标准图形的属性判定方法。2.一种属性判定方法,其特征在于包括:对于输入图像包含的输入图形,用预定的神经网络进行类似度高的标准图形的判定,从其结果选择上位的复数个的标准图形,用选择的标准图形进行权利要求1中记载的属性判定方法。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:汤川典昭石井彰一手光隆
申请(专利权)人:松下电器产业株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1