一种用于复杂背景图像的眼睛定位方法技术

技术编号:2926505 阅读:343 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种用于复杂背景图像的眼睛定位装置与方法,使用一个定位装置,装置中的数字信号处理器配置有先入先出存储器、同步动态随机存储器、可擦写存储器、复杂可编程逻辑器件、视频解码器、摄像装置、定位算法软件及数据;所述定位的步骤是:启动所述定位装置,将固化在可擦写存储器中的人脸检测、眼睛定位软件装载入数字信号处理器中运行;启动摄像装置采集包含人脸图像的模拟视频信号;该模拟视频信号经视频解码器处理后变成4∶2∶2的YUV格式的数字视频信号;然后将该数字视频信号送入数字信号处理器;数字信号处理器对输入的数字视频信号进行逐帧检测人脸在图像中的位置,并在检测出的人脸图像区域中使用眼睛定位算法进行处理,定位出眼睛位置。

【技术实现步骤摘要】

本专利技术涉及一种人脸识别
,特别是一种在复杂背景图像中基于数 字信号处理器(Digital Signal Processor, DSP)的眼睛定位装置和方法。
技术介绍
眼睛定位是人脸信息处理的一项关键技术,是人脸识别、人脸检索的基础。 眼睛定位需要克服光照、尺度、姿态、平面旋转、图像质量等因素给眼睛外观 带来变化影响,此外,眼睛定位还需要克服眼睛开闭、眼镜反光、饰物和镜框 的遮挡带来的定位困难。已有技术中公开的眼睛定位算法是基于启发式规则的方法。这类方法主要 是根据眼睛的先验知识来制定定位规则。这类方法一般适应外界变化的能力较 差,往往只能处理器官的一种或几种变化,稳定性和精度与实际应用有一定差 距。因此,需要提出一种新的眼睛定位装置和眼睛定位方法。
技术实现思路
本专利技术的目的在于提供一个用于复杂背景图像的眼睛定位装置,该装置中 的数字信号处理器(Digital Signal Processor, DSP)匹配有眼睛定位算法 软件,可以灵活、精确、稳定、快速进行眼睛定位。本专利技术的目的是由下述技术方案实现的 一种用于复杂背景图像的眼睛定 位装置,包括一个数字信号处理器,该数字信号处理器配置有先入先出存储器、 同步动态随机存储器、可擦写存储器、复杂可编程逻辑器件、定位算法软件及 数据;所述数字信号处理器的以太网接口与以太网收发器连接,用于眼睛定位 结果输出;所述数字信号处理器的信号输入端连接一个视频解码器,该视频解 码器输入端连接摄像装置用于图像数据采集;所述复杂可编程逻辑器件的控制 端连接一个视频编码器用于视频输出;所述先入先出存储器与一个通用异步串 行收发器、DB9接口依次连接,用于眼睛定位结果输出。本专利技术的另一个目的在于提供一种用于复杂背景图像的眼睛定位方法,该 方法基于数字信号处理器(DSP),可以灵活、精确、稳定、快速进行人脸眼 睛定位。本专利技术的另一个目的是由下述技术方案实现的 一种用于复杂背景图像的 眼睛定位方法,使用一个定位装置,该装置包括一个数字信号处理器,该数字信号处理器配置有先入先出存储器、同步动态随机存储器、可擦写存储器、复 杂可编程逻辑器件、视频解码器、摄像装置、定位算法软件及数据;所述定位 的步骤是-A、 启动所述定位装置,将固化在可擦写存储器中的人脸检测、眼睛定位 软件装载入数字信号处理器中运行;B、 启动摄像装置采集包含人脸图像的模拟视频信号;C、 该模拟视频信号经视频解码器处理后变成4:2:2的YUV格式的数字视 频信号;然后将该数字视频信号送入数字信号处理器;D、 数字信号处理器对输入的数字视频信号进行逐帧检测人脸在图像中的 位置,并在检测出的人脸图像区域中使用眼睛定位算法进行处理,定位出眼睛 位置,眼睛定位的结果通过以太网络输出到计算机上作进一步处理。所述眼睛定位算法的步骤是-E、 利用输入人脸图像在竖直方向投影的均值、方差函数比值来计算左、 右眼睛可能存在的区域;F、 在左、右眼睛可能存在的两个区域中穷举判断所有的矩形区域小图像, 定义为小窗口,对每个小窗口抽取微结构特征,然后利用单只眼睛检测器对该 小窗口进行判断,判断其是否是可能的眼睛位置,从而得到可能的眼睛候选位 置;G、 利用眼睛对分类器从眼睛候选位置中验证每一对可能的眼睛对候选, 根据后验概率从所有候选眼睛对中选择后验概率最大的眼睛候选对,将该眼睛 候选对作为双眼的最佳位置,从而定位出双眼在人脸区域的坐标位置。本专利技术与已有技术相比具有如下优点-1、 本专利技术的眼睛定位装置内固化有眼睛定位算法软件,构成人脸眼睛定 位系统,该系统具有灵活、精确、稳定性好、抗干扰强、速度快等突出优点。2、 本专利技术的眼睛定位方法可以在数字信号处理器DSP上鲁棒地、高速地实现复杂背景图像下的眼睛定位。以下结合附图及实施例对本专利技术作进一步说明。图l、本专利技术的眼睛定位装置原理图图2、本专利技术的眼睛定位方法的流程图图3、本专利技术的微结构模板示意图图4、本专利技术的眼睛定位装置的一个实施例具体实施例方式实施例一参见附图说明图1、图4,用于复杂背景图像的眼睛定位装置,包括一个数字信号 处理器2 (Digital Signal Processor, DSP,其型号是TMS320DM642),该数 字信号处理器配置有先入先出存储器5 (First In First Out , FIFO,其型号 是16C550)、同步动态随机存储器3 (SDRAM,其型号是MT48LC8M32)、可擦 写存储器4 (FLASH,其型号是AM29LV160DB)、复杂可编程逻辑器件8 (CPLD, 其型号是XC9536XL);所述数字信号处理器的以太网接口 (EMAC)与以太网收 发器7 (Ethernet Transceiver,其型号是DP83846)连接,实现了 RJ45以太 网络接口,可以将眼睛定位结果通过以太网络实现网络输出;所述数字信号处 理器的信号输入端连接一个视频解码器l(Video decoder,其型号是TVP5150), 该视频解码器的视频输入端可连接摄像装置用于图像数据采集;所述复杂可编 程逻辑器件的控制端连接一个视频编码器9(Video enoder,其型号是SAA7105) 用于视频输出;所述先入先出存储器与一个通用异步串行收发器6 (UART,其 型号是MAX3243) 、 DB9接口依次连接,眼睛定位结果也可以RS232串口协议 形式从DB9接口输出。本实施例中,所述的眼睛定位装置匹配有眼睛定位算法软件及数据,该软 件及数据存放在可擦写存储器中,该软件及数据包括单只眼睛检测器、眼睛对 分类器,眼睛定位算法所需要的常数、眼睛检测器参数及眼睛对分类器参数。 可擦写存储器中还存放DSP程序代码。本实施例中,所述的摄像装置可以是摄像头、数码相机、数字摄像机中的 一种。所述的摄像装置还可以是能够采集模拟视频信号的电子器件。参见图4,本专利技术的眼睛定位装置的左面连接摄像头10,本专利技术的眼睛定位装置的右面连接台式计算机11。本实施例中的数字信号处理器是一种特别适合于进行数字信号处理运算 的微处理器,该微处理器是美国德州仪器(Texas Instruments, Ti)公司生 产的专用高性能多媒体处理器,其主要应用是实时快速地实现各种数字信号处 理算法。基于这种数字信号处理器设计的软件系统具有灵活、精确、稳定性好、 抗干扰强、设备尺寸小、造价低、速度快等突出优点,非常适用于场地受限、稳定性要求高的应用领域。本专利技术的工作原理如下输入的模拟视频信号经过视频解码器处理后量化 成4:2:2的YUV数字视频信号;送入数字信号处理器处理并进行眼睛定位;一方面,处理后的数字视频信号通过视频编码器变成PAL格式的模拟视频信号以 便显示器或液晶电视等设备显示;另--方面,数字信号处理器通过其本身所具 有的以太网接口与以太网收发器连接,实现了 RJ45以太网络接口,可以将眼 睛定位结果通过以太网输出;眼睛定位结果也可以以RS232串口协议从DB9接 口输出;复杂可编程逻辑器件则对视频编码器、视频解码器和数字信号处理器 实现同步复位、片选和读写操作等方面的控制;同步动态随机存储器用于眼睛 定位算法运行提供内存支持。对一张检测到的人脸图像,本专利技术首先利用输入人脸图像在竖本文档来自技高网...

【技术保护点】
一种用于复杂背景图像的眼睛定位装置,其特征在于:包括一个数字信号处理器(2),该数字信号处理器配置有先入先出存储器(5)、同步动态随机存储器(3)、可擦写存储器(4)、复杂可编程逻辑器件(8)、定位算法软件及数据;所述数字信号处理器的以太网接口与以太网收发器(7)连接,用于眼睛定位结果输出;所述数字信号处理器的信号输入端连接一个视频解码器,该视频解码器输入端连接摄像装置用于图像数据采集;所述复杂可编程逻辑器件的控制端连接一个视频编码器用于视频输出;所述先入先出存储器与一个通用异步串行收发器(6)、DB9接口依次连接,用于眼睛定位结果输出。

【技术特征摘要】

【专利技术属性】
技术研发人员:张进王贤良刘晓春丁晓青
申请(专利权)人:北京海鑫科金高科技股份有限公司
类型:发明
国别省市:11[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利