实时动态嘴唇跟踪方法技术

技术编号：5351775 阅读：394 留言：0更新日期：2012-04-11 18:40

一种图像处理和模式识别技术领域的方法，特别是一种实时动态嘴唇跟踪方法。包括：通过数码摄像机拍摄并获取包含嘴唇区域在内的图像序列；通过基于模糊聚类和卡尔曼预测的连续图像嘴唇分割方法，将图像中所有像素点分为嘴唇像素点或非嘴唇像素点，并输出所有像素点属于嘴唇像素点的概率；通过１４点动态形状模型和卡尔曼预测，在步骤二提供的嘴唇概率分布图的基础上，获取嘴唇图像序列中每一帧中的嘴唇轮廓，本发明专利技术能够自动跟踪图像序列中嘴唇的运动，具有较高的处理速度（保证实时性）和识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及的是一种图像处理和模式识别
的方法，特别是一种实时动态嘴唇跟踪方法。
技术介绍
近年来，自动化语音识别技术(Automatic speech recognition，ASR)取得了长足的进步，并形成了一系列较为成熟的产品，能够在信噪比较高的环境下得到较好的识别效果。然而，这些系统的性能往往受制于背景噪声的程度，在重噪声环境下，如车内、工厂、机场等等，这些系统所取得的效果常常不能令人满意。于是，越来越多的学者从音频以外的信源寻求提高语音识别效果的方法。McGurk效应(the McGurk effect)揭示了说话人讲述过程中声/视觉信息之间存在着密不可分的内在联系。因此，人们想到通过引入嘴唇运动这一视觉信息，辅助完成对于讲述内容的理解，该类语音识别系统称为自动化唇读系统。在上述系统中，首要并且最为关键的一个步骤是准确、快速地从视频中获取嘴唇运动变化情况，即实时嘴唇跟踪方法。其准确性和可靠性往往直接决定了一个唇读系统的性能优劣。经过对现有技术文献的检索发现，A+Caplier在第11届国际图像分析和处理大会 (Proceedings of 1 Ith International Conference on Image Analysis and Processing, page 8-13) 上发表的“嘴唇区域检测和跟踪”(Lip detection and tracking)，该文采用亮度边缘强度为检测嘴唇轮廓的标准，通过迭代的方法将嘴唇边缘收敛至最强边缘处。同时在合理嘴唇模型的限定下，保证了最终得到嘴唇模型的合理性。...

【技术保护点】
一种实时动态嘴唇跟踪方法，其特征在于，包括如下步骤：步骤一，通过数码摄像机拍摄并获取包含嘴唇区域在内的图像序列；步骤二，通过基于模糊聚类和卡尔曼预测的连续图像嘴唇分割方法，将图像中所有像素点分为嘴唇像素点或非嘴唇像素点，并输出所有像素点属于嘴唇像素点的概率；步骤三，通过１４点动态形状模型和卡尔曼预测，在步骤二提供的嘴唇概率分布图的基础上，获取嘴唇图像序列中每一帧中的嘴唇轮廓。

【技术特征摘要】

【专利技术属性】
技术研发人员：王士林，李建华，刘功申，李翔，李生红，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：31

全部详细技术资料下载我是这个专利的主人