一种面向移动终端的超声波唇读识别装置及方法制造方法及图纸

技术编号：14777950 阅读：129 留言：0更新日期：2017-03-09 13:57

本发明专利技术公开了一种面向移动终端的超声波唇读识别装置及方法，装置包括超声波发送模块、超声波接收模块和信号处理模块；方法具体为超声波发送模块发送超声波信号，超声波信号在被嘴部反射后，由超声波接收模块接收，信号处理模块处理超声波接收模块获取的反射超声波信号以得到该信号的特征向量，根据特征向量识别口型，得到匹配结果。本发明专利技术的有益效果为：以移动终端作为超声波发送和接收模块，在无需额外硬件定制的基础上，利用超声波感知的能力识别唇语，拓展了超声波技术的应用场景，克服了传统唇读识别技术的不足，具有广泛的应用场景。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及移动行为感知
，尤其是一种面向移动终端的超声波唇读识别装置及方法。
技术介绍
现有技术中，移动终端上的行为感知技术被普遍应用，如呼吸检测、手势识别等，这种移动感知是一种更加智能化的人机交互方式。而唇读则是行为感知技术中更为细粒度的识别技术，是一项通过考察人们说话时嘴的运动模式，以此提高计算机的理解能力的技术。传统的唇读技术往往基于设备携带的传感器或者相机，借助移动设备携带的声学传感器进行语音识别，虽然能够精确的解释语音内容轻松实现唇读，但算法主要依赖于图像的质量，复杂度高。
技术实现思路
本专利技术所要解决的技术问题在于，提供一种面向移动终端的超声波唇读识别装置及方法，对来自嘴部的反射信号进行特征提取匹配，实现唇读识别。为解决上述技术问题，本专利技术提供一种面向移动终端的超声波唇读识别装置，包括超声波发送模块、超声波接收模块和信号处理模块；超声波发送模块发送超声波信号，超声波信号在被嘴部反射后，由超声波接收模块接收，信号处理模块处理超声波接收模块获取的反射超声波信号以得到该信号的特征向量，根据特征向量识别口型，得到匹配结果。优选的，超声波发送模块为移动终端的扬声器，超声波接收模块为移动终端的麦克风，均支持19KHz的超声波信号。优选的，信号处理模块包括时间记录单元、预处理单元、唇动分割单元、特征提取单元、唇语识别单元、模型训练单元和口型基元库；时间记录单元记录每次发射超声波信号与接收超声波信号的时间差，预处理单元对超声波接收模块获取的反射超声波信号进行滤波得到唇动反射信号，唇动分割单元将唇动反射信号以单音节为单位分割成若干个单音节信号序列...
一种面向移动终端的超声波唇读识别装置及方法

【技术保护点】
一种面向移动终端的超声波唇读识别装置，其特征在于，包括：超声波发送模块、超声波接收模块和信号处理模块；超声波发送模块发送超声波信号，超声波信号在被嘴部反射后，由超声波接收模块接收，信号处理模块处理超声波接收模块获取的反射超声波信号以得到该信号的特征向量，根据特征向量识别口型，得到匹配结果。

【技术特征摘要】
1.一种面向移动终端的超声波唇读识别装置，其特征在于，包括：超声波发送模块、超声波接收模块和信号处理模块；超声波发送模块发送超声波信号，超声波信号在被嘴部反射后，由超声波接收模块接收，信号处理模块处理超声波接收模块获取的反射超声波信号以得到该信号的特征向量，根据特征向量识别口型，得到匹配结果。2.如权利要求1所述的面向移动终端的超声波唇读识别装置，其特征在于，超声波发送模块为移动终端的扬声器，超声波接收模块为移动终端的麦克风，均支持19KHz的超声波信号。3.如权利要求1所述的面向移动终端的超声波唇读识别装置，其特征在于，信号处理模块包括时间记录单元、预处理单元、唇动分割单元、特征提取单元、唇语识别单元、模型训练单元和口型基元库；时间记录单元记录每次发射超声波信号与接收超声波信号的时间差，预处理单元对超声波接收模块获取的反射超声波信号进行滤波得到唇动反射信号，唇动分割单元将唇动反射信号以单音节为单位分割成若干个单音节信号序列，特征提取单元针对每个单音节信号序列提取并处理对应口型的特征参数形成唇动特征向量，口型基元库应用特征提取单元提取的12种音节的特征参数，确立为12种基本口型，唇语识别单元调用口型基元库匹配所有单音节信号序列分量的结果，模型训练单元对分量匹配结果进行联合学习。4.一种面向移动终端的超声波唇读识别方法，包括如下步骤：(1)超声波发送模块发送19KHz的超声波信号，同时信号处理模块的时间记录单元开始计时；(2)超声波接收模块接收来自嘴部的超声波反射信号，并将反射信号传递到信号处理模块，同时信号处理模块的时间记录单元停止计时；(3)信号处理模块的预处理单元对超声波接收模块的反射超声波信号进行滤波，从原始超声波反射信号中分离出唇动引起的反射信号即唇动反射信号，传递唇动反射信号给唇动分割单元；(4)唇动分割单元对唇动反射信号进行分割，以单音节为单位进行分割，得到的音节信号序列传递给特征提取单元；(5)特征提取单元检测每一个音节信号序列分量对应的特征参数，形成唇动特征向量；特征提取单元处理所有音节信号序列分量后，将每个分量的唇动特征向量传递给唇语识别单元；(6)唇语识别单元对当前唇动特征向量进行识别，调用口型基元库，与口型基元库中的单口型唇动特征向量样本相匹配，根据口型基元库中单口型与音节的对应关系、单口型与特性向量对应关系，对当前唇动特征向量进行分类匹配，将所有分量匹配结果传递给模型训练单元进一步识别；(7)模型训练单元基于马尔科夫假设，应用概率统计模型...

【专利技术属性】
技术研发人员：王晓亮，谭佳瑶，陆桑璐，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人