当前位置: 首页 > 专利查询>南京大学专利>正文

一种面向移动终端的超声波唇读识别装置及方法制造方法及图纸

技术编号:14777950 阅读:129 留言:0更新日期:2017-03-09 13:57
本发明专利技术公开了一种面向移动终端的超声波唇读识别装置及方法,装置包括超声波发送模块、超声波接收模块和信号处理模块;方法具体为超声波发送模块发送超声波信号,超声波信号在被嘴部反射后,由超声波接收模块接收,信号处理模块处理超声波接收模块获取的反射超声波信号以得到该信号的特征向量,根据特征向量识别口型,得到匹配结果。本发明专利技术的有益效果为:以移动终端作为超声波发送和接收模块,在无需额外硬件定制的基础上,利用超声波感知的能力识别唇语,拓展了超声波技术的应用场景,克服了传统唇读识别技术的不足,具有广泛的应用场景。

【技术实现步骤摘要】

本专利技术涉及移动行为感知
,尤其是一种面向移动终端的超声波唇读识别装置及方法
技术介绍
现有技术中,移动终端上的行为感知技术被普遍应用,如呼吸检测、手势识别等,这种移动感知是一种更加智能化的人机交互方式。而唇读则是行为感知技术中更为细粒度的识别技术,是一项通过考察人们说话时嘴的运动模式,以此提高计算机的理解能力的技术。传统的唇读技术往往基于设备携带的传感器或者相机,借助移动设备携带的声学传感器进行语音识别,虽然能够精确的解释语音内容轻松实现唇读,但算法主要依赖于图像的质量,复杂度高。
技术实现思路
本专利技术所要解决的技术问题在于,提供一种面向移动终端的超声波唇读识别装置及方法,对来自嘴部的反射信号进行特征提取匹配,实现唇读识别。为解决上述技术问题,本专利技术提供一种面向移动终端的超声波唇读识别装置,包括超声波发送模块、超声波接收模块和信号处理模块;超声波发送模块发送超声波信号,超声波信号在被嘴部反射后,由超声波接收模块接收,信号处理模块处理超声波接收模块获取的反射超声波信号以得到该信号的特征向量,根据特征向量识别口型,得到匹配结果。优选的,超声波发送模块为移动终端的扬声器,超声波接收模块为移动终端的麦克风,均支持19KHz的超声波信号。优选的,信号处理模块包括时间记录单元、预处理单元、唇动分割单元、特征提取单元、唇语识别单元、模型训练单元和口型基元库;时间记录单元记录每次发射超声波信号与接收超声波信号的时间差,预处理单元对超声波接收模块获取的反射超声波信号进行滤波得到唇动反射信号,唇动分割单元将唇动反射信号以单音节为单位分割成若干个单音节信号序列,特征提取单元针对每个单音节信号序列提取并处理对应口型的特征参数形成唇动特征向量,口型基元库应用特征提取单元提取的12种音节的特征参数,确立为12种基本口型,唇语识别单元调用口型基元库匹配所有单音节信号序列分量的结果,模型训练单元对分量匹配结果进行联合学习。一种面向移动终端的超声波唇读识别方法,包括如下步骤:(1)超声波发送模块发送19KHz的超声波信号,同时信号处理模块的时间记录单元开始计时;(2)超声波接收模块接收来自嘴部的超声波反射信号,并将反射信号传递到信号处理模块,同时信号处理模块的时间记录单元停止计时;(3)信号处理模块的预处理单元对超声波接收模块的反射超声波信号进行滤波,从原始超声波反射信号中分离出唇动引起的反射信号即唇动反射信号,传递唇动反射信号给唇动分割单元;(4)唇动分割单元对唇动反射信号进行分割,以单音节为单位进行分割,得到的音节信号序列传递给特征提取单元;(5)特征提取单元检测每一个音节信号序列分量对应的特征参数,形成唇动特征向量;特征提取单元处理所有音节信号序列分量后,将每个分量的唇动特征向量传递给唇语识别单元;(6)唇语识别单元对当前唇动特征向量进行识别,调用口型基元库,与口型基元库中的单口型唇动特征向量样本相匹配,根据口型基元库中单口型与音节的对应关系、单口型与特性向量对应关系,对当前唇动特征向量进行分类匹配,将所有分量匹配结果传递给模型训练单元进一步识别;(7)模型训练单元基于马尔科夫假设,应用概率统计模型对分量匹配结果进行联合学习,结合语法规则集和基于上下文的纠错,统计具有最大概率的句子序列集,并输出为最终唇读结果。优选的,步骤(4)中,唇动分割单元对唇动信号进行分割包括词内分割和词间分割;对唇动信号进行词间分割时,通过检测单词间存在的较为明显的停顿,设置一个长为Tms的滑动窗口,每次向前滑动kms个单位,满足2k≤T,当检测到连续两次滑动窗口内不存在信号时,判断当前为停顿,为词间分割点;对唇动信号进行词内分割时,计算信号中19KHz的主频峰的个数n,根据个数对信号进行n均等词内分割。优选的,步骤(5)中的特征参数包括持续时间和频移;时间记录单元记录的发射超声波和接收超声波的时间差作为持续时间。优选的,步骤(5)中的频移特征提取步骤如下:(1)采用快速傅里叶变换FFT计算主要频峰E和周围频带范围内的所有峰值点,主要频峰E为19KHz处的峰值,将小于19KHz的频段内的峰值存放入峰前数组F,大于19KHz频段内的峰值点存放在峰后数组A中;(2)设置主要频峰和次要频峰的阈值比例k,扫描得到的频峰值数组A、F,若存在高于k·E的频峰值,则说明存在次要频峰,次要频峰即唇动引入的第二大频峰值;(3)当确定了次要频峰位置后,进一步对主要、次要频峰作差,得到唇动对应的频移Δf。优选的,步骤(7)中的模型训练单元应用概率统计模型统计最大概率的句子序列集,具体步骤如下:(1)初始化概率统计模型的参数:口型状态O,定义为包括口型基元库中12种基本口型;音节状态S,即输出识别结果,定义为12种口型对应的所有元音辅音音节;转移概率P(Oi→Oj),从口型状态Oi转移到口型状态Oj的概率;传输概率P(Si|Ok,Sj),当后一个音节状态为Sj,当前口型状态为Ok情况下,输出音节状态为Si的概率;(2)组合所有分量匹配结果时,第i个分量识别为音节状态Si的概率与前一个口型状态Oi-1、当前口型状态Oi、后一个分量识别的音节状态Si+1有关;具有最大概率的音节状态即作为当前分量的识别结果;即P(Si)=P(Oi-1→Oi)·P(Si|Oi,Si+1)(3)以此类推,计算到最后一个分量的识别结果,求解出对应的具有最大概率的序列S1S2...Si...Sn-1Sn。本专利技术的有益效果为:以移动终端作为超声波发送和接收模块,在无需额外硬件定制的基础上,利用超声波感知的能力识别唇语,拓展了超声波技术的应用场景,克服了传统唇读识别技术的不足,具有广泛的应用场景。附图说明图1是本专利技术的整体装置结构示意图。图2是本专利技术的方法流程图。图3是本专利技术的移动终端配置示意图。图4是本专利技术的特征提取流程图。图5是本专利技术的应用概率统计模型识别唇读示意图。图6是本专利技术的口型状态数字标号与口型、音节对应关系图。图7是本专利技术的口型状态转移关系图。图8是本专利技术的口型状态到音节状态转移关系图。具体实施方式如图1所示,一种面向移动终端的超声波唇读识别装置,包括超声波发送模块、超声波接收模块和信号处理模块;超声波发送模块发送超声波信号,超声波信号在被嘴部反射后,由超声波接收模块接收,信号处理模块处理超声波接收模块获取的反射超声波信号以得到该信号的特征向量,根据特征向量识别口型,得到匹配结果。超声波发送模块为移动终端的扬声器,超声波接收模块为移动终端的麦克风,均支持19KHz的超声波信号。信号处理模块包括时间记录单元、预处理单元、唇动分割单元、特征提取单元、唇语识别单元、模型训练单元和口型基元库;时间记录单元记录每次发射超声波信号与接收超声波信号的时间差,预处理单元对超声波接收模块获取的反射超声波信号进行滤波得到唇动反射信号,唇动分割单元将唇动反射信号以单音节为单位分割成若干个单音节信号序列,特征提取单元针对每个单音节信号序列提取并处理对应口型的特征参数形成唇动特征向量,口型基元库结合汉语的发音特征,应用特征提取单元提取的12种音节的特征参数,确立为12种基本口型,唇语识别单元调用口型基元库匹配所有单音节信号序列分量的结果,模型训练单元对分量匹配结果进行联合学习。如图1和2所示,一种面向移本文档来自技高网...
一种面向移动终端的超声波唇读识别装置及方法

【技术保护点】
一种面向移动终端的超声波唇读识别装置,其特征在于,包括:超声波发送模块、超声波接收模块和信号处理模块;超声波发送模块发送超声波信号,超声波信号在被嘴部反射后,由超声波接收模块接收,信号处理模块处理超声波接收模块获取的反射超声波信号以得到该信号的特征向量,根据特征向量识别口型,得到匹配结果。

【技术特征摘要】
1.一种面向移动终端的超声波唇读识别装置,其特征在于,包括:超声波发送模块、超声波接收模块和信号处理模块;超声波发送模块发送超声波信号,超声波信号在被嘴部反射后,由超声波接收模块接收,信号处理模块处理超声波接收模块获取的反射超声波信号以得到该信号的特征向量,根据特征向量识别口型,得到匹配结果。2.如权利要求1所述的面向移动终端的超声波唇读识别装置,其特征在于,超声波发送模块为移动终端的扬声器,超声波接收模块为移动终端的麦克风,均支持19KHz的超声波信号。3.如权利要求1所述的面向移动终端的超声波唇读识别装置,其特征在于,信号处理模块包括时间记录单元、预处理单元、唇动分割单元、特征提取单元、唇语识别单元、模型训练单元和口型基元库;时间记录单元记录每次发射超声波信号与接收超声波信号的时间差,预处理单元对超声波接收模块获取的反射超声波信号进行滤波得到唇动反射信号,唇动分割单元将唇动反射信号以单音节为单位分割成若干个单音节信号序列,特征提取单元针对每个单音节信号序列提取并处理对应口型的特征参数形成唇动特征向量,口型基元库应用特征提取单元提取的12种音节的特征参数,确立为12种基本口型,唇语识别单元调用口型基元库匹配所有单音节信号序列分量的结果,模型训练单元对分量匹配结果进行联合学习。4.一种面向移动终端的超声波唇读识别方法,包括如下步骤:(1)超声波发送模块发送19KHz的超声波信号,同时信号处理模块的时间记录单元开始计时;(2)超声波接收模块接收来自嘴部的超声波反射信号,并将反射信号传递到信号处理模块,同时信号处理模块的时间记录单元停止计时;(3)信号处理模块的预处理单元对超声波接收模块的反射超声波信号进行滤波,从原始超声波反射信号中分离出唇动引起的反射信号即唇动反射信号,传递唇动反射信号给唇动分割单元;(4)唇动分割单元对唇动反射信号进行分割,以单音节为单位进行分割,得到的音节信号序列传递给特征提取单元;(5)特征提取单元检测每一个音节信号序列分量对应的特征参数,形成唇动特征向量;特征提取单元处理所有音节信号序列分量后,将每个分量的唇动特征向量传递给唇语识别单元;(6)唇语识别单元对当前唇动特征向量进行识别,调用口型基元库,与口型基元库中的单口型唇动特征向量样本相匹配,根据口型基元库中单口型与音节的对应关系、单口型与特性向量对应关系,对当前唇动特征向量进行分类匹配,将所有分量匹配结果传递给模型训练单元进一步识别;(7)模型训练单元基于马尔科夫假设,应用概率统计模型...

【专利技术属性】
技术研发人员:王晓亮谭佳瑶陆桑璐
申请(专利权)人:南京大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1