一种基于脸部肌音信号的无声信息识别系统技术方案

技术编号:9142692 阅读:122 留言:0更新日期:2013-09-12 04:19
本发明专利技术涉及一种基于脸部肌音信号的无声信息识别系统,包括:传感器,采集脸部动作信号;信号调理电路,与传感器连接,对传感器采集的信号进行稳压、电压缩放处理;单片机,与信号调理电路连接,接收经信号调理电路处理后的信号,并对该信号依次进行信号预处理、特征提取处理和动作分类处理,输出分类结果;上位机接收端,与单片机连接,接收单片机的动作分类结果并显示。与现有技术相比,本发明专利技术具有结构简单、便捷性好、可实现无声信号实时准确传递等优点。

【技术实现步骤摘要】
一种基于脸部肌音信号的无声信息识别系统
本专利技术涉及一种无声信息识别装置,尤其是涉及一种基于脸部肌音信号的无声信息识别系统。
技术介绍
早在第二次世界大战以前,科学家们就对在十分嘈杂的环境中实现通信颇感兴趣,而推动这项事业前进的动力来自军事需求。最著名的研究就是怎样实现飞行员之间以及飞行员与指挥中心的语音通信。起初,科学家们采用喉部微麦克风实现在嘈杂的环境中进行通信。后来,随着该领域的深入,科学家们逐渐的把重心放在了对生物信号的研究上。20世纪90年代末,美国国家航空航天局(NASA)在一个名为“延长人类感官的倡议”的计划中,埃姆斯研究中心(AmesResearchCenter)采用EMG(electromyography,肌电图)作为信号源,对人与人之间以及人与机器之间的通信手段做了系统的评估。1997年,埃姆斯研究中心的科学家们设想利用EEG和EMG实现人对机器的控制以及人与人之间的通信,并设计了实验对其进行了探索。2003年,该研究中心发现,采用EMG作为单信号源也可以实现预期的实验目标,并实现了该技术在消防队员之间通信的应用。2009年12月22日在达拉斯举行的德州仪器开发者会议上,Ambient公司(伊利诺斯州Champaign)的CEO兼创始人之一MichaelCallahan演示了Audeo——一个能够将有意识的神经冲动转换成数字信息并随后将该信息转换成合成语音的方案。Audeo技术通过一个绑在人们脖子上的无线传感器,来捕捉由大脑传送给声带的神经活动,然后通过模拟数字技术把它转化为语言,这个技术的本质就是从大脑获取神经信息并转换成语音,信号源为EEG(electroencephalograph,脑电图)。2010年3月2日,在德国汉诺威国际信息及通信技术博览会展出一种“无声电话”,可把嘴唇活动即时转化为电脑发声。使用这种电话,人们无需发声就能让电话另一端的人听清说话内容,避免喋喋不休地打扰他人。这种电话由德国卡尔斯鲁厄技术学院研发,通过电极监测记录人讲话时嘴部肌肉活动变化,并转化成电脉冲后再变为电脑发声。这一过程中,讲话者无需发出任何声音。由此可见,目前无声信息传递技术的信号源一般是EEG或EMG,并取得了一定的成果,但无声信息传递技术的发展仍处于初期阶段,还不能得到广泛的实际应用。由于EEG是非常复杂的,目前对它的研究还仅限于开发简单的脑机接口装置,距离临床使用还有很长的距离。而EMG又非常微弱(仅uV级),表面电极检测出的肌电信息并不能完全反映人脑对某一动作的运动指令,而人体感受到的外电场干扰又相对十分强大(达V级),这些因素都会影响到无声信息传递技术的准确性。因此,适合的信号源对推进无声信息传递技术的发展至关重要,本专利技术就将对以肌音信号作为信号源来实现无声信息传递,这种信号对采集设备要求较低,容易形成产品产业化。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种结构简单、便捷性好、可实现无声信号实时准确传递的基于脸部肌音信号的无声信息识别系统。本专利技术的目的可以通过以下技术方案来实现:一种基于脸部肌音信号的无声信息识别系统,包括:传感器,采集脸部动作信号;信号调理电路,与传感器连接,对传感器采集的信号进行稳压、电压缩放处理;单片机,与信号调理电路连接,接收经信号调理电路处理后的信号,并对该信号依次进行信号预处理、特征提取处理和动作分类处理,输出分类结果;上位机接收端,与单片机连接,接收单片机的动作分类结果并显示。所述的传感器为加速度传感器。所述的传感器的频率范围为0.5~1000Hz。所述的传感器设有两个,分别固定在脸部两侧的颊肌和咬肌相交处。所述的信号预处理包括依次进行的数字滤波处理、归一化处理和信号分割处理。所述的数字滤波处理通过FIR数字滤波器实现,所述的归一化处理通过线性函数转换实现。所述的信号分割处理具体为:1)通过滑动窗将归一化处理后的信号分割为多个部分;2)计算当前滑动窗内信号的短时帧方差和绝对均值,判断短时帧方差和绝对均值是否均超过相应的阈值,若是,则执行步骤3),若否,则执行步骤4);3)判断动作开始发生并记录动作开始时间,然后提取其后规定长度的信号作为动作信号段;4)移动至下一滑动窗,返回步骤2)。所述的特征提取处理提取的特征包括绝对均值、方差、斜率改变次数、过零率、均方根、AR模型估计量、高阶累积量、功率谱参数、倒谱系数和功率谱非负矩阵分解系数。所述的动作分类处理具体为:根据特征提取的特征值采用训练好的二次分类器进行动作识别分类。所述的二次分类器的训练过程如下:令X是训练样本集,它有L个特征列,类别标记为Υ={1,2,…,n},n为类别总数,通过以下公式计算训练样本x属于哪一类:J(x)=xTAx+bTx+cA、b、c是由训练样本集X得到的系数矩阵;那么对一输入的测试样本y∈Y,如果y对应的函数值Jy是所有类别中的最大值,那么y即被分类到类别为yt∈Υ中:与现有技术相比,本专利技术具有以下优点:(1)利用肌音信号实现无声信息传递,设备技术相对简单,易于实现产业化;(2)本专利技术系统采用的结构体积小巧,上位机接收端可采用笔记本电脑等便捷设备,具备一定便携性;(3)本专利技术通过单片机的多特征提取、二次分类器分类等信号处理过程可实现无声信息准确地、实时地传递。附图说明图1为本专利技术的结构示意图;图2为本专利技术肌音信号分割处理示意图;图3为本专利技术工作流程示意图。具体实施方式下面结合附图和具体实施例对本专利技术进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。如图1所示,一种基于脸部肌音信号的无声信息识别系统,包括依次连接的传感器1、信号调理电路2、单片机3和上位机接收端4。1)传感器1,采集脸部动作信号。传感器是整个硬件系统中最为核心的器件,传感器的选择遵循以下几点原则:足够的灵敏度和分辨力。一般的声音传感器能够响应的最小频率大概在200Hz左右,而肌音信号的主要频段为0-50Hz。因此该系统推荐采用响应频率覆盖肌音信号频段,灵敏度适中,重量轻盈,体积微小的加速度信号传感器,如北京颐松公司的TD-3型压电式腿动信号微加速度信号传感器,其响应频率范围0.5~1000Hz,灵敏度150mV/G,重量小于20g。所述的传感器设有两个,分别固定在脸部两侧的颊肌和咬肌相交处。2)信号调理电路2,与传感器1连接,对传感器采集的信号进行稳压、电压缩放处理。在本系统中由传感器采集的电压信号需通过单片机的A/D转换功能转换为数字信号,要求采集的电压信号稳定尽量少毛刺,并且电压范围在单片机可接收电压范围之内。如当传感器采集信号范围为-5~5v,而单片机接收范围为0~3v,此时系统信号调理电路需要同时具备稳压、电压抬升和缩放的功能,使传感器采集的信号范围转变为0~3v。3)单片机3,与信号调理电路2连接,接收经信号调理电路处理后的信号,并对该信号依次进行信号预处理、特征提取处理和动作分类处理,输出分类结果。系统中单片机作用是对传感器采集的信号进行处理并分类,要求其具备一定的运算能力。如采用ARM-Cortex-M3开发板,该单片机具有开源易于编程,运算能力强大的优点,能很好的满足系统对信号处理和分类本文档来自技高网
...
一种基于脸部肌音信号的无声信息识别系统

【技术保护点】
一种基于脸部肌音信号的无声信息识别系统,其特征在于,包括:传感器,采集脸部动作信号;信号调理电路,与传感器连接,对传感器采集的信号进行稳压、电压缩放处理;单片机,与信号调理电路连接,接收经信号调理电路处理后的信号,并对该信号依次进行信号预处理、特征提取处理和动作分类处理,输出分类结果;上位机接收端,与单片机连接,接收单片机的动作分类结果并显示。

【技术特征摘要】
1.一种基于脸部肌音信号的无声信息识别系统,其特征在于,包括:传感器,采集脸部动作信号,所述的传感器设有两个,分别固定在脸部两侧的颊肌和咬肌相交处;信号调理电路,与传感器连接,对传感器采集的信号进行稳压、电压缩放处理;单片机,与信号调理电路连接,接收经信号调理电路处理后的信号,并对该信号依次进行信号预处理、特征提取处理和动作分类处理,输出分类结果;上位机接收端,与单片机连接,接收单片机的动作分类结果并显示;所述的特征提取处理具体为:对经信号预处理后的两路传感器信号进行特征提取,并将提取到的两组特征值合并;所述的动作分类处理具体为:根据特征提取的特征值采用训练好的二次分类器进行动作识别分类;所述无声信息识别系统的运行流程为:利用传感器采集多组“a”“o”“e”“m”四种信号作为训练样本,进行信号预处理和特征提取处理,实现二次分类器的训练,将训练好的二次分类器移植到单片机中,单片机通过移植到单片机中采集任意单个已训练动作信号,进行处理并分类,实现双通道95.42±2.31%的识别正确率。2.根据权利要求1所述的一种基于脸部肌音信号的无声信息识别系统,其特征在于,所述的传感器为加速度传感器。3.根据权利要求1所述的一种基于脸部肌音信号的无声信息识别系统,其特征在于,所述的传感器的频率范围为0.5~1000Hz。4.根据权利要求1所述的一种基于脸部肌音信号的无声信息识别系统,其特征在于,所述的信号预处理包括依次进行的数字...

【专利技术属性】
技术研发人员:夏春明黄泽凡刘润泽蔡冰何阳
申请(专利权)人:华东理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1