当前位置: 首页 > 专利查询>浙江大学专利>正文

一种集光、振动刺激于一体的语音信号输出装置及方法制造方法及图纸

技术编号:16588570 阅读:99 留言:0更新日期:2017-11-18 16:28
本发明专利技术公开了一种集光、振动刺激于一体的语音信号输出装置,包括:原始信号采集存储单元,用于采集个体发出的原始语音信号;语音识别单元,用于实时分析由原始信号采集单元存储的数字语音信号;目标语言翻译单元,用于将语音识别单元分析处理后的语言信号,翻译成对应的语言文字;盲文转换单元,用于将目标语言翻译单元翻译的文字,转化为相应的盲文;目标语言输出单元,可输出具有凹凸感,字形所在平面振动柱小振幅振动,通过触觉感知的表面可发光的文字或盲文。本发明专利技术装置,体积小巧,处理信息速度快,操作方便,传递信息准确,可以用于普通人与聋盲人、聋哑人交流。

A speech signal output device and method with light collection and vibration stimulation

The invention discloses a light, vibration stimulation in one voice signal output device includes: signal acquisition storage unit for the original speech signal issued by the individual; a speech recognition unit for real-time analysis of speech signal by digital signal acquisition unit storage; target language translation unit for speech recognition unit analysis of speech signal processing after the translation into the corresponding language; Braille conversion unit for the target language translation unit translates the text into the corresponding Braille; the target language output unit, the output with the concavity, the column shaped small amplitude vibration in a plane surface, through tactile luminous words or braille. The device of the invention has the advantages of small size, fast processing information, convenient operation and accurate information transmission, and can be used for common people to communicate with deaf blind people and deaf mutes.

【技术实现步骤摘要】
一种集光、振动刺激于一体的语音信号输出装置及方法
本专利技术涉及声学领域,具体涉及一种集光、振动刺激于一体的语音输出装置及方法。
技术介绍
语言是人类特有的功能,声音是人类常用的工具,是相互传递信息最重要也是最基本的手段。声音是由物体的振动产生,以声波的形式在介质中传播,介质主要可分为固体、液体以及气体。声波振动内耳的听小骨,它就是我们觉察到的声音。随着科学技术的发展,语音识别技术也越来越成熟。语音识别技术是将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或字符序列。计算机分析语言信号的目的是为方便有效提取表示语音信号所携带的信息,这种方法所需要的准确度是由语音中特定信息决定。一个完整的语音信号识别系统分为三部分:语音信号预处理与特征提取;声学模型与模式匹配;语言模型与语言处理。目前,语音识别技术被广泛应用。其中,较为常见的是利用数字信号处理器(DSP)与相关语音识别算法(如:HMM,深度学习)相结合来实现的。由于DSP芯片特殊的硬件构造,其在数字信号处理方面有很大优势,主要表现为能够快速有效的实现各种类型的数字信号处理的算法。其强大的计算能力使得其以数字的形式来完成对信号变换、滤波、估值、增强、压缩、识别等处理,并给出期望的输出形式。20世纪60年代,DSP技术才日趋成熟。在现实生活中几乎所有的信号均是模拟信号,因此用户必须将模拟信号转换为数字信号才能被数字处理器所用。模拟信号即是一系列连续的变量,现实生活中模拟信号处处可见,如说话时声音的强度,光照强度,压力等。并且人类可以感知各种不同的模拟信号,如耳朵来感知声音的强度,用眼睛来感知光照的强度等。当人类器官接收到诸如此类的模拟信号时,将它们转化为电信号,之后把它们送到人类的处理器即大脑当中。在语音识别系统中,需选用DSP处理器来完成对语音信号的处理。由于DSP处理器是以数字的形式来完成对语音信号进行处理,所以首先必须通过A/D转化器将语音信号数字化。随着语音处理技术的快速发展,人类之间交流可以不受时间、空间约束。然而,部分因身体器官有缺陷的人类,尤其是聋哑人和聋盲人,却无法享受这种便利。因此,急需发展方便残障人士(如聋哑人、聋盲人等)与普通人之间语言交流的装备。国内专利号为CN202601031U,名称为“一种便于聋盲人士与普通人的沟通翻译设备”的专利,其包括内存储有翻译程序的翻译主机,翻译主机连接有用于普通人和聋哑人输入信息的输入终端以及用于盲人输出输入盲人可识别形式信息的点字终端。该设备可以将普通人的语音信息、手势信息以及通过键盘、手写板输入的文字信息转换为盲人可识别的点字和聋哑人识别的手语,同时也可以将盲人发出的点字和聋哑人的手语信息转换为普通人可识别的文字信息和语音信息,可极大方便普通人与盲人之间的沟通。上述专利所涉及的一种便于聋盲人士与普通人士的沟通翻译设备,但其不能将语言文字或盲文实时以具有凹凸感、字形表面作小振幅振动,可触觉感知的表面发光文字或盲文形式输出。
技术实现思路
本专利技术的目的是提供一种集光、振动刺激于一体的语音信号输出装置及方法,该装置体积小巧,便于携带且处理信息迅速,用于普通人与聋哑人、聋盲人之间的交流。一种集光、振动刺激于一体的语音信号输出装置,包括:原始信号采集存储单元,用于采集个体发出的原始语音信号,经模数(A/D)转换后,以数字信号形式存储;语音识别单元,用于实时分析由原始信号采集存储单元存储的数字语音信号,采用既有语音识别算法,识别原始语音信号的具体语言信息;目标语言翻译单元,用于将语音识别单元分析处理后的语音信息,翻译成对应的语言文字;盲文转换单元,用于将目标语言翻译单元翻译的语言文字,转化为相应的盲文;目标语言输出单元,将由目标语言翻译单元、盲文转换单元得到的语言文字或盲文,利用可上下伸缩的n×n根振动柱形成的方形阵列,输出具有凹凸感、字形所在平面振动柱小振幅振动、且可通过触觉感知的文字或盲文。所述的原始信号采集存储单元利用声音传感器将声信号转变为电信号,电信号经放大器放大和A/D转换后,得到数字语音信号。所述的语音识别单元通过数字信号处理器(DSP)和既有语音识别算法识别原始语音信号中包括的具体语言信息。其中,DSP为TMS320C5000DSP系列的DSP。在目标语言输出单元中,所述的可上下伸缩振动柱阵列中的振动柱为顶端为半球形的圆柱型振动柱。每个振动柱的顶端具有光源,可以发光。所述的光源可以为led灯。每个振动柱直径在1~3mm之间,高度在3~50mm之间,两个振动柱之间的距离小于3mm。所述的可上下伸缩的n×n根振动柱形成的方形阵列大于16×16的阵列。由于人体能感受到的振动频率为1~80Hz,因此字形所在平面内各振动柱作小振幅振动,振动频率应小于80Hz,振幅小于5mm。所述的目标语言输出单元的工作原理如下:可上下伸缩的n×n根振动柱形成的方形阵列利用机械和电路驱动原理工作。可上下伸缩的n×n根振动柱形成的方形阵列通过接口接收目标语言翻译单元或者盲文转化单元发送的控制命令;再通过目标语言输出单元的处理,从字库或者盲文库中寻找与指定的文字或盲文地址相对应的图像编码首列地址(振动柱凸出)或末列地址(振动柱凹进去),如此一列一列找出编码送往振动柱顶端的驱动电路,控制振动柱伸缩形成相应的表面发光的文字或盲文。另一方法,本专利技术还提出了一种集光、振动刺激于一体的语音信号输出方法,该方法利用上述的输出装置,具体为:(1)原始信号采集存储单元采集个体发出的原始语音模拟信号,并通过A/D转换器将原始语音模拟信号转换为数字信号,然后对数字信号进行存储;(2)语音识别单元对接收到的数字信号进行分析预处理、并进行特征参数提取,再与语音识别单元本身所携带的模板库进行匹配,最后得到识别结果;(3)目标语言翻译单元对接收到的识别结果进行转化,转化为相对应的汉字;(4)目标语言翻译单元直接控制目标语言输出单元输出具有凹凸感,字形所在平面振动柱小振幅振动,通过触觉感知的表面可发光的文字;(5)盲文转换单元对接收的汉字转换为相应的盲文;然后通过与目标语言输出单元相连接,控制目标语言输出单元输出具有凹凸感,字形所在平面振动柱小振幅振动,通过触觉感知的表面可发光的盲文。附图说明图1为本专利技术集光、振动刺激于一体的语音信号输出装置的结构示意框图。具体实施方式为了更为具体地描述本专利技术,下面结合附图及具体实施方式对本专利技术的技术方案进行详细说明。参见图1,本专利技术的输出装置包括以下5个单元:原始信号采集存储单元:利用声传感器将声信号转变为电信号,电信号经放大器放大和A/D转换后,得到数字化语音信号并存储;语音识别单元:利用DSP和既有语音识别算法识别原始语音信号中包括的具体语言信息。其中,DSP为TMS320C5000DSP系列的DSP,用于分析由原始信号采集单元经A/D转换传输的数字信号。目标语言翻译单元:将语音识别单元分析处理后的语音信号翻译成对应的语言文字;盲文转换单元:将目标语言翻译单元翻译的语言文字转化为相应的盲文;目标语言输出单元:将由目标语言翻译单元和盲文转换单元得到的目标语言文字或盲文,利用可上下伸缩的n×n根振动柱形成的方形阵列,输出具有凹凸感、字形所在平面振动柱小振幅振动、且可通过触觉感知的可发光文字或盲文本文档来自技高网
...
一种集光、振动刺激于一体的语音信号输出装置及方法

【技术保护点】
一种集光、振动刺激于一体的语音信号输出装置,其特征在于,包括:原始信号采集存储单元,用于采集个体发出的原始语音信号,经模数转换后,以数字信号形式存储;语音识别单元,用于实时分析由原始信号采集存储单元存储的数字语音信号,采用既有语音识别算法,识别原始语音信号的具体语言信息;目标语言翻译单元,用于将语音识别单元分析处理后的语音信息,翻译成对应的语言文字;盲文转换单元,用于将目标语言翻译单元翻译的语言文字,转化为相应的盲文;目标语言输出单元,将由目标语言翻译单元、盲文转换单元得到的语言文字或盲文,利用可上下伸缩的n×n根振动柱形成的方形阵列,输出具有凹凸感、字形所在平面振动柱小振幅振动、且可通过触觉感知的文字或盲文。

【技术特征摘要】
1.一种集光、振动刺激于一体的语音信号输出装置,其特征在于,包括:原始信号采集存储单元,用于采集个体发出的原始语音信号,经模数转换后,以数字信号形式存储;语音识别单元,用于实时分析由原始信号采集存储单元存储的数字语音信号,采用既有语音识别算法,识别原始语音信号的具体语言信息;目标语言翻译单元,用于将语音识别单元分析处理后的语音信息,翻译成对应的语言文字;盲文转换单元,用于将目标语言翻译单元翻译的语言文字,转化为相应的盲文;目标语言输出单元,将由目标语言翻译单元、盲文转换单元得到的语言文字或盲文,利用可上下伸缩的n×n根振动柱形成的方形阵列,输出具有凹凸感、字形所在平面振动柱小振幅振动、且可通过触觉感知的文字或盲文。2.如权利要求1所述的集光、振动刺激于一体的语音信号输出装置,其特征在于,所述的原始信号采集存储单元利用声音传感器将声信号转变为电信号,电信号经放大器放大和A/D转换后,得到数字语音信号。3.如权利要求1所述的集光、振动刺激于一体的语音信号输出装置,其特征在于,所述的语音识别单元利用数字信号处理器和既有语音识别算法相结合,识别原始语音信号中包含的具体语言信息。4.如权利要求3所述的集光、振动刺激于一体的语音信号输出装置,其特征在于,所述的数字信号处理器为TMS320C5000DSP系列。5.如权利要求1所述的集光、振动刺激于一体的语音信号输出装置,其特征在于,所述的可上下伸缩振动柱阵列中的振动柱为顶端为半球形的圆柱型振动柱。6...

【专利技术属性】
技术研发人员:翟国庆赵春侠
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1