个人专用同声传译装置制造方法及图纸

技术编号:4908095 阅读:298 留言:0更新日期:2012-04-11 18:40
一种个人专用同声传译装置,属针对个人同步翻译的智能装置,尤其适用于解决发音困难者的交流问题。其组成包括,信号采集单元:通过话筒或振动传感器方式采集人的声音信号,对于发声困难的人士可以采集其发声动作的振动信号;自动识别单元:接收信号采集单元输出的编码信号并通过模板样本的方法进行识别;输出单元:根据自动识别单元所识别的模式,可以通过语音合成方法合成语音显示输出或输出成为一种有规律的振动信号或输出成为盲文;控制单元:控制系统的信号采集、识别、输出;模板样本为可不断训练的特定人声音特征库,它能准确识别特定人的语音,尤其适用于残障人士的振动发声,并将转换为相应的标准语言加以输出。(*该技术在2019年保护过期,可自由使用*)

【技术实现步骤摘要】

本技术涉及自动声音识别技术,特别是针对个人的同步翻译的智能装置,同时适用于非失声"哑巴"的同声传译。
技术介绍
自动声音识别技术(Automatic Sound Recognition)的目标是让计算机或设备能 够"听写"出人所说出的声音,以实现相应的自动处理功能。长期以来,自动声音识别技术 主要针对健全人的语音识别,也就是自动语音识别(AutomaticSpeech Recognition简称 "ASR")很少涉及到残障人士的声音(或振动)的识别。利用自动声音(振动)识别技术 可以帮助残障人士进行人工辅助发声。并且,利用该技术可以实现丰富的针对性同步传送 翻译功能。 自动声音识别通常有以下几种分类方法,按系统的用户情况分特定人和非特定 人识别系统;按系统词汇量分小词汇量、中词汇量和大词汇量系统;按声音的输入方式 分孤立词、连接词、连续语音系统等。 目前,自动声音识别技术的发展,一方面向着非特定人大词汇量连续语音识别方 向进行,可以使得普通人能够方便的进行语音的识别和处理;另一方面对特定人的识别,特 殊声音的识别处理也成为了重要的发展方向。
技术实现思路
本技术的目的是提供一种专用于残障人士声音或振动识别的个人专用同声 传译装置。 本新型的目的是这样实现的一种个人专用同声传译装置,包括,控制单元控制 系统的信号采集、识别、输出;还具有 信号采集单元与自动识别单元和输出单元连接,通过话筒或振动传感器方式采 集人的声音信号,对于发声困难的人士可以采集其发声动作的振动信号,并将该声音信号 或振动信号编码后输出; 自动识别单元接收信号采集单元输出的编码信号并通过模板样本的比对方法进 行识别,该模板样本为可不断训练的特定人声音特征库; 输出单元根据自动识别单元所识别的模式,可以通过语音合成方法合成语音显 示输出或输出成为一种有规律的振动信号或输出成为盲文; 上述输出单元由TTS芯片0SYN6188组成;上述信号采集单元由WM8731声音编码 /解码芯片以及FPGA EP2S15芯片组成,且前者的输出信号经A/D转换器接至后者输入端, 后者的输出信号回送至前者的输入端,同时输出到由TTS芯片0SYN06188组成的输出单元。 对于有语音残障的人来说,其无法发出正常的语音,所以语音识别不可能用于语 音残障人的声音的识别。我国的俗语"十聋九哑","哑"的实质是"聋",聋哑者其发音及构 成语音器官一般多属正常,只是长期听不到声音,最终造成不能发出正确语音。 实际上每个人只要能发出声音,每个声音都有属于其个人的声音特征,代表其特 定的意义,如果听者没有相同的语音体系时,就无法听懂该声音的意义;就象我们听不懂某 些地方口音一样。从训练动物的经验来说,通常能听到语音的动物能理解主人的声音意义, 但一般无法理解非主人的声音。本专利技术实现的智能电子设备,就象一条训练有素的狗, 能自动准确识别所属个人的声音,只要该设备所有人能发出声音即可。设备所有人将终身 训练该智能设备,经过专人训练的设备不能为他人所用。 利用自动声音识别技术,不管语音是否正常,只要能发出电子设备能"听"到的不 同声音,或者通过其它信号检测技术"听"到说话者的信号,即可准确识别声音的意义,在此 基础上再结合语音合成技术,就可以实现针对性同步传送翻译功能。这样也就解决了那些 可发声"哑巴"说话的问题。 本专利技术人针对特定人的声音识别,其识别率、安全性等方面都优于非特定人的声 音识别;同时声音识别的范畴也广于语音识别,使得不能正常进行语言交流的人群,利用特 定人的声音振动转换为相应的标准语音输出成为可能。 该技术的典型应用,可以用于发音障碍人士的辅助发声。通过训练,只要发出有规 律的声音(不是语音)或者仅仅是一种振动,将该模式的振动与想要输出的文字联系起来, 在使用时只要再次作出同样的发声动作,就可以利用该技术识别出来,并且把定义好的文 字采用TTS技术用机器合成语音进行播放。也可以采用其它方式进行输出,同时训练是自 定义的,因此可以根据需要定义出训练者的具体含意。 本技术具有以下特点 1、直接或间接采集说话人的声音信号。如果是先天性哑巴、发音障碍人士,则通过 面部耳骨或喉咙处检测振荡信号,而不需要真正采集声带发声。该设备扩展后,可以检测任 何模式的振动信号,从而实现有规律的振动信号转化为设定语音的目的,使人能利用机器 进行任意的辅助发声。 2、采用数字信号处理技术,过滤非设备持有人的信号,针对性的提取所有人的声 音特征信号。 3、与设备内训练好的个人声音特征库进行匹配,输出个人指定的语音信号,包含 其它语言的输出、指定声音的输出等功能。 4、对于听力障碍人士,可以通过耳机输出足够的音量,或者转换为低频率的机械 振动,来剌激设备持有人,达到训练听觉或实现辅助听觉设备的作用。 5、此设备为个人专用,设备经过训练后,只听译持有人的信号,对未经训练的第二 人使用无效。 6、具有译字译句的功能,方便的中/英机器发声系统。 7、设备具有智能训练功能,可以根据需要进行随时的添加、删除、修改机器识别模 式、输出模式等功能。 8、配有触摸式液晶屏,操作方便。 9、该专利变形后可以嵌入各种电子应用设备中。 本技术的有益效果是 当前的语音识别技术都追求通用性,希望能识别所有人的语音,做到一机多人使 用。而本专利正好相反,尽最大可能, 一机专用,它使得不能正常进行语言交流的人群,利4用特定人的声音振动转换为相应的标准语音输出成为可能,同时能在很差的背景噪声中使 用,以更高的识别准确率满足专人使用的要求。附图说明图1是本新型系统工作原理框图; 图2是本新型系统结构图; 图3是图2所示一个实施例的结构框图。具体实施方式本技术主要包含了以下关键部分声音或振动信号的采集,采集信号的自动 识别,采集到的信号的翻译输出;涉及到主要技术有声音特征的提取(采用小波特征)、自 动识别、TTS(Text-To-Speech)技术自动合成人工语音。 图l示出,系统组成 (1)信号采集单元与自动识别单元和输出单元连接,采用话筒(或振动传感器) 采集人的声音信号,对于发声困难的人士可以采集其发声动作的振动信号并将该声音信号 或振动信号编码后输出; (2)自动识别单元接收信号采集单元输出的编码信号并通过模板样本的比对方 法进行识别;识别特定人的发声模式特征与特征库(即可不断训练的特定人声音特征库, 并以之作为模板样本)中的样本比较,识别出相应的发声动作,该设备针对个人专用,在使 用中可以不断加入个人新的模式,使得功能不断丰富扩大; (3)输出单元根据自动识别单元所识别的模式,由预先(训练时)定义好的方式 进行输出,可以通过人工合成方法合成语音或显示输出或输出成为一种有规律的振动信号 或输出成为盲文; (4)控制单元控制系统的信号采集、使用、识别、训练、输出等。 图3示出,信号采集单元由欧胜微电子公司的丽8731声音编码/解码芯片以及FPGA EP2S15芯片组成(可扩展使用其它型号的FPGA),前者的输出信号经A/D转换器接至后者输入端,后者的输出信号回送至前者的输入端,同时输出到由TTS芯片0SYN06188组成的输出单元,话筒声音输入经WM8731的A/D转换编码后,传本文档来自技高网...

【技术保护点】
一种个人专用同声传译装置,包括,控制单元:控制系统的信号采集、识别、输出;其特征是,还具有:信号采集单元:与自动识别单元和输出单元连接,通过话筒或振动传感器方式采集人的声音信号,对于发声困难的人士可以采集其发声动作的振动信号,并将该声音信号或振动信号编码后输出;自动识别单元:接收信号采集单元输出的编码信号并通过模板样本的比对方法进行识别,该模板样本为可不断训练的特定人声音特征库;输出单元:根据自动识别单元所识别的模式,可以通过语音合成方法合成语音显示输出或输出成为一种有规律的振动信号或输出成为盲文;上述输出单元由TTS芯片OSYN6188组成;上述信号采集单元由WM8731声音编码/解码芯片以及FPGAEP2S15芯片组成,且前者的输出信号经A/D转换器接至后者输入端,后者的输出信号回送至前者的输入端,同时输出到由TTS芯片OSYNO6188组成的输出单元。

【技术特征摘要】

【专利技术属性】
技术研发人员:郑郁正张杰
申请(专利权)人:成都信息工程学院
类型:实用新型
国别省市:90[中国|成都]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1