汉语语音输入系统及方法技术方案

技术编号:6990445 阅读:219 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种汉语语音输入系统,语音识别控制器同语音采集及输入电路、声母韵母识别模块、拼音识别模块、显示器分别相连;语音识别控制器根据语音采集及输入电路输入的语音信号以及声母韵母识别模块,得到一个声母韵母序列;语音识别控制器根据拼音识别模块,以及所述得到的一个声母韵母序列,输出一个或多个候选汉字序列到显示器,然后根据用户输入的选择信息输出其中的一个候选汉字序列。本发明专利技术还公开了一种汉语语音输入方法。本发明专利技术的汉语语音输入系统及方法识别率高。

【技术实现步骤摘要】

本专利技术涉及语音识别技术,特别涉及一种。
技术介绍
随着电子技术的发展,目前个人手持式设备不断向功能丰富与体积小巧的方向发 展,小巧的机身中往往集成了众多的办公、娱乐及互联网应用。丰富的功能往往需要更加丰 富、便捷的交互方式,而受体积、便携式电源等物理条件的限制,设备上无法预留足够的资 源为交互所需的物理设备所用,这样就对人机交互的方式提出了更高的要求——如何在有 限的硬件设备资源的前提下,尽可能为用户提供方便、快捷以及功能丰富的交互方式,就成 了决定一个手持式产品生命力的重要特征。目前手持式设备上的输入方式,多是通过键盘(Keypad)或触摸屏(Touch screen)。为了给用户提供交互方式,往往需要通过为某种操作预留特定的输入键的方式来 进行用户与设备之间的交互。对于一些复杂的操作,在设备上无法预留过多的输入键,只 能通过复用某些操作键以及组合一些操作键的方式来实现,或者通过复杂的菜单分级的策 略,用户往往要进行多次菜单操作才能实现所需的功能。这些输入方式,一来容易引起误操 作,二则实现的功能依然有限,无法满足用户的实际需求。另外,对于某些特殊设备,如目前市场上刚刚出现的电子墨水屏幕,尽管其对用户 的眼睛提供了最佳防护,但是受目前技术水平的限制,刷新率较低,对用户的输入反馈很慢 (延迟约1秒)。例如当用户需要通过键盘输入一个“黄”字时,需要进行5次操作“huang”, 累计延时将在6秒以上,这样的速度显然是无法满足用户实际需求的。与传统的通过键盘以及触摸屏输入方式不同,语音输入作为一种最自然的交互方 式,无需占用额外的硬件及尺寸方面的资源,只通过一个简单的麦克风,即可实现动态扩展 的虚拟界面,完成多达上万种输入操作。这样,对于一款手持式设备上的所有操作,都可以 通过语音输入来实现,无需对某种功能指定特殊的键,因而在不增加设备外观尺寸的前提 下,能最大程度的丰富手持式设备的交互乐趣。而且这种交互直接在后台进行,避免了由于 图形界面的延迟对用户体验方面造成的不利影响。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或 命令的技术。语音识别是一门交叉学科,所涉及的领域包括信号处理、模式识别、概率论和 信息论、发声机理和听觉机理、人工智能等等。近二十年来,语音识别技术取得显著进步,开 始从实验室走向市场,已经进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品 等诸多领域。语音输入系统,包括语音采集及输入电路、模式库、声学模式匹配规则、语音识别 控制器,语音识别控制器根据声学模式匹配规则(如某种距离测度、专家知识(如构词规 则、语法规则、语义规则等),计算输入语音信号特征与模式库中的模式之间的相似度,判断 出输入语音的语意信息。常规的汉语语音输入系统,是使用完全的语音识别,是以带调拼音为单位,直接根据汉字的发音识别出具体汉字或汉语语句,即将输入的语音直接同模式库中的模式进行匹 配,匹配通过后直接将模式库中的该模式对应的汉字及汉语语句作为输入语音的汉语语意 信息输出,由于以带调拼音为单位可供利用的自然语言信息较少,汉语识别准确率比较低, 只能实现一些特定口令的识别。
技术实现思路
本专利技术要解决的技术问题是提供一种,汉语文字识别的 准确率高。为解决上述技术问题,本专利技术的汉语语音输入系统,包括语音采集及输入电路、声 母韵母识别模块、拼音识别模块、语音识别控制器、显示器;所述语音识别控制器同语音采集及输入电路、声母韵母识别模块、拼音识别模块、 显示器分别相连;所述声母韵母识别模块用于声母韵母识别,所述语音识别控制器根据语音采集及 输入电路输入的语音信号以及声母韵母识别模块,得到一个声母韵母序列;所述拼音识别模块用于汉字拼音识别,所述语音识别控制器根据拼音识别模块, 以及所述得到的一个声母韵母序列,输出M个候选汉字序列到显示器,M为正整数,然后根 据用户输入的选择信息输出其中的一个候选汉字序列。所述声母韵母识别模块,可以包括汉语拼音声母韵母模式库、声学模式匹配单元, 所述汉语拼音声母韵母模式库用于设置各声母韵母的模式,所述声学模式匹配单元用于将 语音信号同各声母韵母的模式进行声学匹配配置信度打分,所述语音识别控制器根据所述 声学模式匹配单元对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式 库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各 声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及 韵母声学匹配置信度综合得分排序最高的一个声母韵母序列,所述语音识别控制器根据拼 音识别模块,以及所述声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的一 个声母韵母序列,输出M个候选汉字序列到显示器。所述声母韵母识别模块,可以包括汉语拼音声母韵母模式库、声学模式匹配单元、 汉字拼音声母韵母组合单元,所述汉语拼音声母韵母模式库用于设置各声母韵母的模式, 所述声学模式匹配单元用于将语音信号同各声母韵母的模式进行声学匹配配置信度打分, 所述汉字拼音声母韵母组合单元用于对声母韵母序列中的声母韵母进行声母韵母组合打 分,所述语音识别控制器根据所述声学模式匹配单元对所述语音采集及输入电路输入的语 音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语 音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度 得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的N个声母韵母 序列,N为正整数;然后所述语音识别控制器根据所述汉字拼音声母韵母组合单元对所述N 个声母韵母序列中的各声母韵母进行声母韵母组合打分,并根据声母声学匹配置信度及韵 母声学匹配置信度综合得分、声母韵母组合得分得到所述N个声母韵母序列的声学声韵得 分,得到声学声韵得分最高的一个声母韵母序列,然后所述语音识别控制器根据拼音识别 模块,以及所述声学声韵得分最高的一个声母韵母序列,输出M个候选汉字序列到显示器。所述声母韵母识别模块,还可以包括韵母识别置信度修正单元,所述韵母识别置 信度修正单元用于将声母韵母序列中的声学匹配置信度得分低于设定值的韵母去除,所述 语音识别控制器根据所述韵母识别置信度修正单元,将所述声学声韵得分最高的一个声母 韵母序列中的声学匹配置信度得分低于设定值的韵母去除,得到经过韵母识别置信度修正 的一个声母韵母序列,然后所述语音识别控制器根据所述拼音识别模块及所述经过韵母识 别置信度修正的一个声母韵母序列,输出M个候选汉字序列到显示器。所述拼音识别模块,可以包括汉语字词库、汉字拼音单元,所述汉语字词库用于设 置各汉语字词,所述汉字拼音单元用于将声母韵母序列识别为汉语字词库中的汉语字词序 列,所述语音识别控制器根据所述汉字拼音单元及汉语字词库将所述得到的一个声母韵母 序列识别为M个候选汉字序列输出到显示器。所述拼音识别模块,可以包括汉语字词库、汉字拼音单元、汉语文法单元,所述汉 语字词库用于设置各汉语字词,所述汉字拼音单元用于将声母韵母序列识别为汉语字词库 中的汉语字词序列,所述汉语文法单元用于对汉字序列进行汉语文法选择,所述语音识别 控制器根据所述汉字拼音单元及汉语字词库将所述得到的一个声母韵本文档来自技高网
...

【技术保护点】
一种汉语语音输入系统,其特征在于,包括语音采集及输入电路、声母韵母识别模块、拼音识别模块、语音识别控制器、显示器;所述语音识别控制器同语音采集及输入电路、声母韵母识别模块、拼音识别模块、显示器分别相连;所述声母韵母识别模块用于声母韵母识别,所述语音识别控制器根据语音采集及输入电路输入的语音信号以及声母韵母识别模块,得到一个声母韵母序列;所述拼音识别模块用于汉字拼音识别,所述语音识别控制器根据拼音识别模块,以及所述得到的一个声母韵母序列,输出M个候选汉字序列到显示器,M为正整数,然后根据用户输入的选择信息输出其中的一个候选汉字序列。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄伟
申请(专利权)人:盛大计算机上海有限公司
类型:发明
国别省市:31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1