【技术实现步骤摘要】
本专利技术涉及一种语音信号处理,特别是一种只有有限存储量的手持小型电子装置中的东方语言,如普通汉语、日语、韩语等的自动语音识别(ASR)。
技术介绍
自动语音识别(ASR)技术已经发展了几十年。一个例子是个人计算机中的大词汇量连续语音识别系统(LVCSR)。参照图1,LVCSR系统1通常使用一声音前端,该前端包括用于特征提取的频谱分析模块15和音调分析16,和具有上下文关联模型和语言模型的发音字典,以识别信号。由于用于上下文关联模型和语言模型的大量参数要被处理,因此LVCSR系统1的计算和存储工作量很大。对具有有限存储量的小型装置,如个人数字助理(PDA)、移动电话、无线电话以及电子字典等中使用的传统语音识别技术来说,声音特征和具有码本设计的语音/字典模型被典型地用来识别语音输入模式。这些技术对东方语言,如普通汉语、日语、韩语等特别有用。虽然LVCSR系统1已经得到发展,而且对个人计算机用户来说已经比较成熟,但它仍然具有缺陷,如声音特征、语音识别器的感应器易于受到恶劣环境中背景噪声的干扰。另一方面,LVCSR系统1识别错误率的下降主要归因于输入字词序列的知识,即特定语言发音者最常使用的所谓的语言模型。这样,LVCSR系统1不可避免的需要大的存储容量和计算工作以处理输入的字词序列。这样,LVCSR系统1就不再适用于具有有限存储能力的小型电子装置,特别是在恶劣环境中。本专利技术技术方案在研究用于恶劣环境中的传统LVCSR技术时,本专利技术的专利技术人发现很难在性能不降低的情况下设计出连续语音中的语言模型;单独语音较连续语音更易识别;单独语音中的元音较辅音更 ...
【技术保护点】
一种用于东方语言的口语语音输入的电子装置,该语音具有辅音加元音加音调或元音加音调的音节结构,所述电子装置包括: 一语音接收器,用于接收表示所述口语语音的语音信号; 一预处理装置,与所述语音接收器相连,用于提取所述语音信号的语音特征; 一包括多个键的键盘装置,其中各键上分配有包括辅音和元音的音素中的至少一个音素; 声音匹配装置,用于根据所述语音信号的语音特征和随后通过所述键盘装置获得的音素来识别所述语音的各音节;和 单独音节匹配装置,用于根据声音匹配装置输出的各音节和通过所述键盘顺序键入的音素,识别所述口语语音中包含多个音节的各字词。
【技术特征摘要】
EP 2000-12-22 00204815.51.一种用于东方语言的口语语音输入的电子装置,该语音具有辅音加元音加音调或元音加音调的音节结构,所述电子装置包括一语音接收器,用于接收表示所述口语语音的语音信号;一预处理装置,与所述语音接收器相连,用于提取所述语音信号的语音特征;一包括多个键的键盘装置,其中各键上分配有包括辅音和元音的音素中的至少一个音素;声音匹配装置,用于根据所述语音信号的语音特征和随后通过所述键盘装置获得的音素来识别所述语音的各音节;和单独音节匹配装置,用于根据声音匹配装置输出的各音节和通过所述键盘顺序键入的音素,识别所述口语语音中包含多个音节的各字词。2.根据权利要求1所述的电子装置,其特征在于各键分配有至少一个音素,使得分组在多个键的各键上成组的音素的距离平方和与多个键间的音素的距离平方和之和为最大。3.根据权利要求1所述的电子装置,其特征在于当发出各音节时,按压对应口语语音中各音节的第一音素(最好为一辅音)的键。4.根据权利要求1所述的电子装置,其特征在于电子装置是从包括蜂窝电话、无线电话、电子字典、个人数字助理和电子表的组中选出的。5.根据权利要求1所述的电子装置,其特征在于口语语音是由至少一多音节字词组成的单独语音。6.根据权利要求3中所述的电子装置,其特征在于口语语音中各音节的第一音素为一辅音。7.一种具有一显示单元的电子装置,包括一语音接收装置,用于接收表示具有辅音加元音或元音的音节结构的东方语言中的口语语音的语音信号;一具有多个键的数字键盘,其中包括元音和辅音的音素中的至少一个被分配到并可视地表示在各键上或各键的附近区域;一语音识别装置,用于根据通过所述数字键盘随后输入的音素和由所述语音接收装置接收到的口语语音,识别所述口语语音中的东方字词;和用于将所述口语语音中的东方字词显示在所述显示单元上的装置。8.根据权利要求7所述的电子装置,其特征在于根据分组在多个键的各键上的多个音素的距离平方和与多个键间的多个音素的距离平方和之比为最大的原则向各键上分配至少一个音素,从而使东方语言更有效地通过所述数字键盘和所述语音接收装置输入。9.一种在通过数字键盘按键输入的帮助下识别东方语言语音的方法,其特征在于所述东方语音具有辅音加元音或元音的音节结构,且所述数字键盘具有多个键,所述方法包括以下步骤(a)输入表示所述语音的语音信号;(b)从所述语音信号中提取语音特征;(c)当发出各音节时,通过所述数字键盘随后接收对应所述语音中各音节的第一音素的键的信息;(d)根据所述语音信号的语音特征和步骤(c)中随后接收到的音素,识别所述语音的各音节;(e)根...
【专利技术属性】
技术研发人员:CH黄,
申请(专利权)人:皇家菲利浦电子有限公司,
类型:发明
国别省市:NL[荷兰]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。