一种用于手机的可以对特定词进行语音输入的方法技术

技术编号:3549598 阅读:202 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种用于手机的语音输入方法。独到之处在于,第一,语音输入是基于词汇的,而非基于句子。第二,精心选择有限的常用词汇集合来预置在手机中,作为输入的限制,只有语音输入这些预先选择的词汇,手机识别系统才会正确辨识用户的语音而转化成相应的文本。第三,这个精选的词汇集合是手机出厂前就已经预置好的了,不需要用户自己创建,但用户可以将自己额外常用的词汇添加进去。这样的发明专利技术,方便了用户信息的输入,并且提高了整个输入的速度。

【技术实现步骤摘要】

本专利技术公开的是一种用于手机的语音输入的方法,具体地说涉及一种基 于词汇输入的,并且是限定输入词汇范围的一种方法。
技术介绍
手机已经越来越成为人们生活中必备的产品了。它使得人们的沟通更加 顺畅。对于手机的输入方法,目前最常见的两种是键盘输入法和手写输入法。 这两种输入法己经能够满足大部分人群的输入需求。但是,也分别有一定的 局限性。例如,键盘输入法主要包括的拼音输入法,对于不熟悉拼音的人, 或者发音不标准的人来说,会有很大的困难。笔画法也存在一些笔画拆分的 困难及人脑与发音不协调的障碍,所以没有得到广泛应用。而且对于一些没 有键盘或只有几个简单按键的手机来说,就无法使用键盘输入法了。手写输 入的优点是只要会写字,就可以输入,但必须会写字,由于文化水平的差异, 还存在很多字大家不会写。另外,对于没有触摸屏的手机,手写的方法就没 用了。看到了上面两种方法,人们往往会提出是否可以做到用户只要对着手机 说出自己要输入的语言,手机通过识别算法,将其转化成文本。这样只要手 机有麦克,就没有其它限制了。而且做得好的话,还会对方言进行类似的识 别。不过,这个想法,我们需要先看看可行性有多大?同一个想法,最简单的比较就是目前发展更快的计算机,因为计算机的 运行速度远远高于手机,主要原因手机是手持设备,需要在功耗及携带方便 性上做文章。所以在计算机上无法完成的事情,很难在手机这种处理能力相对低下的平台上实现。记得2008年初,微软曾经提到了计算机发展的下一代, 将能够进行语音输入。但那是下一代,需要算法和芯片处理能力同歩大幅提 高才行。所以言外之意就是目前技术,无法实现真正的语音输入。所以手机上也是不能的。中文语音输入的研究工作早已展开,并且有了很大的进展,尽管离识别 人的自然说话还有很大差距。但目前的技术可以对限定的条目的语音片段进 行特征提取并在有限的条目集合中去比对选择概率最高的结果。现在的技术 能够将有限的条目集合做得越来越大,当然是在保证相应速度的前提下。另外,通过对人常输入的词汇来进行研究,当然有更专业的研究机构, 大概的情况是目前人们常用的词汇有三千个左右,这三千个词能够覆盖一般语料的86%,五千个常用词可以覆盖91%,八千个则可以覆盖95%。这是十分 振奋人心的统计。我们可以通过这个,来降低语音识别的难度,又不太大地 降低识别的质量。基于上述考虑,想到了语音识别技术中,非特定人的限定范围的输入方 法。这是一个理念,就像人们要实现语音识别一样,早就有人想过,但如何 实现,基本上没人去做。本专利技术正是从这个公开的理论思路出发,选择了适 当的简化,来达到在手机这样处理能力不强的设备上,完成人们大部分常用 词语的输入。这项技术,在国外,尤其是大公司,可能过多地考虑识别率的 问题,所以没有真正研究并实用到手机上。这也是本专利技术的主要局限性,即 会有一定的识别率问题。目前能够达到的水平在90%左右,基本能够满足大 部分人的需要,尤其是无法使用键盘和手写输入时。另外,不能输入所有的 词,也是本方法的局限。但结合着手机其它输入方法,这种语音输入方法能 够起到非常好的作用。而且速度上要比键盘和手写要快,当然不一定能和键 盘发烧友相比了。
技术实现思路
为解决这个问题,本专利技术提出了一种用于手机的可以对特定词进行语音 输入的方法,从而引入了 一种非常方便有效的输入法。在手机中需要进行文本输入的地方,用户按某一专用键启动语音识别系 统,手机提示用户读出要输入的文本,用户语音输入完成后,系统对输入的 语音提取特征,然后与手机中已有的特定词的特征逐一进行比对,找到最相 近的一个条目,并将其相对应的词汇文本反馈在手机进行文本输入的地方,反馈给用户。如果相差甚远,可以反馈查找失败。以上过程中,要进行文本输入的地方,是指手机中包括短信,彩信,Email, 记事本,日程表等功能的进行文本输入的地方。以上所述的语音识别系统的启动,是用户在文本输入的地方,按了一个 专用键之后进行的。专用键可以是手机上的任何一个按键,包括但不限于方 向键,确认键,侧面的按键,数字键,功能键,左右软键等。以上所述的提示用户读出要输入的文本,其提示的方式可以是用语音提 示或者用显示文本进行提示。以上所述的系统对输入的语音提取特征,这是一个相对宽泛的概念,即 目前在语音识别及人工智能等领域可能使用的特征提取的方法,来将用户的 语音抽象成特征。以上所述的手机中已有的特定词,是指手机厂家在手机出厂前就预置在 手机中的特定词以及用户在购得手机后输入的有别于厂家预置的词。而且所述的特定词,是有个数限制的,个数的限制主要考虑了下面两个方面首先,基于目前手机处理芯片的处理速度及识别算法的优化程度;其次,基于语言 学中对常用词汇的统计。本专利技术要求的个数的上限限制在2000到6000范围 内。即特定词的个数上限为2000到6000。本方法中的特定词的个数没有下 限。而且个数越少,识别率越高。另外,所述的特定词,是有文字个数限制 的,本专利技术要求对于每一个特定词,其中文文字的个数为最大不超过4。以上所述的找到最相近的一个条目,是指语音特征值最相近的一个,但 如果最相近的特征值的差异超出一定范围,也可以返回查找失败,提示用户 找不到。当然了,如果相近的几个都差异不大的话,还可以提供用户更多的 候选项供选择。以上所述的反馈在手机进行文本输入的地方,是指既可以用显示屏来显 示结果,也可以通过语音朗读的方式,将识别的词汇文本朗读出来。附图说明图1是本专利技术的整体流程示意图;具体实施方式下面结合实例与附图进一步说明本专利技术的实施方式。 本专利技术的整体流程示意图,如附图1所示。具体实施歩骤如下 歩骤一,用户进入手机中需要进行文本输入的地方,例如短信,彩信,Email,记事本,日程表等功能的进行文本输入的地方。歩骤二,用户按某一专用键启动语音识别系统,专用键可以是手机上的任何一个按键,包括但不限于方向键,确认键,侧面的按键,数字键,功能键,左右软键等。步骤三,手机提示用户读出要输入的文本。提示的方式可以是用语音提 示或者用显示文本进行提示。歩骤四,用户语音输入完成后,系统对输入的语音提取特征,这是一个 相对宽泛的概念,即目前在语音识别及人工智能等领域可能使用的特征提取 的方法,来将用户的语音抽象成特征。步骤五,与手机中已有的特定词的特征逐一进行比对。手机中已有的特 定词,是指手机厂家在手机出厂前就预置在手机中的特定词以及用户在购得 手机后输入的有别于厂家预置的词。而且所述的特定词,是有个数限制的, 个数的限制主要考虑了下面两个方面首先,基于目前手机处理芯片的处理 速度及识别算法的优化程度;其次,基于语言学中对常用词汇的统计。本发 明要求的个数的上限限制在2000到6000范围内。即特定词的个数上限为 2000到6000。本方法中的特定词的个数没有下限。而且个数越少,识别率越 高。另外,所述的特定词,是有文字个数限制的,本专利技术要求对于每一个特 定词,其中文文字的个数为最大不超过4。歩骤六,找到最相近的一个条目,即语音特征值最相近的一个,并将其 相对应的词汇文本反馈在手机进行文本输入的地方,反馈给用户。但如果最 相近的特征值的差异超出一定范围,也可以返回查找失败,提示用户找不到。 反馈可以用显示屏来显示本文档来自技高网
...

【技术保护点】
一种用于手机的可以对特定词进行语音输入的方法,其特征在于:    在手机中需要进行文本输入的地方,用户按某一专用键启动语音识别系统,手机提示用户读出要输入的文本,用户语音输入完成后,系统对输入的语音提取特征,然后与手机中已有的特定词的特征逐一进行比对,找到最相近的一个条目,并将其相对应的词汇文本反馈在手机进行文本输入的地方,反馈给用户。如果相差甚远,可以反馈查找失败。

【技术特征摘要】

【专利技术属性】
技术研发人员:王剑
申请(专利权)人:飞图科技北京有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利