语音识别方法和移动终端技术

技术编号:10015650 阅读:206 留言:0更新日期:2014-05-08 11:11
本申请提供了语音识别方法和移动终端。其中,该方法包括:建立语音特征模型库,所述语音特征模型库中存在至少一个用户的语音特征参数,并且,该存在的每一语音特征参数都存在对应的动作行为;移动终端接收用户提供的语音;移动终端对接收的语音进行分析,提取出语音中的语音特征参数,并确定语音特征模型库中是否存在与该提取出的语音特征参数相匹配的语音特征参数,如果是,识别该存在的语音特征参数对应的动作行为,执行该识别出的动作行为。

【技术实现步骤摘要】
【专利摘要】本申请提供了语音识别方法和移动终端。其中,该方法包括:建立语音特征模型库,所述语音特征模型库中存在至少一个用户的语音特征参数,并且,该存在的每一语音特征参数都存在对应的动作行为;移动终端接收用户提供的语音;移动终端对接收的语音进行分析,提取出语音中的语音特征参数,并确定语音特征模型库中是否存在与该提取出的语音特征参数相匹配的语音特征参数,如果是,识别该存在的语音特征参数对应的动作行为,执行该识别出的动作行为。【专利说明】语音识别方法和移动终端
本申请涉及语音识别领域,特别涉及语音识别方法和移动终端。
技术介绍
目前的语音识别技术都是基于语义识别的,其中,语义识别需要移动终端智能地理解用户输入语音的意图并做出正确的响应,这种语义识别涉及到语音输入的语言种类、不同声音的特征提取、以及语法形态等方面的分析。但是,世界上的语言种类非常之多,即便是世界上常用的语言,也有数十种之多,并且,人们的语言习惯不尽相同,生活化的语言习惯造成了语义识别在语法上的困扰,要想做到真正的智能语义识别非常困难。另外,语义识别也很难满足一些特定场所的语音识别要求。
技术实现思路
本申请提供了语音识别方法和移动终端,以避免采用语义解析进行语音识别所带来的诸多困难。本申请提供的技术方案包括:一种语音识别方法,包括:建立语音特征模型库,所述语音特征模型库中存在至少一个用户的语音特征参数,并且,该存在的每一语音特征参数都存在对应的动作行为;移动终端接收用户提供的语音;移动终端对接收的语音进行分析,提取出语音中的语音特征参数,并确定语音特征模型库中是否存在与该提取出的语音特征参数相匹配的语音特征参数,如果是,识别该存在的语音特征参数对应的动作行为,执行该识别出的动作行为。一种移动终2而,包括:存储单元,用于建立并存储建立语音特征模型库,所述语音特征模型库中存在至少一个用户的语音特征参数,并且,该存在的每一语音特征参数都存在对应的动作行为;接收单元,用于接收用户提供的语音;提取单元,用于对接收的语音进行分析,提取出语音中的语音特征参数;匹配单元,用于确定语音特征模型库中是否存在与该提取出的语音特征参数相匹配的语音特征参数;动作执行单元,用于在所述匹配单元的匹配结果为是时,识别语音特征模型库中与该提取出的语音特征参数相匹配的语音特征参数对应的动作行为,执行该识别出的动作行为。由以上技术方案可以看出,本专利技术中,在进行语音识别时,基于建立的语音特征模型库,而该语音特征模型库中存在语音特征参数和动作行为之间的对应关系,这样,就保证移动终端无需精确进行语义解析语音,仅提取语音中的语音特征参数即可,避免了由于语义解析带来的诸多问题。并且,本专利技术中,语音特征参数和动作行为之间的对应关系可由用户自定义的,这种方式将主动权交由给用户自身,解放了移动终端,节省资源。【专利附图】【附图说明】图1为本专利技术实施例提供的语音识别方法流程图;图2为本专利技术实施例提供的语音特征模型库建立流程图;图3为本专利技术实施例提供的步骤102实现流程图;图4为本专利技术实施例提供的移动终端结构图。【具体实施方式】为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。本专利技术提供的语音识别方法,可以帮助用户使用语音实现与移动终端的交互,并且,本专利技术中,在进行语音识别时依赖于之前建立的语音特征模型库,不会涉及到语义解析,相应地杜绝了由于语义解析带来的诸多问题比如语言之间的差别问题、以及语义语法的问题等。下面对本专利技术提供的语音识别方法进行描述:参见图1,图1为本专利技术实施例提供的语音识别方法流程图。如图1所示,该流程可包括以下步骤:步骤101,建立语音特征模型库。本步骤101中的语音特征模型库,其是移动终端通过机器学习的方式建立,具体在后文进行描述。优选地,本专利技术中,所述语音特征模型库中存在至少一个用户的语音特征参数,并且,该存在的每一语音特征参数都存在对应的动作行为。其中,每一语音特征参数对应的动作行为是用户自定义设置。步骤102,移动终端接收用户提供的语音,对接收的语音进行分析,提取出语音中的语音特征参数,并在语音特征模型库中识别出所述用户的所有语音特征参数,确定该识别出的所有语音特征参数中是否存在与该提取出的语音特征参数相匹配的语音特征参数,如果是,识别该存在的语音特征参数对应的动作行为,执行该识别出的动作行为。至此,完成图1所示流程。从图1所示流程可以看出,本专利技术中,主要是用户自定义语音的特征参数和动作行为,不像现有技术那样精确解析语音的语义,避免了由于进行语义解析而带来的诸多问题。其中,在用户自定义语音特征参数和动作行为时,该动作行为可为与语音不同甚至相反的行为,这便于实现语音暗号。这里,所谓语音暗号,其是用于触发移动终端执行某一特定动作或者调用某一特定应用程序的标识,比如,当移动终端接收到语音“亲爱的”时,通过解析该语音的特征参数识别出对应的动作行为为用于触发给xxxxxxxx拨打电话,则给XXXXXXXX拨打电话。下面对图1所示流程中的语音特征模型库进行详细描述:参见图2,图2为本专利技术实施例提供的语音特征模型库建立流程图。本专利技术中,针对一个用户可建立一个语音特征模型库,或者,多个用户共享同一个语音特征模型库,节省资源。如图2所示,该流程可包括以下步骤:步骤201,用户向移动终端输入语音。本专利技术中,在建立语音特征模型库时,为便于分析用户的语音习惯和使用特征,可根据情况控制用户输入语音的次数,比如,控制用户至少输入两次以上语义相同的语音等。优选地,本专利技术中,均以控制用户至少输入两次以上语义相同的语音为例。步骤202,移动终端针对接收的每一语音,对该语音进行语音处理,以使处理后的语音反映语音本质特征。本专利技术中,语音处理,至少包括对原始语音的处理,消除语音的噪声和消除不同说话者对语音带来的影响。最常用的处理方式有端点检测和语音增强。所谓端点检测,其是指在语音中将语音信号和非语音信号时段区分开来,准确地确定出语音信号的起始点。经过端点检测后,后续处理就可以只对语音信号进行,这对提高语音特征模型库的精确度和识别正确率有重要作用。至于语音增强,其主要任务就是消除环境噪声对语音的影响,通常的方法是采用维纳滤波,该方法在噪声较大的情况下效果好于其它滤波器,这部分涉及到移动终端的硬件部分。步骤203,提取经过语音处理后的语音中的语音特征。这里,声学特征的提取是语音识别的一个重要环节,声学特征的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程,其目的是提取语音中最能代表语音的特征信息,以减少后续进行语音识别时所需要处理的数据量。由于语音的时变特性,语音特征的提取必须在一小段语音上进行,也即进行短时分析,这一段被认为是平稳的分析区间称之为帧,帧与帧之间的偏移通常取帧长的1/2或1/3。目前,特征提取的基础性研究已经比较丰富,现有的移动终端已经具有较为成熟的解决方案,因此,本专利技术可采用现有比较成熟的语音特征提取方式执行。步骤204,利用提取出到语音特征进行计算得到一个数值作为所述语音的语音特征参数。本步骤204中,可利用机器学习的方法计算语音特征参数,其中,该语音特征参数代表用户当前输入所述语音时的语音习惯和使用特征。至此,通过上述步骤202本文档来自技高网...

【技术保护点】
一种语音识别方法,其特征在于,该方法包括:建立语音特征模型库,所述语音特征模型库中存在至少一个用户的语音特征参数,并且,该存在的每一语音特征参数都存在对应的动作行为;移动终端接收用户提供的语音;移动终端对接收的语音进行分析,提取出语音中的语音特征参数,并确定语音特征模型库中是否存在与该提取出的语音特征参数相匹配的语音特征参数,如果是,识别该存在的语音特征参数对应的动作行为,执行该识别出的动作行为。

【技术特征摘要】

【专利技术属性】
技术研发人员:邓平
申请(专利权)人:三星电子中国研发中心三星电子株式会社
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1