一种语音输入方法及装置制造方法及图纸

技术编号:13790699 阅读:123 留言:0更新日期:2016-10-05 22:43
本发明专利技术提供一种语音输入方法及装置。方法包括:当接收到输入法应用发送的语音输入指令时,获取语音输入设备的操作权;基于所述操作权,采用所述语音输入设备采集当前环境语音;对采集到的当前环境语音进行语音识别,并将识别出的文字信息返回给所述输入法应用。本发明专利技术解决了现有技术在用户不方便手动输入文字信息的应用场景下,在终端上输入文字信息的便利性和效率较差的问题。

【技术实现步骤摘要】

本专利技术实施例涉及计算机
,尤其涉及一种语音输入方法及装置
技术介绍
目前,用户要在终端上输入文字信息时,一般基于终端上的输入法应用,通过点击终端上的键盘按键输入文字信息,或者,在终端上的手写板上手写输入文字信息,其中,所述终端包括但不限于:车载台、手机、平板电脑,等等。但是,在某些应用场景下,用户的双手可能需要做其他操作,从而不方便手动在终端上输入文字信息。例如,当用户正在开车时,可能想要在车载台上的导航应用中搜索地名,或者,想要在手机上回复短信息,等等,但由于用户的双手正在操作方向盘,因此,不方便手动在终端上输入文字信息。在上述的应用场景下,在终端上输入文字信息的便利性较差。
技术实现思路
本专利技术实施例提供一种语音输入方法及装置,用以解决现有技术在用户不方便手动输入文字信息的应用场景下,在终端上输入文字信息的便利性和效率较差的问题。本专利技术实施例提供一种语音输入方法,包括:当接收到输入法应用发送的语音输入指令时,获取语音输入设备的操作权;基于所述操作权,采用所述语音输入设备采集当前环境语音;对采集到的当前环境语音进行语音识别,并将识别出的文字信息返回给所述输入法应用。本专利技术实施例还提供一种语音输入装置,包括:接收模块,用于当接收到输入法应用发送的语音输入指令时,获取语音输入设备的操作权;采集模块,用于基于所述操作权,采用所述语音输入设备采集当前环境语
音;识别模块,用于对采集到的当前环境语音进行语音识别,并将识别出的文字信息返回给所述输入法应用。本专利技术实施例提供的语音输入方法及装置,即使用户不方便手动在终端上输入文字信息,也可以通过语音输入文字信息,因此,提高了在终端上输入文字信息的便利性。解决了现有技术在用户不方便手动输入文字信息的应用场景下,在终端上输入文字信息的便利性和效率较差的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的语音输入过程;图2为本专利技术实施例提供的,采用广播机制获取语音输入设备的操作权的过程;图3为本专利技术实施例提供的,在安卓(Android)操作系统上,一种生成语音输入可视化界面的过程;图4为本专利技术实施例提供的,一种输入法应用的可视化界面;图5为本专利技术实施例提供的,一种在采集当前环境语音过程中的语音输入可视化界面;图6为本专利技术实施例提供的,一种在对采集到的当前环境语音进行语音识别过程中的语音输入可视化界面;图7为本专利技术实施例提供的,语音输入完成后切换回的输入法应用的可视化界面;图8为本专利技术实施例提供的语音输入装置结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,
所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例提供的语音输入过程,具体包括以下步骤:S101:当接收到输入法应用发送的语音输入指令时,获取语音输入设备的操作权。本专利技术实施例提供的语音输入方法的执行主体可以是:终端、服务器、终端或服务器上的应用、内嵌于应用中的引擎(例如,内嵌于所述输入法应用中的语音输入引擎)等等。所述终端包括但不限于:车载台、手机、平板电脑、智能手表、个人计算机,等等;所述服务器包括但不限于:作为服务器的大中型计算机、计算机集群,等等。所述的执行主体并不构成对本申请的限定。为了便于描述,本专利技术实施例均以内嵌于所述输入法应用中的语音输入引擎作为执行主体。所述的输入法应用可以是操作系统自带的输入法应用,也可以是用户在操作系统上安装的第三方输入法应用。一般的,当用户需要在文本框中输入文字或其他字符信息时,可以通过点击文本框激活输入法应用,输入法应用则可以展示自己的可视化界面,并为用户提供键盘输入或者手写板方式的输入方式。在本专利技术实施例中,可以基于语音输入指令,将所述键盘输入或者手写板方式切换至语音输入方式,具体的,用户可以通过对预设控件进行操作,从而触发输入法应用向语音输入引擎发送语音输入指令以切换至语音输入方式。其中,所述预设控件包括但不限于实体按键、虚拟按键,等等。语音输入引擎在接收到所述语音输入指令后,可以采用语音输入设备采集当前环境语音,但是由于可能会有其他应用占用了语音输入设备的操作权,因此,语音输入引擎可以等待语音输入设备的操作权被释放后,获取语音输入设备的操作权,或者,也可以主动地向其他应用请求获取语音输入设备的操作权。其中,所述语音输入设备包括但不限于麦克风(Microphone,MIC),以及支持MIC功能的相关组件。S102:基于所述操作权,采用所述语音输入设备采集当前环境语音。S103:对采集到的当前环境语音进行语音识别,并将识别出的文字信息返回给所述输入法应用。本专利技术实施例对在语音识别过程中所使用的识别算法并不做限定。可以使用现有的语音识别算法,例如,隐马尔可夫模型(Hidden Markov Model,HMM)语音识别算法、动态时间归整(Dynamic Time Warping,DTW)语音识别算法,等等,从采集到的当前环境语音中,识别出文字信息。输入法应用在接收到所述识别出的文字信息后,可以在文本框中展示,从而完成对所述识别出的文字信息的语音输入过程。通过上述方法,用户可以不手动地在终端上输入文字信息,而是可以通过简单的操作(例如,点击一下预设控件),使用本申请提供的语音输入方式输入文字信息,解放了用户的双手,使用户在输入文字信息的同时,还可以用双手做其他操作,如开车、抓扶手,等等,也提高了在终端上输入文字信息的便利性。在本专利技术实施例中,对于上述步骤S101,可以采用广播机制,获取语音输入设备的操作权,实现成本很小。图2示出了采用广播机制获取语音输入设备的操作权的过程,具体包括以下步骤:S201:判断语音输入设备的操作权是否被其他应用占用,若是,则执行步骤S202,否则,执行步骤S203。S202:广播请求消息,以请求所述其他应用释放所述语音输入设备的操作权,当监听到所述其他应用在释放所述语音输入设备的操作权后广播的通知消息时,获取对所述语音输入设备的操作权。S203:获取对所述语音输入设备的操作权。除了采用广播机制,还可以采用其他方法获取语音输入设备的操作权。例如,可以不向所述其他应用广播请求消息,而是定时查询语音输入设备的操作权是否被其他应用占用,直到确定语音输入设备的操作权未被其他应用占用时,再获取语音输入设备的操作权。在本专利技术实施例中,为了进一步地提高在终端上语音输入文字信息的便利性,还可以提供为用户提供语音输入可视化界面,在语音输入时对用户进行相应提示,以及展示实时状态。具体的,对于上述步骤S102,在基于所述操作权,采用所述语音输入设备采集当前环境语音之前,可以生成语音输入可视化界面,其中,所述语音输入可视化界面用于展示对当前环境语音进行采集和\本文档来自技高网
...

【技术保护点】
一种语音输入方法,其特征在于,包括:当接收到输入法应用发送的语音输入指令时,获取语音输入设备的操作权;基于所述操作权,采用所述语音输入设备采集当前环境语音;对采集到的当前环境语音进行语音识别,并将识别出的文字信息返回给所述输入法应用。

【技术特征摘要】
1.一种语音输入方法,其特征在于,包括:当接收到输入法应用发送的语音输入指令时,获取语音输入设备的操作权;基于所述操作权,采用所述语音输入设备采集当前环境语音;对采集到的当前环境语音进行语音识别,并将识别出的文字信息返回给所述输入法应用。2.根据权利要求1所述的方法,其特征在于,获取对语音输入设备的操作权,具体包括:判断语音输入设备的操作权是否被其他应用占用;若是,则广播请求消息,以请求所述其他应用释放所述语音输入设备的操作权,当监听到所述其他应用在释放所述语音输入设备的操作权后广播的通知消息时,获取对所述语音输入设备的操作权;否则,获取对所述语音输入设备的操作权。3.根据权利要求1所述的方法,其特征在于,基于所述操作权,采用所述语音输入设备采集当前环境语音之前,所述方法还包括:生成语音输入可视化界面,其中,所述语音输入可视化界面用于展示对当前环境语音进行采集和/或识别的状态。4.根据权利要求3所述的方法,其特征在于,生成语音输入可视化界面,具体包括:获取所述输入法应用的可视化界面的尺寸信息;根据所述尺寸信息,生成作为语音输入可视化界面的弹出框,其中,所述弹出框内添加有用于展示对当前环境语音进行采集和/或识别的状态的控件。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:对所述弹出框进行设置,使所述语音输入可视化界面将所述输入法应用的可视化界面重叠覆盖,并位于当前显示屏幕的最上层。6.根据权利要求5所述的方法,其特征在于,对所述弹出框进行设置,具体包括:将所述弹出框的类型设置为类型系统告警系统级,再将设置类型后的弹出框添加至窗口管理器中。7.一种语音输入装置,其特征...

【专利技术属性】
技术研发人员:姜洋李铁瑛赵飞
申请(专利权)人:乐卡汽车智能科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1