语音数据的处理方法及装置制造方法及图纸

技术编号:15839869 阅读:36 留言:0更新日期:2017-07-18 16:35
本发明专利技术提供一种语音数据的处理方法及装置。本发明专利技术实施例通过获取用户对终端的开始操作手势,若所述开始操作手势满足预先设置的指定开始手势,使得能够开启语音输入功能,以采集所述用户的语音数据,由于采用指定的开始操作手势触发执行语音服务,使得无需在指定界面的指定位置设置用于输入语音数据的功能控件,能够避免现有技术中由于用于输入语音数据的功能控件设置在指定界面的指定位置而导致的在用户需要输入语音数据时操作繁琐且不灵活的技术问题,从而提高了语音数据处理的效率和灵活性。

Method and device for processing voice data

The invention provides a method and a device for processing voice data. The embodiment of the invention to obtain user terminal to start the operation of hand gestures, if the start operation meet the specified start gesture preset gesture, which can open the voice input, voice data acquisition to the user, because the specified start gestures trigger execution of voice service, so no need to set at the specified location specified the interface for control input speech data, can be avoided in the prior art for function to control the input voice data set on the specified position of the specified interface resulting in the user needs to transport technology into the problem of voice data when the operation is complicated and not flexible, so as to improve the efficiency and flexibility of speech data processing.

【技术实现步骤摘要】
语音数据的处理方法及装置
本专利技术涉及通信技术,尤其涉及一种语音数据的处理方法及装置。
技术介绍
随着通信技术的发展,终端集成了越来越多的功能,从而使得终端的系统功能列表中包含了越来越多相应的应用(Application,APP)。有些应用中会涉及语音服务,例如,微信应用中的语音输入功能,百度搜索应用中的语音助手,等。在语音服务中,可以在指定界面的指定位置提供一个用于输入语音数据的功能控件。当用户利用输入设备操作这个功能控件时,则可以开始采集语音数据。然而,由于用于输入语音数据的功能控件设置在指定界面的指定位置,因此,在用户需要输入语音数据时,需要根据用户的操作展现指定界面,并由用户在指定界面上寻找指定位置处的功能控件并操作,才能采集用户所提供的语音数据,操作繁琐,且不灵活,从而导致了语音数据处理的效率和灵活性的降低。
技术实现思路
本专利技术的多个方面提供一种语音数据的处理方法及装置,用以提高语音数据处理的效率和灵活性。本专利技术的一方面,提供一种语音数据的处理方法,包括:获取用户对终端的开始操作手势;若所述开始操作手势满足预先设置的指定开始手势,开启语音输入功能,以采集所述用户的语音数据。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获取用户对终端的开始操作手势,包括:基于预先设置的指定界面,检测用户对终端的开始操作手势。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述用户对终端的开始操作手势,包括下列操作手势中的至少一项:用户对所述终端的按键的操作;用户在所述终端上方的悬空滑动;用户在特定界面上的接触滑动;以及用户带动所述终端的运动。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述用户在特定界面上的接触滑动,包括:用户在特定界面上空白区域的长按操作。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述若所述开始操作手势满足预先设置的指定开始手势,开启语音输入功能,以采集所述用户的语音数据,包括:若所述开始操作手势满足预先设置的指定开始手势,检测是否有语音数据输入,直至接收语音停止输入指令为止;若检测到有语音数据输入,对所述语音数据进行处理。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述检测是否有语音数据输入之后,还包括:获取用户对所述终端的结束操作手势;若所述结束操作手势满足预先设置的指定结束手势,接收所述语音停止输入指令。本专利技术的另一方面,提供一种语音数据的处理装置,包括:获取单元,用于获取用户对终端的开始操作手势;语音单元,用于若所述开始操作手势满足预先设置的指定开始手势,开启语音输入功能,以采集所述用户的语音数据。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获取单元,具体用于基于预先设置的指定界面,检测用户对终端的开始操作手势。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述用户对终端的开始操作手势,包括下列操作手势中的至少一项:用户对所述终端的按键的操作;用户在所述终端上方的悬空滑动;用户在特定界面上的接触滑动;以及用户带动所述终端的运动。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述用户在特定界面上的接触滑动,包括:用户在特定界面上空白区域的长按操作。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述语音单元,具体用于若所述开始操作手势满足预先设置的指定开始手势,检测是否有语音数据输入,直至接收语音停止输入指令为止;若检测到有语音数据输入,对所述语音数据进行处理。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述语音单元,还用于获取用户对所述终端的结束操作手势;若所述结束操作手势满足预先设置的指定结束手势,接收所述语音停止输入指令。由上述技术方案可知,本专利技术实施例通过获取用户对终端的开始操作手势,若所述开始操作手势满足预先设置的指定开始手势,使得能够开启语音输入功能,以采集所述用户的语音数据,由于采用指定的开始操作手势触发执行语音服务,使得无需在指定界面的指定位置设置用于输入语音数据的功能控件,能够避免现有技术中由于用于输入语音数据的功能控件设置在指定界面的指定位置而导致的在用户需要输入语音数据时操作繁琐且不灵活的技术问题,从而提高了语音数据处理的效率和灵活性。另外,采用本专利技术所提供的技术方案,由于采用指定的开始操作手势触发执行语音服务,使得操作区域不再受限于用于输入语音数据的功能控件的大小及位置,能够有效提高语音数据处理的可靠性和效率。【附图说明】为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的语音数据的处理方法的流程示意图;图2为本专利技术另一实施例提供的语音数据的处理装置的结构示意图。【具体实施方式】为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本专利技术保护的范围。需要说明的是,本申请实施例中所涉及的终端可以包括但不限于手机、个人数字助理(PersonalDigitalAssistant,PDA)、无线手持装置、无线上网本、个人电脑、便携电脑、平板电脑、MP3播放器、MP4播放器、可穿戴设备(例如,智能眼镜、智能手表、智能手环等)等。另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。图1为本专利技术一实施例提供的语音数据的处理方法的流程示意图,如图1所示。101、获取用户对终端的开始操作手势。102、若所述开始操作手势满足预先设置的指定开始手势,开启语音输入功能,以采集所述用户的语音数据。需要说明的是,101~102的执行主体的部分或全部可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(SoftwareDevelopmentKit,SDK)等功能单元,或者还可以为位于网格侧服务器中的处理引擎,或者还可以为位于网格侧的分布式系统,本实施例对此不进行特别限定。可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。这样,通过获取用户对终端的开始操作手势,若所述开始操作手势满足预先设置的指定开始手势,使得能够开启语音输入功能,以采集所述用户的语音数据,由于采用指定的开始操作手势触发执行语音服务,使得无需在指定界面的指定位置设置用于输入语音数据的功能控件,能够避免现有技术中由于用于输入语音数据的功能控件设置在指定界面的指定位置而导致的在用户需要本文档来自技高网...
语音数据的处理方法及装置

【技术保护点】
一种语音数据的处理方法,其特征在于,包括:获取用户对终端的开始操作手势;若所述开始操作手势满足预先设置的指定开始手势,开启语音输入功能,以采集所述用户的语音数据。

【技术特征摘要】
1.一种语音数据的处理方法,其特征在于,包括:获取用户对终端的开始操作手势;若所述开始操作手势满足预先设置的指定开始手势,开启语音输入功能,以采集所述用户的语音数据。2.根据权利要求1所述的方法,其特征在于,所述获取用户对终端的开始操作手势,包括:基于预先设置的指定界面,检测用户对终端的开始操作手势。3.根据权利要求1所述的方法,其特征在于,所述用户对终端的开始操作手势,包括下列操作手势中的至少一项:用户对所述终端的按键的操作;用户在所述终端上方的悬空滑动;用户在特定界面上的接触滑动;以及用户带动所述终端的运动。4.根据权利要求3所述的方法,其特征在于,所述用户在特定界面上的接触滑动,包括:用户在特定界面上空白区域的长按操作。5.根据权利要求1~4任一权利要求所述的方法,其特征在于,所述若所述开始操作手势满足预先设置的指定开始手势,开启语音输入功能,以采集所述用户的语音数据,包括:若所述开始操作手势满足预先设置的指定开始手势,检测是否有语音数据输入,直至接收语音停止输入指令为止;若检测到有语音数据输入,对所述语音数据进行处理。6.根据权利要求5所述的方法,其特征在于,所述检测是否有语音数据输入之后,还包括:获取用户对所述终端的结束操作手势;若所述结束操作手势满足预先设置的...

【专利技术属性】
技术研发人员:韩璐
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1