语音识别结果的展现方法和装置制造方法及图纸

技术编号:9783082 阅读:166 留言:0更新日期:2014-03-18 23:10
本发明专利技术提出一种语音识别结果的展现方法和装置,其中该展现方法包括:将语音数据发送至服务器;接收服务器生成的多个识别结果数据包,并根据多个识别结果数据包生成待展现识别结果队列,其中,待展现识别结果队列包括多个待展现识别结果;以及根据客户端的当前网速获取每个待展现识别结果的展现时间,并根据展现时间展现对应的待展现识别结果。本发明专利技术实施例的展现方法可动态调整语音识别结果展示频率,能够保证语音识别结果的连贯性,避免在识别结果展现时存在空档期,对于用户来说,可使得用户能够真实感受到语音识别输入的过程,提升用户体验。

【技术实现步骤摘要】
语音识别结果的展现方法和装置
本专利技术涉及互联网
,尤其涉及一种语音识别结果的展现方法和装置。
技术介绍
随着互联网技术的快速发展,以智能手机为代表的各种智能终端越来越多地占据人们的生活,触摸屏也成为智能手机的主流屏配置。但无论是手机的物理键盘还是触摸屏上的虚拟键盘,由于尺寸的限制,在手机上进行文本输入总是不如PC(PersonalComputer,个人计算机)键盘输入那样快捷方便。因此,通过语音识别的功能在手机上进行文本输入成为一个大趋势。语音输入法、语音发短信、语音搜索之类的应用越来越多地出现在智能手机中。目前,语音识别结果的显示方式主要有两种:一种是等待语音识别过程结束后,一次性将识别结果输出到显示窗口中;另一种是在语音识别过程中,只要收到识别结果,就将识别结果输出到显示窗口中。显然,从用户体验上来看,第二种显示方式要比第一种显示方式更好些。目前存在的问题是,对于第二种显示方式来说,会由于各种原因而影响其显示效果,例如,由于语音识别过程是客户端与服务端共同完成,识别的速度也会受到网络带宽的影响,所以客户端收到返回结果展示给用户的频率也会受到影响,又如,在网速较慢的时候,会经常出现展示识别结果时断断续续的问题,同时也会对用户的语音输入过程产生误导,影响用户原语速节奏,从而影响识别结果的准确率。
技术实现思路
本专利技术旨在至少解决上述技术问题之一。为此,本专利技术的第一个目的在于提出一种语音识别结果的展现方法。该方法能够保证语音识别结果的连贯性,避免在识别结果展现时存在空档期,对于用户来说,可使得用户能够真实感受到语音识别输入的过程,提升用户体验。本专利技术的第二个目的在于提出一种语音识别结果的展现装置。为了实现上述目的,本专利技术第一方面实施例的语音识别结果的展现方法包括:将语音数据发送至服务器;接收所述服务器生成的多个识别结果数据包,并根据所述多个识别结果数据包生成待展现识别结果队列,其中,所述待展现识别结果队列包括多个待展现识别结果;以及根据客户端的当前网速获取每个所述待展现识别结果的展现时间,并根据所述展现时间展现对应的待展现识别结果。本专利技术实施例的语音识别结果的展现方法,可根据客户端的当前网速获取每个待展现识别结果的展现时间,并可根据该展现时间展现对应的待展现识别结果,从而当网络状态很好的情况下,可使得展现频率与用户语速一致,当网络状态差的情况下,可动态调整语音识别结果展示频率,能够保证语音识别结果的连贯性,避免在识别结果展现时存在空档期,对于用户来说,可使得用户能够真实感受到语音识别输入的过程,提升用户体验。为了实现上述目的,本专利技术第二方面实施例的语音识别结果的展现装置,包括:语音数据发送模块,用于将语音数据发送至服务器;待展现识别结果队列生成模块,用于接收所述服务器生成的多个识别结果数据包,并根据所述多个识别结果数据包生成待展现识别结果队列,其中,所述待展现识别结果队列包括多个待展现识别结果;以及展现模块,用于根据客户端的当前网速获取每个所述待展现识别结果的展现时间,并根据所述展现时间展现对应的待展现识别结果。本专利技术实施例的语音识别结果的展现装置,可通过展现模块根据客户端的当前网速获取每个待展现识别结果的展现时间,并可根据该展现时间展现对应的待展现识别结果,从而当网络状态很好的情况下,可使得展现频率与用户语速一致,当网络状态差的情况下,可动态调整语音识别结果展示频率,能够保证语音识别结果的连贯性,避免在识别结果展现时存在空档期,对于用户来说,可使得用户能够真实感受到语音识别输入的过程,提升用户体验。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,图1是根据本专利技术一个实施例的语音识别结果的展现方法的流程图;图2是根据本专利技术一个具体实施例的语音识别结果的展现方法的流程图;图3是根据本专利技术另一个具体实施例的语音识别结果的展现方法的流程图;图4是根据本专利技术一个实施例的语音识别结果的展现装置的结构示意图;图5是根据本专利技术一个具体实施例的语音识别结果的展现装置的结构示意图;图6是根据本专利技术另一个具体实施例的语音识别结果的展现装置的结构示意图;图7是根据本专利技术又一个具体实施例的语音识别结果的展现装置的结构示意图;图8是根据本专利技术再一个具体实施例的语音识别结果的展现装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。在本专利技术的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。此外,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本专利技术的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本专利技术的实施例所属
的技术人员所理解。为了解决由于网络带宽影响语音识别结果的展示效果,从而影响识别结果的准确率的问题,本专利技术提出一种语音识别结果的展现方法和装置,下面参考附图描述根据本专利技术实施例的语音识别结果的展现方法和装置。一种语音识别结果的展现方法,包括:将语音数据发送至服务器;接收服务器生成的多个识别结果数据包,并根据多个识别结果数据包生成待展现识别结果队列,其中,待展现识别结果队列包括多个待展现识别结果;以及根据客户端的当前网速获取每个待展现识别结果的展现时间,并根据展现时间展现对应的待展现识别结果。图1是根据本专利技术一个实施例的语音识别结果的展现方法的流程图。如图1所示,语音识别结果的展现方法包括:S101,将语音数据发送至服务器。例如,用户可通过客户端输入一段语音,客户端可将用户输入的语音数据发送至服务器,服务器可根据预设算法对该语音数据进行语音识别,并生成该语音数据对应的多个识别结果数据包。其中,预设算法可理解为现有算法,也就是说,服务器可根据现有算法技术对客户端发送的语音数据进行语音识别。其中,客户端可以是具有语音识别功能的应用程序。应当理解,在本专利技术的实施例中,客户端还可以是PC机,也还可以是移动终端。此外,移动终端可以是手机、平板电脑、个人数字助理、电子书等具有各种操作系统的硬件设备。S102,接收服务器生成的多个识别结果数据包,并根据多个识别结果数据包生成待展现识别结本文档来自技高网
...
语音识别结果的展现方法和装置

【技术保护点】
一种语音识别结果的展现方法,其特征在于,包括:将语音数据发送至服务器;接收所述服务器生成的多个识别结果数据包,并根据所述多个识别结果数据包生成待展现识别结果队列,其中,所述待展现识别结果队列包括多个待展现识别结果;以及根据客户端的当前网速获取每个所述待展现识别结果的展现时间,并根据所述展现时间展现对应的待展现识别结果。

【技术特征摘要】
1.一种语音识别结果的展现方法,其特征在于,包括:将语音数据发送至服务器;接收所述服务器生成的多个识别结果数据包,并根据所述多个识别结果数据包生成待展现识别结果队列,其中,所述待展现识别结果队列包括多个待展现识别结果;以及根据客户端的当前网速获取每个所述待展现识别结果的展现时间,并根据所述展现时间展现对应的待展现识别结果。2.如权利要求1所述的方法,其特征在于,所述将语音数据发送至服务器具体包括:将所述语音数据分为多个语音数据包发送至所述服务器,并记录所述多个语音数据包的数据量。3.如权利要求2所述的方法,其特征在于,还包括:记录每个所述识别结果数据包的返回时间;以及根据所述返回时间和所述数据量获取所述客户端的当前网速。4.如权利要求3所述的方法,其特征在于,还包括:记录所述待展示识别结果的个数;以及根据所述个数和所述返回时间获取所述多个识别结果数据包的语速。5.如权利要求3所述的方法,其特征在于,所述根据客户端的当前网速获取每个所述待展现识别结果的展现时间具体包括:判断所述当前网速是否小于预设阀值;如果判断所述当前网速大于或等于所述预设阀值,则根据所述多个识别结果数据包的语速获取每个所述待展现识别结果的展现时间;以及如果判断所述当前网速小于所述预设阀值,则根据每个所述语音数据包的发送时间、每个所述识别结果数据包的返回时间和当前网络传输的实时率获取每个所述待展现识别结果的展现时间。6.如权利要求1所述的方法,其特征在于,还包括:获取每个所述待展现识别结果的语义信息;以及根据所述语义信息和所述当前网速获取每个所述待展现识别结果的展现时间,并根据所述展现时间展现对应的待展现识别结果。7.一种语音识别结果的展现装置,其特征在于,包括:语音数据发送模块,用于将语音数据发送至服务器;待展现识别...

【专利技术属性】
技术研发人员:刘俊启
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1