语音识别处理方法及装置制造方法及图纸

技术编号:14509619 阅读:45 留言:0更新日期:2017-02-01 02:12
本发明专利技术实施例提供了一种语音识别处理方法及装置。在本发明专利技术实施例提供的语音识别处理方法中,浏览器内核在检测到用户触发语音标签后向框架层单元发送语音识别请求,框架层单元通过语音识别工具包将语音识别请求中的语音数据识别并返回给浏览器内核,以使浏览器内核显示识别结果,从而使得用户无需播放语音标签的声音就可以了解网页中语音内容,能够在某些安静的场景下无阻碍的浏览网页中的任何信息,为用户浏览网页带来便利。

【技术实现步骤摘要】

本专利技术实施例涉及智能终端
,尤其涉及一种语音识别处理方法及装置。
技术介绍
随着信息技术的进步和居民收入的增加,智能终端的普及率大大提高。目前的智能终端能够支持越来越多的功能,使得人们可以使用智能终端进行各式各样的操作。其中,通过智能终端中的浏览器访问网页,是人们获取各类信息的常用手段之一。人们只需在浏览器的搜索栏中输入待访问网页的网址,浏览器就可以通过移动网络访问发布该网页内容的网站服务器,从而使得人们可以通过浏览器浏览该网页发布的内容。现有的网站服务器发布的网页内容中,除了包含文字以及图片,有时候还包含语音链接。然而,在实现本专利技术实施例的过程中专利技术人发现,当用户处于不方便播放声音的环境中时,例如办公室或图书馆等等,为保持安静,用户只能阅读网页中的文字或图片,而不能播放语音链接,从而无法获知网页中语音链接里所包含的语音内容,为用户在这一环境下浏览网页造成了很大的不便。
技术实现思路
本专利技术实施例提供一种语音识别处理方法及装置,用以解决现有技术中浏览器在不播放语音链接的情况下无法获知语音内容的缺陷。第一方面,本专利技术实施例提供了一种语音识别处理方法,包括:浏览器的内核单元若检测到用户对网页中的语音标签的触发操作,向所述浏览器的框架层单元发送语音识别请求,所述语音识别请求包括所述语音标签对应的音频数据地址;所述浏览器的框架层单元获取预设的语音识别工具包以及根据所述语音标签对应的音频数据地址获取存储在所述音频数据地址的语音数据,并应用所述语音识别工具包对所述语音数据进行语音识别,获得识别结果;所述浏览器的框架层单元向所述浏览器的内核单元返回所述识别结果;所述浏览器的内核单元将所述识别结果显示在所述浏览器的用户界面层。可选地,所述浏览器的框架层单元应用所述语音识别工具包对所述语音数据进行语音识别,获得识别结果包括:所述浏览器的框架层单元建立音频代理和语音播放器,所述语音播放器与获取的所述语音识别工具包对接;所述音频代理将所述语音数据发送给所述语音播放器所述语音播放器应用对接的所述语音识别工具包对所述语音数据进行语音识别,获得识别结果。可选地,所述浏览器的框架层单元应用所述语音识别工具包对所述语音数据进行语音识别,获得识别结果包括:所述浏览器的框架层单元建立音频代理;所述音频代理在浏览器的用户界面层建立语音播放器,所述语音播放器与获取的所述语音识别工具包对接;所述音频代理将所述语音数据发送给所述语音播放器;所述语音播放器应用对接的所述语音识别工具包对所述语音数据进行语音识别,获得识别结果。可选地,所述浏览器的框架层单元向所述浏览器的内核单元返回所述识别结果包括:所述语音播放器将所述识别结果发送给所述音频代理;所述音频代理将所述识别结果返回给所述浏览器的内核单元。可选地,所述识别结果为文本信息。可选地,所述浏览器的内核单元将所述识别结果显示在浏览器的用户界面层上包括:浏览器的内核单元在所述用户界面层上生成一个浮窗,在所述浮窗中显示所述文本信息。第二方面,本专利技术实施例提供了一种语音识别处理装置,应用于浏览器,包括所述浏览器的内核单元和所述浏览器的框架层单元;所述浏览器的内核单元,用于在检测到用户对网页中的语音标签的触发操作时,则向所述浏览器的框架层单元发送语音识别请求,所述语音识别请求包括所述语音标签对应的音频数据地址;还用于将所述浏览器的框架层单元返回的识别结果显示在所述浏览器的用户界面层上;所述浏览器的框架层单元,用于获取预设的语音识别工具包以及根据所述语音标签对应的音频数据地址获取存储在所述音频数据地址的语音数据,并应用所述语音识别工具包对所述语音数据进行语音识别,获得识别结果,并向所述浏览器内核单元发送所述识别结果。可选地,所述浏览器的框架层单元,还用于建立音频代理和语音播放器,所述语音播放器与获取的所述语音识别工具包对接;其中,所述音频代理用于将所述语音数据发送给所述语音播放器;所述语音播放器用于应用对接的所述语音识别工具包对所述语音数据进行语音识别,获得识别结果。可选地,所述浏览器的框架层单元,还用于建立音频代理;其中,所述音频代理,用于在浏览器的用户界面层建立语音播放器,将所述语音数据发送给所述语音播放器,所述语音播放器与获取的所述语音识别工具包对接;所述语音播放器,用于应用对接的所述语音识别工具包对所述语音数据进行语音识别,获得识别结果。可选地,所述语音播放器还用于将所述识别结果发送给所述音频代理;所述音频代理还用于将所述识别结果返回给所述浏览器的内核单元。可选地,所述识别结果为文本信息。可选地,浏览器的内核单元,还用于在所述用户界面层生成一个浮窗,在所述浮窗中显示所述文本信息。本专利技术实施例提供的语音识别处理方法及装置中,浏览器内核在检测到用户触发语音标签后向框架层单元发送语音识别请求,框架层单元通过语音识别工具包将语音识别请求中的语音数据识别并返回给浏览器内核,以使浏览器内核显示识别结果,从而使得用户无需播放语音标签的声音就可以了解网页中语音内容,能够在某些安静的场景下无阻碍的浏览网页中的任何信息,为用户浏览网页带来便利。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的一种浏览器结构实施例示意图;图2为本专利技术提供的一种语音识别处理方法实施例流程图;图3为图1所示的方法中步骤S201的方法实施例流程图;图4为本专利技术提供的一种浏览器结构具体实施例示意图;图5为本专利技术提供的一种语音识别处理方法装置实施例结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为便于理解,首先对本专利技术实施例涉及到的浏览器的框架结构进行详细说明。如图1所示,本专利技术实施例涉及到的浏览器10包括用户界面层11、框架层单元12以及内核单元13。其中,用户界面层11主要用于向用户显示浏览器界面;框架层单元主要用于根据各种协议向浏览器的外界获取资源;内核单元13主要用于根据用户对浏览器的各类触发操作产生不同的响应。该浏览器10可预装在终端设备中,例如,该终端设备包含但不限于:手机、平板电脑和电视等。基于上述内容,第一方面,本专利技术实施例提供了一种语音识别处理方法,该方法实现了对接收到的通话对方的语音信息的处理,该方法的执行主体例如可以为浏览器10,如图2所示,该方法例如可以包括:S101、浏览器的内核单元13若检测到用户对网页中的语音标签的触发操作,向浏览器的框架层单元12发送语音识别请求,语音识别请求包括语音标签对应的音频数据地址。具体来说,用户在浏览网页时,会遇到带有语音链接的网站,若浏览器所在的终端当前处于静音模式或震动模式下,则认为用户此时处在不便于播放声音的环境中。此时浏览器内核单元13在检测到用户对网页中的语音标本文档来自技高网...

【技术保护点】
一种语音识别处理方法,其特征在于,包括:浏览器的内核单元若检测到用户对网页中的语音标签的触发操作,向所述浏览器的框架层单元发送语音识别请求,所述语音识别请求包括所述语音标签对应的音频数据地址;所述浏览器的框架层单元获取预设的语音识别工具包以及根据所述语音标签对应的音频数据地址获取存储在所述音频数据地址的语音数据,并应用所述语音识别工具包对所述语音数据进行语音识别,获得识别结果;所述浏览器的框架层单元向所述浏览器的内核单元返回所述识别结果;所述浏览器的内核单元将所述识别结果显示在所述浏览器的用户界面层。

【技术特征摘要】
1.一种语音识别处理方法,其特征在于,包括:浏览器的内核单元若检测到用户对网页中的语音标签的触发操作,向所述浏览器的框架层单元发送语音识别请求,所述语音识别请求包括所述语音标签对应的音频数据地址;所述浏览器的框架层单元获取预设的语音识别工具包以及根据所述语音标签对应的音频数据地址获取存储在所述音频数据地址的语音数据,并应用所述语音识别工具包对所述语音数据进行语音识别,获得识别结果;所述浏览器的框架层单元向所述浏览器的内核单元返回所述识别结果;所述浏览器的内核单元将所述识别结果显示在所述浏览器的用户界面层。2.根据权利要求1所述的方法,其特征在于,所述浏览器的框架层单元应用所述语音识别工具包对所述语音数据进行语音识别,获得识别结果包括:所述浏览器的框架层单元建立音频代理和语音播放器,所述语音播放器与获取的所述语音识别工具包对接;所述音频代理将所述语音数据发送给所述语音播放器;所述语音播放器应用对接的所述语音识别工具包对所述语音数据进行语音识别,获得识别结果。3.根据权利要求1所述的方法,其特征在于,所述浏览器的框架层单元应用所述语音识别工具包对所述语音数据进行语音识别,获得识别结果包括:所述浏览器的框架层单元建立音频代理;所述音频代理在浏览器的用户界面层建立语音播放器,所述语音播放器与获取的所述语音识别工具包对接;所述音频代理将所述语音数据发送给所述语音播放器;所述语音播放器应用对接的所述语音识别工具包对所述语音数据进行语音识别,获得识别结果。4.根据权利要求2或3所述的方法,其特征在于,所述浏览器的框架层单元向所述浏览器的内核单元返回所述识别结果包括:所述语音播放器将所述识别结果发送给所述音频代理;所述音频代理将所述识别结果返回给所述浏览器的内核单元。5.根据权利要求1-4中任一项所述的方法,其特征在于,所述识别结果为文本信息。6.根据权利要求5所述的方法,其特征在于,所述浏览器的内核单元将所述识别结果显示在浏览器的用户...

【专利技术属性】
技术研发人员:王璟瑶
申请(专利权)人:乐视控股北京有限公司乐视移动智能信息技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1