一种语音识别方法、装置、设备及存储介质制造方法及图纸

技术编号：33133076 阅读：30 留言：0更新日期：2022-04-17 00:53

本申请公开了一种语音识别方法、装置、设备及存储介质。该方法包括：通过浏览器采集用户语音，并按照预设转换规则将所述用户语音转换为目标格式的音频数据；对所述音频数据进行音频波形转换，得到待验证信号波形；将所述待验证信号波形与预先存储的权限用户的波形样本进行比对，判断波形是否匹配；若波形匹配，则通过应用程序接口调用第三方语音识别服务对所述音频数据进行识别，并接收语音识别结果。通过利用浏览器采集用户语音，并将用户语音转换为符合第三方语音识别服务的目标格式的音频数据，以便利用成熟的第三方语音识别服务进行语音识别，最终实现Web网站场景下精确的语音识别。音识别。音识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别方法、装置、设备及存储介质

[0001]本专利技术涉及语音识别
，特别涉及一种语音识别方法、装置、设备及存储介质。

技术介绍

[0002]目前，用户通常通过鼠标操作与Web网站进行交互，但是在某些场景下，如大屏演示环节，通过鼠标进行交互会降低延时的流畅性，存在寻找鼠标导致的卡顿现象等。现有技术中，移动端采用语音识别实现更高效的交互，而如何在Web网站实现精准的语音识别是目前亟需解决的问题。

技术实现思路

[0003]有鉴于此，本专利技术的目的在于提供一种语音识别方法、装置、设备及介质，能够在Web网站实现精准的语音识别。其具体方案如下：
[0004]第一方面，本申请公开了一种语音识别方法，包括：
[0005]通过浏览器采集用户语音，并按照预设转换规则将所述用户语音转换为目标格式的音频数据；
[0006]对所述音频数据进行音频波形转换，得到待验证信号波形；
[0007]将所述待验证信号波形与预先存储的权限用户的波形样本进行比对，判断波形是否匹配；
[00...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，其特征在于，应用于Web网站，包括：通过浏览器采集用户语音，并按照预设转换规则将所述用户语音转换为目标格式的音频数据；对所述音频数据进行音频波形转换，得到待验证信号波形；将所述待验证信号波形与预先存储的权限用户的波形样本进行比对，判断波形是否匹配；若波形匹配，则通过应用程序接口调用第三方语音识别服务对所述音频数据进行识别，并接收语音识别结果。2.根据权利要求1所述的语音识别方法，其特征在于，所述通过浏览器采集用户语音，包括：通过浏览器按照第一循环采集规则采集用户语音；所述第一循环采集规则包括第一预设时间间隔；相应的，所述接收语音识别结果之后，还包括：根据所述语音识别结果和预设语音口令库判断所述用户语音是否为唤醒指令；若所述用户语音不是所述唤醒指令，则执行所述通过浏览器按照第一循环采集规则采集用户语音的操作；若所述用户语音是所述唤醒指令，则通过浏览器按照第二循环采集规则采集用户语音指令，并通过所述第三方语音识别服务识别所述用户语音指令得到语音指令识别结果，然后根据所述语音指令识别结果和所述预设语音口令库确定出所述语音指令识别结果对应的操作类型，并根据所述操作类型执行相应的交互操作。3.根据权利要求2所述的语音识别方法，其特征在于，所述根据所述语音指令识别结果和所述预设语音口令库确定出所述语音指令识别结果对应的操作类型之前，还包括：通过超文本标记语言创建用于配置语音指令和操作类型的映射关系的配置页面，以便根据获取的用户识别需求通过所述配置页面配置语音指令和操作类型的映射关系。4.根据权利要求1所述的语音识别方法，其特征在于，所述按照预设转换规则将所述用户语音转换为目标格式的音频数据，包括：确定出所述第三方语音识别服务对应的格式要求；按照所述格式要求对应的预设转换规则将所述用户语音转换为波形声音文件，以便所述波形声音文件对应的采样率、声...

【专利技术属性】
技术研发人员：李威，范渊，杨勃，
申请(专利权)人：杭州安恒信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人