The invention relates to the field of communication technology, and proposes a speech recognition method, a storage medium and a terminal device. The speech recognition method includes: using the function of HTML 5 to obtain the permission of microphone input voice; collecting the voice signal input by the microphone to obtain the target audio file; sending the target audio file to the third party interface which provides speech recognition service; receiving the description from the third party interface when the third party completes the natural language recognition process. Speech recognition results of target audio files. With this speech recognition method, users can complete voice acquisition and speech recognition functions directly through browser without installing APP client, which reduces the dependence of product on host APP and expands the application channel of scene.
【技术实现步骤摘要】
一种语音识别方法、存储介质和终端设备
本专利技术涉及通信
,尤其涉及一种语音识别方法、存储介质和终端设备。
技术介绍
目前,语音识别技术已经取得显著的成果,广泛应用于家电、通信、汽车电子、医疗、家庭服务以及消费电子产品等多个领域。语音识别是让机器通过识别和理解把语音信号转变为相应的文本或命令的过程,通常包括语音采集、前端处理、声学特征提取、构建语音识别模型进行语音识别等步骤。为了方便用户的使用,通常会将语音采集和语音识别功能集成到某个APP(Application)中。然而,采用这种方式需要用户在终端上安装APP客户端,对于APP的依赖性太强。
技术实现思路
有鉴于此,本专利技术实施例提供了一种语音识别方法、存储介质和终端设备,能够在不依赖APP的基础上实现语音的采集与识别。本专利技术实施例的第一方面,提供了一种语音识别方法,包括:使用html5的功能函数获取麦克风输入语音的权限;采集用户通过所述麦克风输入的语音信号,得到目标音频文件;将所述目标音频文件发送至提供语音识别服务的第三方接口;从所述第三方接口接收所述目标音频文件的语音识别结果。本专利技术实施例的第二 ...
【技术保护点】
1.一种语音识别方法,其特征在于,包括:使用html5的功能函数获取麦克风输入语音的权限;采集用户通过所述麦克风输入的语音信号,得到目标音频文件;将所述目标音频文件发送至提供语音识别服务的第三方接口;从所述第三方接口接收所述目标音频文件的语音识别结果。
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:使用html5的功能函数获取麦克风输入语音的权限;采集用户通过所述麦克风输入的语音信号,得到目标音频文件;将所述目标音频文件发送至提供语音识别服务的第三方接口;从所述第三方接口接收所述目标音频文件的语音识别结果。2.根据权利要求1所述的语音识别方法,其特征在于,在使用html5的功能函数获取麦克风输入语音的权限之前,还包括:接收由服务器发送的目标文本;在终端界面展示所述目标文本,并输出用于指示用户在第一时长内阅读所述目标文本的提示信息;在从所述第三方接口接收所述目标音频文件的语音识别结果之后,还包括:将所述语音识别结果和所述目标文本进行匹配,得到匹配度;若所述匹配度大于第一阈值,则将所述目标音频文件提交至所述服务器。3.根据权利要求2所述的语音识别方法,其特征在于,所述采集用户通过所述麦克风输入的语音信号包括:当检测到唤醒麦克风的信号后,开启麦克风并启动计时器,采集用户输入的语音信号,所述计时器的计时时间为所述第一时长;当所述计时时间到达后,关闭所述麦克风;其中,所述第一时长通过以下步骤确定:统计所述目标文本的字符数量;根据所述字符数量和预设的基准语速计算得到阅读完所述目标文本所需的基准时间;用所述基准时间乘以预设的比例系数,得到所述第一时长。4.根据权利要求2所述的语音识别方法,其特征在于,所述将所述目标音频文件发送至提供语音识别服务的第三方接口包括:根据所述目标文本确定所述目标音频文件的语言种类、应用场景和生僻字数量;提取所述目标音频文件的噪音强度;根据所述语言种类、应用场景、生僻字数量和噪音强度从多个第三方接口中选取目标第三方接口;将所述目标音频文件发送至所述目标第三方接口。5.根据权利要求1至4中任一项所述的语音识别方法,其特征在于,在将所述目标音频文件发送至提供语音识别服务的第三方接口之前,还包括:提取所述目标音频文件的时长、音调和音量;若所述时长、音调或音量不符合各自对应的条件,则提示用户重新输入语音信号;若所述时长、音...
【专利技术属性】
技术研发人员:肖伟平,
申请(专利权)人:平安普惠企业管理有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。