一种语音识别的方法、文件处理方法及终端设备技术

技术编号:21093022 阅读:46 留言:0更新日期:2019-05-11 11:15
本申请公开了一种语音识别的方法、文件处理方法及终端设备,所述语音识别方法包括:接收语音数据;所述语音数据包括目标语音;将所述目标语音与预设存储路径下的预设文本进行匹配,并确定所述目标语音与预设存储路径下的预设文本是否匹配成功;若匹配成功,将所述目标语音识别为所述预设文本;其中,所述预设文本包括:预设存储路径下的预设文件夹名称和/或预设文件名称。由于所述预设文本包括预设存储路径下的预设文件夹名称和/或预设文件名称,即用户输入的语音数据中包含该预设文本的可能性比较大,故而当目标语音与预设文本匹配成功时,可以将所述目标语音识别成预设文本。从而避免将目标语音识别为其它文本,提高了语音识别的准确率。

A Speech Recognition Method, File Processing Method and Terminal Equipment

【技术实现步骤摘要】
一种语音识别的方法、文件处理方法及终端设备
本申请涉及互联网领域,特别是涉及一种语音识别的方法、文件处理方法及终端设备。
技术介绍
随着互联网技术的发展,语音识别技术的应用也越来越广泛。许多智能设备尤其是智能移动终端上都安装有语音识别引擎,用户可以通过向终端设备输入语音数据,语音识别引擎可以将用户输入的语音转换成文本,从而根据所述文本控制终端设备执行与所述语音数据相应的操作。但是,由于语音识别引擎的语音识别范围有限以及用户的口音等因素,导致语音识别引擎在将用户输入的目标语音转换成目标文本时,可能会识别错误。从而使得语音识别的准确率不高。进一步导致终端设备不能准确的执行用户输入的语音数据对应的操作。因此,需要提供一种语音识别的方法和终端设备,能够提高语音识别的准确率,从而使得终端设备可以准确的执行用户输入的语音数据对应的操作。
技术实现思路
本申请所要解决的技术问题是如何提高语音识别的准确率,从而使得终端设备可以准确的执行用户输入的语音数据对应的操作,本申请提供一种语音识别的方法、文件处理方法及终端设备。第一方面,本申请实施例提供了一种语音识别的方法,应用于终端设备,包括:接收语音数据;所述语音数据包括目标语音;将所述目标语音与预设存储路径下的预设文本进行匹配,并确定所述目标语音与所述预设文本是否匹配成功;若匹配成功,将所述目标语音识别为所述预设文本;其中,所述预设文本包括:所述预设存储路径下的预设文件夹名称和/或预设文件名称。可选的,所述将所述目标语音与预设存储路径下的预设文本进行匹配,包括:将所述预设文本的读音与所述目标语音进行比较;相应的,所述确定所述目标语音与所述预设文本是否匹配成功,包括:当所述预设文本的读音与所述目标语音的相似度大于或者等于第一预设阈值时,确定所述目标语音与所述预设文本匹配成功。可选的,所述将所述目标语音与预设存储路径下的预设文本进行匹配,包括:对所述目标语音进行识别,获得第一识别文本;将所述第一识别文本和所述预设文本进行比较;相应的,所述确定所述目标语音与所述预设文本是否匹配成功,包括:当所述第一识别文本和所述预设文本的相似度大于或者等于第二预设阈值时,确定所述目标语音与所述预设文本匹配成功。可选的,其特征在于,所述预设存储路径包括:所述终端设备的操作系统自带的存储路径,和/或,响应于用户触发的存储路径新建指令所构建的存储路径。第二方面,本申请实施例提供一种文件处理的方法,包括:获取利用以上第一方面任意一项所述的方法对目标语音进行识别得到的目标文本;确定所述目标文本对应的目标文件的文件类型;根据所述目标文件的文件类型确定所述目标文件支持的操作;对所述目标文件执行所述目标文件支持的操作。第三方面,本申请实施例提供了一种终端设备,包括:接收单元,用于接收语音数据;所述语音数据包括目标语音;匹配单元,用于将所述目标语音与预设存储路径下的预设文本进行匹配,并确定所述目标语音与所述预设文本是否匹配成功;识别单元,用于若匹配成功,将所述目标语音识别为所述预设文本;其中,所述预设文本包括:所述预设存储路径下的预设文件夹名称和/或预设文件名称。可选的,所述匹配单元,具体用于:将所述预设文本的读音与所述目标语音进行比较;当所述预设文本的读音与所述目标语音的相似度大于或者等于第一预设阈值时,确定所述目标语音与所述预设文本匹配成功。可选的,所述匹配单元,具体用于:对所述目标语音进行识别,获得第一识别文本;将所述第一识别文本和所述预设文本进行比较;当所述第一识别文本和所述预设文本的相似度大于或者等于第二预设阈值时,确定所述目标语音与所述预设文本匹配成功。可选的,所述预设存储路径包括:所述终端设备的操作系统自带的存储路径,和/或,响应于用户触发的存储路径新建指令所构建的存储路径。第四方面,本申请实施例提供了一种终端设备,其特征在于,包括:获取单元,用于获取利用以上第一方面任意一项所述的方法对目标语音进行识别得到的目标文本;第一确定单元,用于确定所述目标文本对应的目标文件的文件类型;第二确定单元,用于根据所述目标文件的文件类型确定所述目标文件支持的操作;执行单元,用于对所述目标文件执行所述目标文件支持的操作。与现有技术相比,本申请实施例具有以下优点:一方面,本申请实施例提供的语音识别方法及终端设备,所述方法包括:接收语音数据;所述语音数据包括目标语音;将所述目标语音与预设存储路径下的预设文本进行匹配,并确定所述目标语音与预设存储路径下的预设文本是否匹配成功;若匹配成功,将所述目标语音识别为所述预设文本;其中,所述预设文本包括:预设存储路径下的预设文件夹名称和/或预设文件名称。由此可见,利用本申请实施例提供的语音识别方法及终端设备,由于所述预设文本包括预设存储路径下的预设文件夹名称和/或预设文件名称,即用户输入的语音数据中包含该预设文本的可能性比较大,故而当目标语音与预设文本匹配成功时,可以将所述目标语音识别成预设文本。从而避免将目标语音识别为其它文本,提高了语音识别的准确率。另一方面,本申请实施例提供一种文件处理方法及终端设备,获取对目标语音进行识别得到的目标文本;确定所述目标文本对应的目标文件的文件类型;根据所述目标文件的文件类型确定所述目标文件支持的操作;对所述目标文件执行所述目标文件支持的操作。由此可见,利用本申请实施例提供的文件处理方法和终端设备,可以根据所述目标文本确定目标文件支持的操作,从而确定终端设备可以执行的操作。提升用户体验。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种语音识别的方法的流程示意图;图2为本申请实施例提供的一种步骤S102的具体实现方法的流程示意图;图3为本申请实施例提供的又一种步骤S102的具体实现方法的流程示意图;图4为本申请实施例提供的一种文件处理方法的流程示意图;图5为本申请实施例一种语音识别的方法的流程示意图;图6为本申请实施例提供的一种终端设备的结构示意图;图7为本申请实施例提供的一种终端设备的结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请的专利技术人经过研究发现,在实际应用中,用户可能会将一些文件存储到终端设备中。例如,将小说、教学视频以及音乐等文件存储在终端设备中。随着语音识别技术的发展,用户可以通过向终端设备输入语音数据,从而控制终端设备执行相应的操作。在用户通过语音数据控制终端执行相应的操作时,用户存储在终端设备中的文件的名称,在用户输入的语音数据中出现的可能性比较大,因此,可以将用户输入的语音数据与存储在终端设备中的文件的名称进行匹配,从而将用户输入的语音数据识别成文本,进一步执行与该语音数据对应的操作。鉴于此,本文档来自技高网
...

【技术保护点】
1.一种语音识别的方法,其特征在于,应用于终端设备,包括:接收语音数据;所述语音数据包括目标语音;将所述目标语音与预设存储路径下的预设文本进行匹配,并确定所述目标语音与所述预设文本是否匹配成功;若匹配成功,将所述目标语音识别为所述预设文本;其中,所述预设文本包括:所述预设存储路径下的预设文件夹名称和/或预设文件名称。

【技术特征摘要】
1.一种语音识别的方法,其特征在于,应用于终端设备,包括:接收语音数据;所述语音数据包括目标语音;将所述目标语音与预设存储路径下的预设文本进行匹配,并确定所述目标语音与所述预设文本是否匹配成功;若匹配成功,将所述目标语音识别为所述预设文本;其中,所述预设文本包括:所述预设存储路径下的预设文件夹名称和/或预设文件名称。2.根据权利要求1所述的方法,其特征在于,所述将所述目标语音与预设存储路径下的预设文本进行匹配,包括:将所述预设文本的读音与所述目标语音进行比较;相应的,所述确定所述目标语音与所述预设文本是否匹配成功,包括:当所述预设文本的读音与所述目标语音的相似度大于或者等于第一预设阈值时,确定所述目标语音与所述预设文本匹配成功。3.根据权利要求1所述的方法,其特征在于,所述将所述目标语音与预设存储路径下的预设文本进行匹配,包括:对所述目标语音进行识别,获得第一识别文本;将所述第一识别文本和所述预设文本进行比较;相应的,所述确定所述目标语音与所述预设文本是否匹配成功,包括:当所述第一识别文本和所述预设文本的相似度大于或者等于第二预设阈值时,确定所述目标语音与所述预设文本匹配成功。4.根据权利要求1-3任意一项所述的方法,其特征在于,所述预设存储路径包括:所述终端设备的操作系统自带的存储路径,和/或,响应于用户触发的存储路径新建指令所构建的存储路径。5.一种文件处理的方法,其特征在于,包括:获取利用如权利要求1-4任意一项所述的方法对目标语音进行识别得到的目标文本;确定所述目标文本对应的目标文件的文件类型;根据所述目标文件的文件类型确定所述目标文件支...

【专利技术属性】
技术研发人员:孙东
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1