本发明专利技术公开了一种语音识别的方法和终端设备,所述方法应用于终端设备,所述终端设备保存有第一预设文本,所述方法包括:接收语音数据,所述语音数据包括目标语音;比较所述第一预设文本的读音和所述目标语音;若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。由此可见,利用本申请实施例提供的方法和终端设备,由于终端设备中保存有第一预设文本,当所述目标语音与第一预设文本的读音相似度比较高时,终端设备可以自动将目标文本识别为第一预设文本,而不会识别为与第一预设文本读音相同或相似的其它文本,从而提高了语音识别的准确率。
A Speech Recognition Method and Terminal Equipment
【技术实现步骤摘要】
一种语音识别的方法和终端设备
本专利技术涉及领域互联网领域,特别是涉及一种语音识别的方法和终端设备。
技术介绍
随着互联网技术的发展,语音识别技术的应用也越来越广泛。许多智能设备尤其是智能移动终端上都安装有语音识别引擎,语音识别引擎可以用于将用户输入的语音转换成文本。但是,由于许多文字的读音相似甚至是相同,语音识别引擎在将用户输入的目标语音转换成目标文本时,可能会将目标语音识别成与目标文本读音相同或相似的文本,例如,将“Mac”识别为“Mike”或者“麦克”。从而导致语音识别的准确率不高。因此,需要提供一种语音识别的方法和终端设备,能够提高语音识别的准确率。
技术实现思路
为了解决上述问题,本专利技术实施例提供一种语音识别的方法和终端设备。本专利技术实施例提供一种语音识别的方法,应用于终端设备,所述终端设备保存有第一预设文本,包括:接收语音数据;所述语音数据包括目标语音;比较所述第一预设文本的读音和所述目标语音;若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。可选的,所述方法还包括:将所述第一预设文本发送给服务器,以便于服务器查找与所述第一预设文本相关的第二预设文本;接收服务器发送的第二预设文本;保存所述第二预设文本。可选的,若所述第一预设文本的读音和所述目标语音的相似度小于第一阈值,所述方法还包括:比较所述第二预设文本的读音和所述目标语音;相应的,若所述第二预设文本的读音和所述目标语音的相似度大于或者等于第二阈值,将所述目标语音识别为所述第二预设文本。可选的,所述将所述目标语音识别为所述第一预设文本,包括:比较所述第二预设文本的读音和所述目标语音,确定所述第二预设文本的读音和所述目标语音的相似度;若第一相似度大于或者等于第二相似度,将所述目标语音识别为所述第一预设文本;其中,所述第一相似度为所述第一预设文本的读音和所述目标语音的相似度;所述第二相似度为所述第二预设文本的读音和所述目标语音的相似度。可选的,若所述第一相似度小于所述第二相似度,所述方法还包括:判断所述第二相似度是否大于或者等于第三阈值;当所述第二相似度大于或者等于第三阈值时,将所述目标语音识别为所述第二预设文本。可选的,所述第二预设文本包括:与所述第一预设文本具有内容相关性的文本,和/或,与所述第一预设文本具有语义相关性的文本。本专利技术实施例提供一种设备,包括:第一接收单元,用于接收语音数据;所述语音数据包括目标语音;比较单元,用于比较所述第一预设文本的读音和所述目标语音;识别单元,用于若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。可选的,所述终端设备还包括:发送单元,用于将所述第一预设文本发送给服务器,以便于服务器查找与所述第一预设文本相关的第二预设文本;第二接收单元,用于接收服务器发送的第二预设文本;保存单元,用于保存所述第二预设文本。可选的,若所述第一预设文本的读音和所述目标语音的相似度小于第一阈值,所述比较单元,还用于:比较所述第二预设文本的读音和所述目标语音;相应的,所述识别单元用于:当所述第二预设文本的读音和所述目标语音的相似度大于或者等于第二阈值时,将所述目标语音识别为所述第二预设文本。可选的,所述识别单元,具体用于:比较所述第二预设文本的读音和所述目标语音,确定所述第二预设文本的读音和所述目标语音的相似度;若第一相似度大于或者等于第二相似度,将所述目标语音识别为所述第一预设文本;其中,所述第一相似度为所述第一预设文本的读音和所述目标语音的相似度;所述第二相似度为所述第二预设文本的读音和所述目标语音的相似度。可选的,若所述第一相似度小于所述第二相似度,所述比较单元620还用于:判断所述第二相似度是否大于或者等于第三阈值;相应的,所述识别单元还用于,当所述第二相似度大于或者等于第三阈值时,将所述目标语音识别为所述第二预设文本。可选的,所述第二预设文本包括:与所述第一预设文本具有内容相关性的文本,和/或,与所述第一预设文本具有语义相关性的文本。与现有技术相比,本专利技术实施例具有以下优点:本专利技术实施例提供一种语音识别的方法和终端设备,所述方法应用于终端设备,所述终端设备保存有第一预设文本,所述方法包括:接收语音数据,所述语音数据包括目标语音;比较所述第一预设文本的读音和所述目标语音;若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。由此可见,利用本申请实施例提供的方法和终端设备,由于终端设备中保存有第一预设文本,当所述目标语音与第一预设文本的读音相似度比较高时,终端设备可以自动将目标文本识别为第一预设文本,而不会识别为与第一预设文本读音相同或相似的其它文本,从而提高了语音识别的准确率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种语音识别方法的流程示意图;图2为本专利技术实施例提供的又一种语音识别方法的流程示意图;图3为本专利技术实施例提供的一种结合第一预设文本和第二预设文本识别目标语音的流程示意图;图4为本专利技术实施例提供的又一种结合第一预设文本和第二预设文本识别目标语音的流程示意图;图5为本专利技术实施例提供的一种语音识别的信令交互图;图6为本专利技术实施例提供的终端设备的结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。下面结合附图,详细说明本专利技术的各种非限制性实施方式。方法实施例参见图1,该图为本专利技术实施例提供的一种语音识别方法的流程示意图。本专利技术实施例提供的语音识别方法,应用于终端设备。所述终端设备例如可以是笔记本电脑、台式计算机等终端设备,所述终端设备也可以是手机、平板电脑等移动终端设备,本专利技术实施例不具体限定所述终端设备。在本实施例中,所述方法例如可以通过如下步骤S101-S103实现。S101:接收语音数据,所述语音数据包括目标语音。需要说明的是,在本专利技术实施例中,所述语音数据可以是用户通过麦克风输入的语音数据。也就是说,终端设备可以通过麦克风接收所述语音数据。需要说明的是,本专利技术实施例不具体限定所述语音数据。所述语音数据可以包括一个或多个句子,也可以包括一个或多个词语。相应的,所述目标语音为所述语音数据的部分或全部内容。目标语音可以为对所述语音数据进行拆分所获得的。例如,所述语音数据包括一个句子,所述目标语音为对该句子进行拆分获得的词语所对应的语音。又如,所述语音数据包括一个词语,所述目标语音为该一个词语对应的语音。S102:比较第一预设文本的读音和所述目标语音。需要说明的是,所述终端设备保存有第一预设文本。本专利技术实施例不具体限定所述第一预设文本本文档来自技高网...
【技术保护点】
1.一种语音识别的方法,其特征在于,应用于终端设备,所述终端设备保存有第一预设文本,包括:接收语音数据;所述语音数据包括目标语音;比较所述第一预设文本的读音和所述目标语音;若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。
【技术特征摘要】
1.一种语音识别的方法,其特征在于,应用于终端设备,所述终端设备保存有第一预设文本,包括:接收语音数据;所述语音数据包括目标语音;比较所述第一预设文本的读音和所述目标语音;若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述第一预设文本发送给服务器,以便于服务器查找与所述第一预设文本相关的第二预设文本;接收服务器发送的第二预设文本;保存所述第二预设文本。3.根据权利要求2所述的方法,其特征在于,若所述第一预设文本的读音和所述目标语音的相似度小于第一阈值,所述方法还包括:比较所述第二预设文本的读音和所述目标语音;相应的,若所述第二预设文本的读音和所述目标语音的相似度大于或者等于第二阈值,将所述目标语音识别为所述第二预设文本。4.根据权利要求2所述的方法,其特征在于,所述将所述目标语音识别为所述第一预设文本,包括:比较所述第二预设文本的读音和所述目标语音,确定所述第二预设文本的读音和所述目标语音的相似度;若第一相似度大于或者等于第二相似度,将所述目标语音识别为所述第一预设文本;其中,所述第一相似度为所述第一预设文本的读音和所述目标语音的相似度;所述第二相似度为所述第二预设文本的读音和所述目标语音的相似度。5.根据权利要求4所述的方法,其特征在于,若所述第一相似度小于所述第二相似度,所述方法还包括:判断所述第二相似度是否大于或者等于第三阈值;当所述第二相似度大于或者等于第三阈值时,将所述目标语音识别为所述第二预设文本。6.根据权利要求2...
【专利技术属性】
技术研发人员:罗永浩,罗海涛,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。