一种语音识别方法、终端、系统以及计算机存储介质技术方案

技术编号:23402001 阅读:21 留言:0更新日期:2020-02-22 14:04
本发明专利技术实施例公开了一种语音识别方法、终端、系统以及计算机存储介质,其中的方法可包括:接收第一语音信息,将所述第一语音信息转化为初始信息,输出所述初始信息;当检测到针对所述初始信息的第一操作时,输出与所述初始信息对应的候选信息;当检测到针对所述候选信息的第二操作时,获取更正对象;根据所述更正对象更新所述初始信息,得到和/或输出目标信息;本发明专利技术能够实现快速、准确的对语音信息进行识别和修改,提高语音识别效率。

A speech recognition method, terminal, system and computer storage medium

【技术实现步骤摘要】
一种语音识别方法、终端、系统以及计算机存储介质
本专利技术涉及计算机应用
,尤其涉及语音识别方法、终端、系统以及计算机存储介质。
技术介绍
随着智能手机的不断发展,语音助手功能如雨后春笋般蓬勃发展,广受用户喜爱,用户可以通过与语音助手实现智能对话,解决部分问题。目前,用户可以通过与手机语音助手进行语音交流,但是当前语音识别技术并不能完全识别连续发音问题等问题,容易出现语音识别错误。当设备针对一条语音信息识别错误时,往往在语音助手的显示界面中会有所体现,比如显示错误识别信息,导致用户发起的语音指令被识别错误,直接影响终端设备执行指令的准确性。对此,用户可以重新发起语音指令。这样一来,一方面,一条语音信息往往只有少数字符对象识别错误,另一方面,基于再次发起的语音指令的识别可能仍然不准确,可见,目前的识别方案存在识别效率低下的问题。
技术实现思路
本专利技术实施例提供了一种语音识别方法、终端、系统以及计算机存储介质,可高效地得到语音识别结果。一方面,本专利技术第一实施例提供了一种语音识别方法,包括:接收第一语音信息,将所述第一语音信息转化为初始信息,输出所述初始信息;当检测到针对所述初始信息的第一操作时,输出与所述初始信息对应的候选信息;当检测到针对所述候选信息的第二操作时,获取更正对象;根据所述更正对象更新所述初始信息,得到和/或输出目标信息。可选地,接收第一语音信息,将所述第一语音信息转化为初始信息,包括:获取根据所述第一语音信息中转化得到的目标初始对象;识别所述目标初始对象的类型;根据所述目标初始对象类型得到初始信息。可选的,所述根据所述目标初始对象类型得到初始信息包括:调取所述目标初始对象类型对应的关联数据库,若在所述关联数据库中查找到与所述目标初始对象之间的匹配度满足第一预设阈值的对象,则根据查找到的对象对所述目标初始对象进行更新,以得到初始信息;或,联网搜索与所述目标初始对象类型对应的对象,若查找到与所述目标初始对象之间的匹配度满足第二预设阈值的对象,则根据查找到的对象对所述目标初始对象进行更新,以得到初始信息;所述第一预设阈值和所述第二预设阈值相同或不同。可选地,调取所述目标初始对象类型对应的关联数据库,若在所述关联数据库中查找到与所述目标初始对象之间的匹配度满足第一预设阈值的对象,则根据查找到的对象对所述目标初始对象进行更新,以得到初始信息;或,联网搜索与所述目标初始对象类型对应的对象,若查找到与所述目标初始对象之间的匹配度满足第二预设阈值的对象,则根据查找到的对象对所述目标初始对象进行更新,以得到初始信息;所述第一预设阈值和所述第二预设阈值相同或不同。可选的,当识别所述目标初始对象的类型为联系人类型时,则将终端存储的通讯录数据库作为所述关联数据库;和/或,当识别所述目标初始对象的类型为应用名称类型时,则将终端记录的应用数据库作为所述关联数据库;和/或,当识别所述目标初始对象的类型为未知类型时,则联网搜索与所述目标初始对象类型对应的对象。可选的,对所述初始信息或所述目标信息进行语义分析,输出控制指令。可选的,输出所述初始信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种,或输出所述候选信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种,或输出所述目标信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种,或输出所述控制指令的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种;所述初始信息、所述候选信息、所述目标信息以及所述控制指令显示位置相同或不同。可选的,所述方法应用于所述语音识别系统,所述语音识别系统包括至少一个第一终端,至少一个第二终端,所述第一终端用以接收所述第一语音信息,所述第二终端用以输出所述控制指令。可选地,还包括:输出语音更正标识;通过所述语音更正标识重新录入语音更正信息;根据所述语音更正信息更新所述初始信息;和/或,输出所述初始信息和/或所述语音更正信息。可选的,所述方法应用于所述语音识别系统,所述语音识别系统包括至少一个第一终端,至少一个第二终端,所述第一终端用以接收第一语音信息,所述第二终端用以输出所述语音更正标识,并接收所述重新录入的语音更正信息。可选地,所述初始信息的类型或所述目标信息的类型,包括文本、图像、音频、视频、文件中的至少一种;和/或,所述第一操作或所述第二操作包括:长按、重按、滑动、隔空手势操作、相邻两次点击操作之间的时间间隔小于预设阈值的N次点击操作,所述N为大于等于2的整数中的至少一种;所述第一操作和所述第二操作相同或不同。可选的,输出所述初始信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种,或输出所述候选信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种,或输出所述目标信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种;所述初始信息、所述候选信息以及所述目标信息的显示位置相同或不同。可选的,所述方法应用于所述语音识别系统,所述语音识别系统包括至少一个第一终端,至少一个第二终端,所述第一终端用以接收第一语音信息,所述第二终端用以输出所述初始信息或输出候选信息或输出所述目标信息。另一方面,本专利技术实施例还提供了一种语音识别方法,所述方法应用于所述语音识别系统,所述语音识别系统包括至少一个第一终端,至少一个第二终端,包括:从所述第一终端接收第一语音信息,并将所述第一语音信息转化为初始信息;根据所述初始信息得到和/或输出目标信息。可选的,所述根据所述初始信息得到和/或输出目标信息包括:在所述第一终端和/或所述第二终端上输出所述初始信息;当检测到针对所述初始信息的第一操作时,在所述第一终端和/或所述第二终端上输出与所述初始信息对应的候选信息;当检测到针对所述候选信息的第二操作时,获取更正对象;根据所述更正对象更新所述初始信息,得到目标信息,和/或在所述第一终端和/或所述第二终端上输出目标信息。可选的,输出所述初始信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种,或输出所述候选信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种,或输出所述目标信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种;所述初始信息、所述候选信息以及所述目标信息的显示位置相同或不同;和/或,所述第一操作或所述第二操作包括:长按、重按、滑动、隔空手势操作、相邻两次点击操作之间的时间间隔小于预设阈值的N次点击操作,所述N为大于等于2的整数中的至少一种;所述第一操作和所述第二操作相同或不同。可选的,所述从所述第一终端接收第一语音信息,并将所述第一语音信息转化为初始信息,包括:获取根据所述第一语音信息中转化得到的目标初始对象;识别所述目标初始对象的类型;根据所述目标初始对象类型得到初始信息。可选的,所述根据所述目标初始对象类型得到初始信息步骤,包括:调取所述目标初始对象类型对应的关联数据库,若在所述关联数据库中查找到与所述目标初始对象之间的匹配度满足第一预设阈值的对象,本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,包括步骤:/n接收第一语音信息,将所述第一语音信息转化为初始信息,输出所述初始信息;/n当检测到针对所述初始信息的第一操作时,输出与所述初始信息对应的候选信息;/n当检测到针对所述候选信息的第二操作时,获取更正对象;/n根据所述更正对象更新所述初始信息,得到和/或输出目标信息。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,包括步骤:
接收第一语音信息,将所述第一语音信息转化为初始信息,输出所述初始信息;
当检测到针对所述初始信息的第一操作时,输出与所述初始信息对应的候选信息;
当检测到针对所述候选信息的第二操作时,获取更正对象;
根据所述更正对象更新所述初始信息,得到和/或输出目标信息。


2.根据权利要求1所述的方法,其特征在于,接收第一语音信息,将所述第一语音信息转化为初始信息,包括:
获取根据所述第一语音信息中转化得到的目标初始对象;
识别所述目标初始对象的类型;
根据所述目标初始对象类型得到初始信息。


3.根据权利要求2所述的方法,其特征在于,所述根据所述目标初始对象类型得到初始信息包括:
调取所述目标初始对象类型对应的关联数据库,若在所述关联数据库中查找到与所述目标初始对象之间的匹配度满足第一预设阈值的对象,则根据查找到的对象对所述目标初始对象进行更新,以得到初始信息;或,
联网搜索与所述目标初始对象类型对应的对象,若查找到与所述目标初始对象之间的匹配度满足第二预设阈值的对象,则根据查找到的对象对所述目标初始对象进行更新,以得到初始信息;
所述第一预设阈值和所述第二预设阈值相同或不同。


4.根据权利要求3所述的方法,其特征在于,
当识别所述目标初始对象的类型为联系人类型时,则将终端存储的通讯录数据库作为所述关联数据库;和/或,
当识别所述目标初始对象的类型为应用名称类型时,则将终端记录的应用数据库作为所述关联数据库;和/或,
当识别所述目标初始对象的类型为未知类型时,则联网搜索与所述目标初始对象类型对应的对象。


5.根据权利要求1至4任一所述的方法,其特征在于,还包括:
对所述初始信息或所述目标信息进行语义分析,输出控制指令。


6.根据权利要求5所述的方法,其特征在于,
输出所述初始信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种,或
输出所述候选信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种,或
输出所述目标信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种,或
输出所述控制指令的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种;
所述初始信息、所述候选信息、所述目标信息以及所述控制指令输出位置相同或不同。


7.根据权利要求5所述的方法,其特征在于,所述方法应用于所述语音识别系统,所述语音识别系统包括至少一个第一终端,至少一个第二终端,所述第一终端用以接收所述第一语音信息,所述第二终端用以输出所述控制指令。


8.根据权利要求1至4任一所述的方法,其特征在于,还包括:
输出语音更正标识;
通过所述语音更正标识重新录入语音更正信息;
根据所述语音更正信息更新所述初始信息;和/或,
输出所述初始信息和/或所述语音更正信息。


9.根据权利要求8所述的方法,其特征在于,所述方法应用于所述语音识别系统,所述语音识别系统包括至少一个第一终端,至少一个第二终端,所述第一终端用以接收第一语音信息,所述第二终端用以输出所述语音更正标识,并接收所述重新录入的语音更正信息。


10.根据权利要求1至4任一所述的方法,其特征在于,
所述初始信息的类型或所述目标信息的类型,包括文本、图像、音频、视频、文件中的至少一种;和/或,
所述第一操作或所述第二操作包括:长按、重按、滑动、隔空手势操作、相邻两次点击操作之间的时间间隔小于预设阈值的N次点击操作,所述N为大于等于2的整数中的至少一种;
所述第一操作和所述第二操作相同或不同。


11.根据权利要求1至4任一所述的方法,其特征在于,
输出所述初始信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种,或
输出所述候选信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种,或
输出所述目标信息的位置包括当前界面、预设固定屏幕区域、悬浮窗口中的至少一种;
所述初始信息、所述候选信息以及所述目标信息的输出位置相同或不同。


12.根据权利要求1至4任一所述的方法,其特征在于,所述方法应用于所述语音识别系统,所述语音识别系统包括至少一个第一终端,至少一个第二终端,所述第一终端用以接收第一语音信息,所述第二终端用以输出所述初始信息或输出所述候选信息或输出所述目标信息。


13.一种语音识别方法,所述方法应用于语音识别系统,所述语音识别系统包括至少一个第一终端,至少一个第二终端,其特征在于,包括:
从所述第一终端接收第一语音信息,并将所述第一语音信息转化为初始信息;
根据所述初始信息得到和/或输出目标信息。


14.根据权利要求13的方法,其特征在于:所述根据所述初始信息得到和/或输出目标信息包括:
在所述第一终端和/或所述第二终端上输出所述初始信息;
当检测到针对所述初始信息的第一操作时,在所述第一终端和/或所述第二终端上输出与所述初始信息对应的候选对象;
当检测到针对所述候选信息的第二操作时,获取更正对象;
根据所述更正对象更新所述初始...

【专利技术属性】
技术研发人员:肖明李凌志陆伟峰朱荣昌唐僖僖
申请(专利权)人:深圳传音控股股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1