语音信号处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26973595 阅读:19 留言:0更新日期:2021-01-06 00:07
本发明专利技术涉及人工智能技术领域,公开了一种语音信号处理方法、装置、电子设备及存储介质,所述方法包括:对智能设备实时采集到的音频流数据进行语音识别,得到临时识别结果;根据至少一次临时识别结果,确定对应的语料集合,所述语料集合包括至少一个语料;若之后的任一次临时识别结果与所述语料集合中的任一语料匹配,将所匹配的语料确定为所述临时识别结果的预测文本。本发明专利技术实施例提供的技术方案,提高了文本预测的效率,缩短了智能设备的响应时间。

【技术实现步骤摘要】
语音信号处理方法、装置、电子设备及存储介质
本专利技术涉及人工智能
,尤其涉及一种语音信号处理方法、装置、电子设备及存储介质。
技术介绍
随着科学技术的迅猛发展,智能设备已经拥有了强大的处理能力,使得智能设备在一定程度上能够像人类一样理解自然语言,从而实现了人机交互。自然语言处理过程中一个重要的环节是语义识别,现有的语音信号处理方法通常是基于固定的语料库实现的,即基于用户输入的语音数据对应的语音识别结果,从语料库中获取对应的语料,基于获取的语料确定语义识别结果。然而,语料库中的语料数量较多,导致匹配效率较低,从而导致语义识别速度很慢,进而延长了智能设备的响应时间,导致用户无法获到及时的回复,降低了用户体验。
技术实现思路
本专利技术实施例提供一种语音信号处理方法、装置、电子设备及存储介质,以解决现有技术中语义识别速度慢导致智能设备的响应时间长的问题。第一方面,本专利技术一实施例提供了一种语音信号处理方法,包括:对智能设备实时采集到的音频流数据进行语音识别,得到临时识别结果;根据至少一次临时识别结果,确定对应的语料集合,所述语料集合包括至少一个语料;若之后的任一次临时识别结果与所述语料集合中的任一语料匹配,将所匹配的语料确定为所述临时识别结果的预测文本。可选地,所述根据至少一次临时识别结果,确定对应的语料集合,具体包括:从语料库中选取与本次临时识别结果匹配的候选语料,得到语料集合。可选地,从语料库中选取与所述临时识别结果匹配的语料,得到语料集合,具体包括:若从语料库中确定出与本次临时识别结果匹配的候选语料的数量超过第一预设数量,根据各候选语料的文本长度,对所述候选语料进行排序,选择排序靠前的第一预设数量个候选语料,得到语料集合;或者,若从语料库中确定出与本次临时识别结果匹配的候选语料的数量超过第一预设数量,根据各候选语料的被命中的次数,对所述候选语料进行排序,选择排序靠前的第一预设数量个候选语料,得到语料集合。可选地,若之后的任一次临时识别结果与所述语料集合中的任一语料匹配,将所匹配的语料确定为所述临时识别结果的预测文本,具体包括:若下一次临时识别结果与所述语料集合中的任一语料一致,将所述语料确定为所述下一次临时识别结果的预测文本。可选地,所述方法还包括:若下一次临时识别结果与所述语料集合中的所有语料均不一致,根据所述下一次临时识别结果,重新确定语料集合。可选地,所述根据所述下一次临时识别结果,重新确定语料集合,具体包括:从所述语料库中选取与所述下一次临时识别结果匹配的候选语料,得到第一候选集合;从所述第一候选集合中选取出与之前确定出的语料集合中包含的语料均不同的候选语料,将选取出的候选语料添加到所述语料集合中。可选地,所述根据至少一次临时识别结果,确定对应的语料集合,具体包括:根据语料库包含的各语料集合对应的特征词和至少一次临时识别结果,确定对应的语料集合,所述语料库中包含相同特征词的语料被划分到同一语料集合中。可选地,所述根据语料库包含的各语料集合对应的特征词和至少一次临时识别结果,确定对应的语料集合,具体包括:若任一语料集合对应的特征词与本次临时识别结果包含的至少部分文本一致,将所述语料集合确定为本次临时识别结果对应的语料集合;或者,若任一语料集合对应的特征词与本次临时识别结果的相似度高于第一阈值,将所述语料集合确定为本次临时识别结果对应的语料集合。可选地,所述根据语料库包含的各语料集合对应的特征词和至少一次临时识别结果,确定对应的语料集合,具体包括:根据至少一次临时识别结果与所述特征词的匹配结果,确定本次临时识别结果中的无效文本;根据各语料集合对应的特征词和至少一次临时识别结果中除去所述无效文本的有效文本,确定对应的语料集合。可选地,所述根据至少一次临时识别结果与所述特征词的匹配结果,确定本次临时识别结果中的无效文本,具体包括:若本次临时识别结果匹配到的第一特征词和上一次临时识别结果匹配到的第二特征词不同,且所述第一特征词与本次临时识别结果的相似度高于所述第二特征词与上一次临时识别结果的相似度,确定所述上一次临时识别结果为无效文本;或者,若本次临时识别结果中包含预设的高频词汇,且本次临时识别结果匹配到的第一特征词对应的相似度高于上一次临时识别结果匹配到的第二特征词对应的相似度,确定所述本次临时识别结果中包含的高频词汇前的文本为无效文本。可选地,根据以下方式确定之后的任一次临时识别结果与所述语料集合中的任一语料匹配:根据之后的任一次临时识别结果与所述语料集合中的任一语料的相似度,确定与所述任一次临时识别结果匹配的语料;或者若所述语料集合中的任一语料包含之后的任一次临时识别结果,确定所述任一语料为与所述任一次临时识别结果匹配的语料。可选地,所述根据之后的任一次临时识别结果与所述语料集合中的任一语料的相似度,确定与所述任一次临时识别结果匹配的语料,具体包括:若第一语料的相似度和第二语料的相似度的差值大于预设差值,确定所述第一语料为本次临时识别结果匹配到的语料,所述第一语料为所述语料集合中与本次临时识别结果的相似度最高的语料,所述第二语料为所述语料集合中与本次临时识别结果的相似度次高的语料;或者,若所述语料库中,分别与相邻的多次临时识别结果的相似度最高的语料均为第一语料,且所述多次临时识别结果与所述第一语料的相似度的变化趋势为先增大后减小,确定所述第一语料为与第一临时识别结果匹配的语料,所述第一临时识别结果为所述多次临时识别结果中与所述第一语料的相似度的值最高的临时识别结果。可选地,所述方法还包括:在本次临时识别结果中包含的已识别文本后增加截断标识,其中,所述已识别文本为所述预测文本对应的临时识别结果;根据至少一次临时识别结果中截断标识后的文本,确定对应的语料集合。可选地,在首次根据至少一次临时识别结果,确定对应的语料集合之前,还包括:确定所述临时识别结果包含的文字数量超过第二预设数量。可选地,所述方法还包括:若在所述智能设备实时采集到的音频流数据中检测到语音结束点,清空之前得到的临时识别结果,并返回对智能设备实时采集到的音频流数据进行语音识别,得到临时识别结果的步骤。第二方面,本专利技术一实施例提供了一种语音信号处理装置,包括:语音识别模块,用于对智能设备实时采集到的音频流数据进行语音识别,得到临时识别结果;确定模块,用于根据至少一次临时识别结果,确定对应的语料集合,所述语料集合包括至少一个语料;预测模块,用于若之后的任一次临时识别结果与所述语料集合中的任一语料匹配,将所匹配的语料确定为所述临时识别结果的预测文本。可选地,所述确定模块,具体用于:从语料库中选取与本次临时识别结果匹配的候选语料,得到语料集合。可选地,所述确定模块,具体用于:若从语料库中确定出与本次临时识别结果匹配本文档来自技高网...

【技术保护点】
1.一种语音信号处理方法,其特征在于,包括:/n对智能设备实时采集到的音频流数据进行语音识别,得到临时识别结果;/n根据至少一次临时识别结果,确定对应的语料集合,所述语料集合包括至少一个语料;/n若之后的任一次临时识别结果与所述语料集合中的任一语料匹配,将所匹配的语料确定为所述临时识别结果的预测文本。/n

【技术特征摘要】
1.一种语音信号处理方法,其特征在于,包括:
对智能设备实时采集到的音频流数据进行语音识别,得到临时识别结果;
根据至少一次临时识别结果,确定对应的语料集合,所述语料集合包括至少一个语料;
若之后的任一次临时识别结果与所述语料集合中的任一语料匹配,将所匹配的语料确定为所述临时识别结果的预测文本。


2.根据权利要求1所述的方法,其特征在于,所述根据至少一次临时识别结果,确定对应的语料集合,具体包括:
从语料库中选取与本次临时识别结果匹配的候选语料,得到语料集合。


3.根据权利要求2所述的方法,其特征在于,所述从语料库中选取与所述临时识别结果匹配的语料,得到语料集合,具体包括:
若从语料库中确定出与本次临时识别结果匹配的候选语料的数量超过第一预设数量,根据各候选语料的文本长度,对所述候选语料进行排序,选择排序靠前的第一预设数量个候选语料,得到语料集合;或者
若从语料库中确定出与本次临时识别结果匹配的候选语料的数量超过第一预设数量,根据各候选语料的被命中的次数,对所述候选语料进行排序,选择排序靠前的第一预设数量个候选语料,得到语料集合。


4.根据权利要求1至3中任一所述的方法,其特征在于,若之后的任一次临时识别结果与所述语料集合中的任一语料匹配,将所匹配的语料确定为所述临时识别结果的预测文本,具体包括:
若下一次临时识别结果与所述语料集合中的任一语料一致,将所述语料确定为所述下一次临时识别结果的预测文本。


5.根据权利要求1所述的方法,其特征在于,所述根据至少一次临时识别结果,确定对应的语料集合,具体包括:
根据语料库包含的各语料集合对应的特征词和至少一次临时识别结果,确定对应的语料集合,所述语料库中包含相同特...

【专利技术属性】
技术研发人员:李思达韩伟王阳阳李曙光
申请(专利权)人:北京猎户星空科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1