The invention discloses a speech interaction method, device, system, storage medium and processor, the method comprises: acquiring input speech stream, sending input speech schools to each speech recognition engine for speech recognition, selecting the target speech recognition result after obtaining each speech recognition result; sending the target speech recognition result to each natural language processing engine after obtaining The target semantic processing results are selected from the semantic processing results, and the input speech stream is replied according to the target semantic processing results. In the above method, the target speech recognition results are screened out from each speech recognition result, and distributed to multiple natural language processing engines. The target semantic processing results are selected from the semantic processing results, avoiding the single ASR, NLP, TTS processing in the speech interaction process, which has great limitations. If the ASR and / or NLP recognition is not correct, it will affect the speech interaction Problem.
【技术实现步骤摘要】
一种语音交互方法、装置、系统、存储介质及处理器
本专利技术涉及人机交互
,尤其涉及一种语音交互方法、装置、系统、存储介质及处理器。
技术介绍
在语音交互过程中,智能音箱采集输入的语音数据,经过语音识别ASR(AutomaticSpeechRecognition)后将识别到的文字发送给自然语言处理NLP(NaturalLanguageProcessing),采用语音合成技术TTS(TextToSpeech)将语义理解后语音返回端侧进行播放。现有的语音交互过程是采用单一的ASR、NLP、TTS对输入语音流进行处理,局限性比较大,若前期ASR识别不准,同时会影响到NLP的理解或者ASR识别准确,NLP理解不够,会影响到整个语音交互过程。
技术实现思路
有鉴于此,本专利技术提供一种基于区块链的基础设施服务方法及装置,用以解决现有的语音交互过程大都是单一的ASR、NLP、TTS的处理,局限性比较大,譬如前期ASR识别不准,同时会影响到NLP的理解或者ASR识别准确,如果NLP理解不够,同样会影响到整个语音交互过程的问题,具体方案如下:一种语音交互方法,包括:获取输入语音流,将所述输入语音流派发给各个目标语音识别引擎进行语音识别,得到各个语音识别结果;在所述各个语音识别结果中选取目标语音识别结果;将所述目标语音识别结果派发给各个目标自然语言处理引擎,得到各个语义处理结果;在所述各个语义处理结果中选取目标语义处理结果;依据所述目标语义处理结果对所述输 ...
【技术保护点】
1.一种语音交互方法,其特征在于,包括:/n获取输入语音流,将所述输入语音流派发给各个目标语音识别引擎进行语音识别,得到各个语音识别结果;/n在所述各个语音识别结果中选取目标语音识别结果;/n将所述目标语音识别结果派发给各个目标自然语言处理引擎,得到各个语义处理结果;/n在所述各个语义处理结果中选取目标语义处理结果;/n依据所述目标语义处理结果对所述输入语音流进行回复。/n
【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:
获取输入语音流,将所述输入语音流派发给各个目标语音识别引擎进行语音识别,得到各个语音识别结果;
在所述各个语音识别结果中选取目标语音识别结果;
将所述目标语音识别结果派发给各个目标自然语言处理引擎,得到各个语义处理结果;
在所述各个语义处理结果中选取目标语义处理结果;
依据所述目标语义处理结果对所述输入语音流进行回复。
2.根据权利要求1所述的方法,其特征在于,在所述各个语音识别结果中选取目标语音识别结果,包括:
获取每一个语音识别结果的识别率;
将各个识别率中识别率最高的识别结果作为目标识别结果。
3.根据权利要求1所述的方法,其特征在于,在所述各个语义处理结果中选取目标语义处理结果,包括:
获取每一个语义处理结果的置信度;
将各个置信度中置信度最高的语义处理结果作为目标语义处理结果。
4.根据权利要求1所述的方法,其特征在于,依据所述目标语义处理结果对所述输入语音流进行回复,包括:
获取与所述目标语义处理结果匹配的目标回复和确定产生所述输入语音流的用户群体;
依据所述用户群体,确定目标语音合成引擎;
将所述目标回复通过所述目标语音合成引擎转换为输出语音流。
5.根据权利要求4所述的方法,其特征在于,所述确定产生所述输入语音流的用户群体,包括:
获取识别所述目标语音识别结果的目标语音识别引擎的类型和/或人脸语音识别结果;
依据所述类型和/或所述人脸语音识别结果,确定所述用户群体。
6.一种语音交互装置,其特征在于,包括:
获取和识别模块,用于获取输入语音流,将所述输入语音流派发给各个目标语音识别引擎进行语音识别,得到各个语音识别结果;
语音识别结果选取模块,用于在所述各个语音识别结果中选取目标语音识别...
【专利技术属性】
技术研发人员:陈孝良,丁玉江,李智勇,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。