一种语音交互方法、装置及介质制造方法及图纸

技术编号:40419231 阅读:22 留言:0更新日期:2024-02-20 22:37
本发明专利技术提出一种语音交互方法、装置及介质,具有生成语音的语义音色准确和各部分协同程度高的特点。该语音交互方法,包括:对输入的语音信号做分帧处理,得到语音帧序列;所述语音帧序列中,位置在后的后一帧语音包含在其之前的前一帧语音;根据所述语音帧序列中的声学特征信息,获得最终合成语音;根据所述语音帧序列中的语义特征信息,获得最终反馈文本;根据最终合成语音和最终反馈文本,生成用于语音交互的语音文本。

【技术实现步骤摘要】

本专利技术涉及声学语言领域,具体涉及一种语音交互方法、装置及介质


技术介绍

1、语音交互作为在人机交互领域已得到较好效果的应用,通常来说,语音交互是通过对用户输入的语音进行语义识别,从识别的语义中抽取领域、意图和词槽信息,进而得到与用户做交互的语音文本,再采用默认语音对待交互的语音文本与用户做交互。这种交互方式,没有结合用户的声学特征来对人机交互装置输出的语音文本做限制。

2、此外,从现有技术来看,语音识别、语音合成和语音交互三者均有成熟的模型,各模型通常独立运行,在各自模型内对输入数据处理后再输出数据到其他模型进行再次处理,语音识别、合成和交互部分相关性较低,影响效率,存在不足。


技术实现思路

1、为解决
技术介绍
中存在的技术问题,本专利技术提出一种语音交互方法、装置及介质,具有生成语音的语义音色准确和语音识别、合成和交互各部分协同程度高的特点。

2、本专利技术的技术方案为:

3、一方面,本专利技术提供了一种语音交互方法,包括:

4、对用户输入的语音信号做分帧本文档来自技高网...

【技术保护点】

1.一种语音交互方法,其特征在于,包括:

2.根据权利要求1所述的语音交互方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的语音交互方法,其特征在于,对用户输入的语音信号做分帧处理,得到语音帧序列的步骤,包括:

4.根据权利要求1所述的语音交互方法,其特征在于,根据所述语音帧序列中的声学特征信息,获得最终合成语音的步骤,包括:

5.根据权利要求4所述的语音交互方法,其特征在于,根据每帧语音的声学特征标记,在预设语音数据库中匹配每帧语音对应的目标语音数据集的步骤,包括:

6.根据权利要求5所述的语音交互方法,其特征在于,...

【技术特征摘要】

1.一种语音交互方法,其特征在于,包括:

2.根据权利要求1所述的语音交互方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的语音交互方法,其特征在于,对用户输入的语音信号做分帧处理,得到语音帧序列的步骤,包括:

4.根据权利要求1所述的语音交互方法,其特征在于,根据所述语音帧序列中的声学特征信息,获得最终合成语音的步骤,包括:

5.根据权利要求4所述的语音交互方法,其特征在于,根据每帧语音的声学特征标记,在预设语音数据库中匹配每帧语音对应的目标语音数据集的步骤,包括:

6.根据权利要求5所述的语音交互方法,其特征在于,每帧语音的声学特征包括:音色、音强、音长和音高,根据每帧语音的声学...

【专利技术属性】
技术研发人员:陈光银
申请(专利权)人:重庆长安汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1