【技术实现步骤摘要】
自适应的人机语音对话装置和设备、交互系统和车辆
本专利技术涉及一种自适应的人机语音对话装置、一种人机语音交互系统、一种自适应的人机语音对话设备和一种车辆。本专利技术的实施例涉及对话式交互技术,更具体而言,涉及用通过TTS技术将文本转换自适应地转换成流畅的语音的装置、系统和设备。
技术介绍
当前语音交互的产品,我们称之为ChatBot(聊天机器人),基本分为两种,一种是开放域(OpenDomain)聊天产品;另一种是任务导向(TaskOriented)聊天。以类似“订机票”,“询问天气”这样单一任务为导向的语音聊天互动已经相对比较成熟,并且使用也越来越广泛。但是,现有技术中录制的真人声音模板较为有限,用户无法自行设置音色,更无法获得客制化声音的语音互动服务。因此,如何利用现有语音聊天系统以及配套硬件设备按照用户意图来实现音色等调节功能,以提供更好的用户体验成为一个亟待解决的问题。
技术实现思路
为了解决现有技术的问题,本专利技术实施例提供了一种自适应的人机语音对话装置、一种人机语音交互系统、一种自适应的人机语音对话设备和一种车辆。所述技术方案如下:按照第一方面,本专利技术涉及一种自适应的人机语音对话装置,包括:-语音获取模块,用于获取语音信息;-语音识别模块,用于生成语音信息对应的文本信息;-语义理解模块,用于分析语音信息对应的语义信息;-对话管理模块;用于根据语义信息决定对话过程;-对话生成模块,用于基于对话过程生成对话文本;其特征在 ...
【技术保护点】
1.自适应的人机语音对话装置(200),包括:/n-语音获取模块(201),用于获取语音信息(11);/n-语音识别模块(202),用于生成语音信息对应的文本信息(12);/n-语义理解模块(203),用于分析语音信息对应的语义信息(13);/n-对话管理模块(204);用于根据语义信息决定对话过程;/n-对话生成模块(205),用于基于对话过程生成对话文本(15);/n其特征在于,所述人机语音对话装置进一步包括:/n-语音片段形成模块(207),用于从由语音获取模块(201)所获取的语音信息(11)和由语音识别模块(202)所生成的文本信息(12)形成语音片段组;/n-语音合成模块(209),用于基于所形成的语音片段组和所生成的对话文本(15)合成语音对话。/n
【技术特征摘要】
1.自适应的人机语音对话装置(200),包括:
-语音获取模块(201),用于获取语音信息(11);
-语音识别模块(202),用于生成语音信息对应的文本信息(12);
-语义理解模块(203),用于分析语音信息对应的语义信息(13);
-对话管理模块(204);用于根据语义信息决定对话过程;
-对话生成模块(205),用于基于对话过程生成对话文本(15);
其特征在于,所述人机语音对话装置进一步包括:
-语音片段形成模块(207),用于从由语音获取模块(201)所获取的语音信息(11)和由语音识别模块(202)所生成的文本信息(12)形成语音片段组;
-语音合成模块(209),用于基于所形成的语音片段组和所生成的对话文本(15)合成语音对话。
2.如权利要求1所述的人机语音对话装置(200),其特征在于,所述语音合成模块(209)包括音色调整模块(208),所述音色调整模块在生成语音对话时控制语速、音调、音量和音频码率中至少一项。
3.如权利要求1或2所述的人机语音对话装置(200),其特征在于,所述语音片段形成模块(207)通过如下方式形成语音片段组:
-在由语音识别模块(202)所生成的文本信息(12)中搜索与预设的模板中相同的信息片段;
-从由语音获取模块(201)所获取的语音信息截取与所述信息片段对应的语音信息;
-将所截取的语音信息与信息片段对应地存储为语音片段组。
4.如权利要求1至3之一所述的人机语音对话装置(200),其特征在于,所获取的语音信息(11)包括所述用户或他人的语音录音和/或现场谈话,并且特定于个人地形成语音片段组。
5.如权利要求1至4之一所述的人机语音对话装置(200),其特征在于,所述语音识别模块(202)用于:
通过声学模型和语言模型利用自动语音识别技术将用户(10)的语音识别为文本。
6.如权利要求1至5之一所述的人机语音对话装置(200),其特征在于,所述语义理解模块(203)用于:
-确定对话中的领域;
-分析用户(10)的意图;和
-获得对话中的语义信息(13)。
7.如权利要求1至6之一所述的人机语音对话装置(200),其特征在于,所述对...
【专利技术属性】
技术研发人员:雷文辉,张晓竹,朱江,周晓颖,赖胜,G·哈默雷尔,孙锡,
申请(专利权)人:宝马股份公司,
类型:发明
国别省市:德国;DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。