应用于智能机器人的语音优化方法及装置制造方法及图纸

技术编号：14781987 阅读：149 留言：0更新日期：2017-03-10 00:53

本发明专利技术公开了一种应用于智能机器人的语音优化方法及装置，该方法包括：获取用户的多模态输入数据；响应该多模态输入数据生成文本信息；在确定满足设定的触发规则时，对所述文本信息进行文本分析，并根据分析结果查询相应的媒体文件和应答信息；将所述媒体文件与TTS系统生成的响应所述应答信息的TTS语音按设定规则输出。本发明专利技术通过将媒体文件与TTS语音相结合输出，使机器人语音输出更具有人类语言的特点、韵律良好，让用户感觉舒服，提高机器人能力，满足用户的交互需求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及智能机器人领域，尤其涉及一种应用于智能机器人的语音优化方法及装置。
技术介绍
随着智能机器人产品的逐渐普及，更多的智能机器人走进家庭，成为孩子的玩伴和大人的管家。现有的智能机器人已经能够与用户通过语言交流的方式回答用户的问题或者进行简单的聊天，但是由于技术上的限制，机器人在与用户进行语言交流时发出的声音还是以机器声音为主，声音较为强硬且不带有感情，因此，现有的人机交互过程会给用户带来不好的体验。因此，亟需提供一种解决方案，该方案能够优化声音体验，让与机器人进行交互的用户感觉舒服，提高智能机器人的交互能力，满足用户的交互需求。
技术实现思路
本专利技术所要解决的技术问题之一是需要提供一种能够优化声音体验，使机器人语音输出更具有人类语言的特点，提高智能机器人的交互能力的应用于智能机器人的语音优化方法及装置。为了解决上述技术问题，本申请的实施例首先提供了一种应用于智能机器人的语音优化方法，包括：获取用户的多模态输入数据；响应该多模态输入数据生成文本信息；对所述文本信息进行文本分析，并根据分析结果查询相应的应答信息；在确定满足设定的触发规则时，将相应的媒体文件与TTS系统生成的响应所述应答信息的TTS语音按照设定规则输出。优选地，在如下情况下，确定满足所述设定的触发规则：在接收到来自用户的特定语句信息时；或者，满足设定播放媒体文件的播放时间。优选地，将所述媒体文件与TTS语音合成后输出。优选地，在输出TTS语音之前输出所述媒体文件。根据本专利技术的另一方面，还提供了一种应用于智能机器人的语音优化装置，包括：多模态输入单元，其用于获取用户的多模态输入数据...
应用于智能机器人的语音优化方法及装置

【技术保护点】
一种应用于智能机器人的语音优化方法，包括：获取用户的多模态输入数据；响应该多模态输入数据生成文本信息；对所述文本信息进行文本分析，并根据分析结果查询相应的应答信息；在确定满足设定的触发规则时，将相应的媒体文件与TTS系统生成的响应所述应答信息的TTS语音按照设定规则输出。

【技术特征摘要】
1.一种应用于智能机器人的语音优化方法，包括：获取用户的多模态输入数据；响应该多模态输入数据生成文本信息；对所述文本信息进行文本分析，并根据分析结果查询相应的应答信息；在确定满足设定的触发规则时，将相应的媒体文件与TTS系统生成的响应所述应答信息的TTS语音按照设定规则输出。2.根据权利要求1所述的语音优化方法，其特征在于，在如下情况下，确定满足所述设定的触发规则：在接收到来自用户的特定语句信息时；或者，满足设定播放媒体文件的播放时间。3.根据权利要求1或2所述的语音优化方法，其特征在于，将所述媒体文件与TTS语音合成后输出。4.根据权利要求1或2所述的语音优化方法，其特征在于，在输出TTS语音之前输出所述媒体文件。5.一种应用于智能机器人的语音优化装置，包括：多模态输入单...

【专利技术属性】
技术研发人员：谢文静，
申请(专利权)人：北京光年无限科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人