语音合成装置和方法制造方法及图纸

技术编号：16049304 阅读：49 留言：0更新日期：2017-08-20 09:07

本发明专利技术是用于针对由说话者(用户)说出的语音自动地生成口语回应的技术的改进，并且其特征在于：根据说话者的语音的音高控制口语回应的音高。接收说话者说出的话语(例如，问题)的语音信号(102)，并且检测话语的代表性部分的音高(例如，最高音高)(106)。适当地获取对话语的回应的语音数据(110、124)，并且获取基于所获取的口语回应语音数据的音高(例如，平均音高)。确定用于将获取的音高偏移至与代表性部分的音高具有特定关系的目标音高的音高偏移量(114)。当基于回应语音数据来合成口语回应时，根据音高偏移量将合成的口语回应的音高进行偏移。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】语音合成装置和方法
本专利技术涉及一种语音合成装置和方法以及一种用于执行语音合成方法的程序。
技术介绍
近年来，提出了以下话音或语音合成技术。这些提出的话音或语音合成技术包括如下两种技术：其中，一种技术合成和输出与用户的说话的音调和语音质量相对应的语音，从而产生更接近真实人声的语音(例如，见专利文献1)，另一种技术分析用户的语音以评价用户的心理状况和健康状况等(例如，见专利文献2)。近年来还提出了一种语音交互系统，其通过在合成的语音中输出由情景指定的内容的同时识别由用户输入的语音来实现与用户的语音交互(例如，见专利文献3)。现有技术文献：专利文献：专利文献1：日本专利申请公开出版物No.2003-271194专利文献2：日本专利No.4495907专利文献3：日本专利No.4832097现在，我们假设这样一种交互系统，其将前述语音合成技术和语音交互系统进行组合，并且针对通过用户的语音而给出的问题以通过话音或语音合成而合成的语音的形式来输出应答。然而，这种假设的交互系统有时会给用户这样一种感觉，就好像机器在说出回应一样。
技术实现思路
鉴于以上内容，因此本专利技术的一个...
语音合成装置和方法

【技术保护点】
一种语音合成装置，包括：接收部分，其接收话语的语音信号；音高检测部分，其基于由所述接收部分接收到的语音信号来检测所述话语的代表性部分的音高；回应获取部分，其获取对所述话语的回应的语音数据；回应音高获取部分，其获取基于由所述回应获取部分获取的回应的语音数据的音高；音高偏移量确定部分，其确定用于将由所述回应音高获取部分获取的音高偏移至与所述代表性部分的音高具有特定关系的目标音高的音高偏移量；以及回应合成部分，其基于所述回应的语音数据来合成所述回应的语音，所述回应合成部分配置为根据所述音高偏移量来对待合成的所述回应的语音的音高进行偏移。

【技术特征摘要】
【国外来华专利技术】2014.10.20 JP 2014-2138521.一种语音合成装置，包括：接收部分，其接收话语的语音信号；音高检测部分，其基于由所述接收部分接收到的语音信号来检测所述话语的代表性部分的音高；回应获取部分，其获取对所述话语的回应的语音数据；回应音高获取部分，其获取基于由所述回应获取部分获取的回应的语音数据的音高；音高偏移量确定部分，其确定用于将由所述回应音高获取部分获取的音高偏移至与所述代表性部分的音高具有特定关系的目标音高的音高偏移量；以及回应合成部分，其基于所述回应的语音数据来合成所述回应的语音，所述回应合成部分配置为根据所述音高偏移量来对待合成的所述回应的语音的音高进行偏移。2.根据权利要求1所述的语音合成装置，其中，所述音高偏移量确定部分确定所述目标音高以使得所述目标音高落入距离获取的音高的预定范围内。3.根据权利要求2所述的语音合成装置，其中，所述音高偏移量确定部分逐八度音地调整所述目标音高，以使得所述目标音高落在距离获取的音高的预定范围内。4.根据权利要求1至3中的任一项所述的语音合成装置，其中，所述音高检测部分检测所接收到的语音信号中的音量为预定值或更大的部分的最高音高作为所述代表性部分的音高。5.根据权利要求1至4中的任一项所述的语音合成装置，其中，所述音高检测部分检测所接收到的语音信号的结尾部分中的音高作为所述代表性部分的音高。6.根据权利要求1至5中的任一项所述的语音合成装置，其中，所述音高偏移量确定部分确定与所述代表性部分的音高具有协和音程关系的音高...

【专利技术属性】
技术研发人员：嘉山启，松原弘明，
申请(专利权)人：雅马哈株式会社，
类型：发明
国别省市：日本,JP

全部详细技术资料下载我是这个专利的主人