The voice synthesis device according to the embodiment has a voice synthesis unit (10), a speaker parameter storage unit (50), a decision unit (60) and a speaker parameter control unit (40). The voice synthesis unit (10) can control the speaker characteristics of the synthesized voice according to the value of the parameter related to the speaker characteristics, that is, the speaker parameter value. The speaker parameter storage unit (50) stores the registered speaker parameter values. The decision unit (60) determines whether the input speaker parameter value can be used according to the result of comparing the input speaker parameter value with the registered speaker parameter value respectively. The speaker parameter control unit (40) prohibits or restricts the utilization of the speaker parameter value determined to be unavailable by the availability determination unit (60).
【技术实现步骤摘要】
【国外来华专利技术】声音合成装置、声音合成方法及程序
本专利技术的实施方式涉及声音合成装置、声音合成方法及程序。
技术介绍
在声音合成中具有这样的需求,对于所生成的合成声音的讲话者,不仅从事前准备的少数候选中进行选择,而且想要重新生成适合于想阅读的内容的讲话者特性或利用者独自的讲话者特性。作为应对此需求的手段,例如提出了根据与讲话者特性相关的参数的操作使生成新的讲话者特性的技术。随着这种技术的性能提高,在利用者想要自由地生成原创性较高的各种各样的讲话者特性时,可以预见想要把新生成的讲话者特性作为独自的讲话者特性而独占利用的需求高涨。但是,存在与某一利用者生成的讲话者特性相同或者相似的讲话者特性偶然地由其他利用者生成并在实际的产品/服务等中使用的可能性,而不能应对那样的需求。现有技术文献专利文献专利文献1:日本专利第4296231号公报
技术实现思路
专利技术要解决的课题本专利技术要解决的课题是,提供能够实现讲话者特性的独占利用的声音合成装置、声音合成方法及程序。用于解决课题的手段实施方式的声音合成装置具有声音合成部、讲话者参数存储部、可否利用判定部和讲话者参数控制部。声音合成部能够根据与讲话者特性相关的参数的值即讲话者参数值控制合成声音的讲话者特性。讲话者参数存储部存储已登记讲话者参数值。可否利用判定部根据将所输入的讲话者参数值与已登记讲话者参数值分别比较的结果,判定所输入的讲话者参数值的可否利用。讲话者参数控制部禁止或者限制通过所述可否利用判定部被判定为不可以利用的讲话者参数值的利用。附图说明图1是表示有关第1实施方式的声音合成装置的功能性结构例的框图。图2是表示声音合成部和声 ...
【技术保护点】
1.一种声音合成装置,具有:声音合成部,能够根据与讲话者特性相关的参数的值即讲话者参数值控制合成声音的讲话者特性;讲话者参数存储部,存储已登记讲话者参数值;可否利用判定部,根据将所输入的讲话者参数值与已登记讲话者参数值分别比较的结果,判定可否利用所输入的讲话者参数值;讲话者参数控制部,禁止或者限制通过所述可否利用判定部判定为不可利用的讲话者参数值的利用。
【技术特征摘要】
【国外来华专利技术】2017.03.15 JP 2017-0498011.一种声音合成装置,具有:声音合成部,能够根据与讲话者特性相关的参数的值即讲话者参数值控制合成声音的讲话者特性;讲话者参数存储部,存储已登记讲话者参数值;可否利用判定部,根据将所输入的讲话者参数值与已登记讲话者参数值分别比较的结果,判定可否利用所输入的讲话者参数值;讲话者参数控制部,禁止或者限制通过所述可否利用判定部判定为不可利用的讲话者参数值的利用。2.根据权利要求1所述的声音合成装置,所述声音合成装置还具有存储声音合成模型的声音合成模型存储部,所述声音合成模型包括将成为基础的讲话者特性模型化得到的基础模型、和将讲话者特性的各要素的特点模型化得到的讲话者特性控制模型,所述声音合成部包括:选择部,从所述基础模型和所述讲话者特性控制模型中选择多个统计量;相加部,按照所指定的讲话者参数值对所述统计量进行加权相加,所述声音合成部使用通过所述相加部进行加权相加得到的统计量生成所述合成声音的声音波形。3.根据权利要求1或2所述的声音合成装置,所述可否利用判定部根据规定的函数计算所输入的讲话者参数值与已登记讲话者参数值的差异,在所计算出的差异为表示已登记讲话者参数值的登记范围的第1阈值以下的情况下,将所输入的讲话者参数值判定为不可利用。4.根据权利要求3所述的声音合成装置,所述讲话者参数存储部还存储已登记讲话者参数值固有的所述第1阈值。5.根据权利要求3或4所述的声音合成装置,所述可否利用判定部将所输入的讲话者参数值和已登记讲话者参数值分别映射在共同的讲话者参数空间中,在该讲话者参数空间中计算所输入的讲话者参数值与已登记讲话者参数值的差异。6.根据权利要求1~5中任意一项所述的声音合成装置,所述声音合成装置还具有讲话者参数登记部,将所输入的讲话者参数值登记在所述讲话者参数存储部中,所述讲话者参数控制部根据来自利用者的登记申请,对所述讲话者参数登记部输出讲话者参数值的登记指示。7.根据权利要求6所述的声音合成装置,所述可否利用判定部还判定可否登记所输入的讲话者参数值,在通过所述可否利用判定部判定为可以登记的情况下,所述讲话者参数控制部对所述讲话者参数登记部输出所输入的讲话者参数值的登记指示。8.根据权利要求7所述的声音合成装置,所述可否利用判定部根据规定的函数计算所输入的讲话者参数值与已登记讲话者参数值的差异,在所计算出的差异为第3阈值以下的情...
【专利技术属性】
技术研发人员:森田真弘,森纮一郎,大谷大和,
申请(专利权)人:东芝数字解决方案株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。