The invention relates to a voice conversion method and device. The method includes: obtaining the target text; the first machine speech synthesis and the target text corresponding to the asynchronous machine; from the voice library, screening out the asynchronous machine speech unit sequence matching the prosodic features of prosodic features and the first of the machines; synchronous machines in speech database in the synchronous machine speech unit sequence search and the asynchronous machine speech unit sequence corresponding; according to the prosodic features of the synchronous machine speech unit sequence synthesis, and the target text corresponding to the second machine voice; from the synchronous machine voice library, selected with the second synchronous machine speech unit matching machine acoustic features; speaker unit splicing will speaker speech database and the synchronous machine unit corresponding to the speech, the speaker has. Standard speech. The scheme provided by the present invention improves the voice conversion effect.
【技术实现步骤摘要】
语音转换方法和装置
本专利技术涉及计算机
,特别是涉及一种语音转换方法和装置。
技术介绍
随着计算机技术的发展,语音内容转换的应用越来越广泛,如在有声小说朗读或者语音导航中实现个性化的声音等。伴随着生活水平的提高,人们对语音内容转换已经不仅仅满足于单纯对音色实现转换,还要求转换的语音更符合特定的说话人的口语习惯和说话风格。传统的语音内容转换技术中,在需要转换得到目标说话人语音时,主要是通过音色转换的方法,将其他说话人的语音转换为目标说话人的语音。然而,传统的语音转换方法得到的语音无法真实地反应说话人的语音风格,导致语音转换效果与真实说话人相比有一定的差距。
技术实现思路
基于此,有必要针对传统的语音转化方法在转换符合说话人语音风格的语音时效果不理想的问题,提供一种语音转换方法和装置。一种语音转换方法,所述方法包括:获取目标文本;合成与所述目标文本对应的第一机器语音;从异步机器语音库中,筛选出韵律特征与所述第一机器语音的韵律特征匹配的异步机器语音单元序列;在同步机器语音库中,查找与所述异步机器语音单元序列对应的同步机器语音单元序列;根据所述同步机器语音单元序列的韵律特征,合成与所述目标文本对应的第二机器语音;从所述同步机器语音库中,挑选与所述第二机器语音声学特征匹配的同步机器语音单元;将说话人语音库中与所述同步机器语音单元对应的说话人语音单元拼接,得到说话人目标语音;其中,所述同步机器语音库、所述异步机器语音库和所述说话人语音库的文本内容相同,且所述说话人语音库与所述同步机器语音库的韵律特征相匹配。一种语音转换装置,其特征在于,所述装置包括:获取模块,用于 ...
【技术保护点】
一种语音转换方法,所述方法包括:获取目标文本;合成与所述目标文本对应的第一机器语音;从异步机器语音库中,筛选出韵律特征与所述第一机器语音的韵律特征匹配的异步机器语音单元序列;在同步机器语音库中,查找与所述异步机器语音单元序列对应的同步机器语音单元序列;根据所述同步机器语音单元序列的韵律特征,合成与所述目标文本对应的第二机器语音;从所述同步机器语音库中,挑选与所述第二机器语音声学特征匹配的同步机器语音单元;将说话人语音库中与所述同步机器语音单元对应的说话人语音单元拼接,得到说话人目标语音;其中,所述同步机器语音库、所述异步机器语音库和所述说话人语音库的文本内容相同,且所述说话人语音库与所述同步机器语音库的韵律特征相匹配。
【技术特征摘要】
1.一种语音转换方法,所述方法包括:获取目标文本;合成与所述目标文本对应的第一机器语音;从异步机器语音库中,筛选出韵律特征与所述第一机器语音的韵律特征匹配的异步机器语音单元序列;在同步机器语音库中,查找与所述异步机器语音单元序列对应的同步机器语音单元序列;根据所述同步机器语音单元序列的韵律特征,合成与所述目标文本对应的第二机器语音;从所述同步机器语音库中,挑选与所述第二机器语音声学特征匹配的同步机器语音单元;将说话人语音库中与所述同步机器语音单元对应的说话人语音单元拼接,得到说话人目标语音;其中,所述同步机器语音库、所述异步机器语音库和所述说话人语音库的文本内容相同,且所述说话人语音库与所述同步机器语音库的韵律特征相匹配。2.根据权利要求1所述的方法,其特征在于,所述从异步机器语音库中,筛选出韵律特征与所述第一机器语音的韵律特征匹配的异步机器语音单元序列,包括:按照所述第一机器语音,从异步机器语音库中获取候选异步机器语音单元序列;确定所述候选异步机器语音单元序列与所述第一机器语音的韵律特征差异度;将对应最小韵律特征差异度的候选异步机器语音单元序列,作为与所述第一机器语音的韵律特征匹配的异步机器语音单元序列。3.根据权利要求2所述的方法,其特征在于,所述按照所述第一机器语音,从异步机器语音库中获取候选异步机器语音单元序列,包括:确定所述第一机器语音所包括的机器语音单元的数量;从异步机器语音库中,获取包括的异步机器语音单元的数量与确定的所述数量相等的候选异步机器语音单元序列。4.根据权利要求3所述的方法,其特征在于,所述从异步机器语音库中,获取包括的异步机器语音单元的数量与确定的所述数量相等的候选异步机器语音单元序列,包括:遍历异步机器语音库所包括的异步机器语音单元序列;当遍历至的异步机器语音单元序列所包括的异步机器语音单元的数量小于确定的所述数量时,则继续所述遍历;当遍历至的异步机器语音单元序列所包括的异步机器语音单元的数量等于确定的所述数量时,则将遍历至的异步机器语音单元序列作为候选异步机器语音单元序列;当遍历至的异步机器语音单元序列所包括的异步机器语音单元的数量大于确定的所述数量时,则将遍历至的异步机器语音单元序列,按照所包括的异步机器语音单元的顺序以及确定的所述数量,拆分出候选异步机器语音单元序列。5.根据权利要求2所述的方法,其特征在于,所述确定所述候选异步机器语音单元序列与所述第一机器语音的韵律特征差异度,包括:从所述第一机器语音中划分出机器语音单元;根据所述候选异步机器语音单元序列所包括的各异步机器语音单元与各自对应的划分出的机器语音单元之间的韵律参数差异值,生成所述候选异步机器语音单元序列与所述第一机器语音的韵律特征差异度;其中,所述韵律参数差异值包括时长差异值、基频变化率差异值、声学参数的时长分布差异和基频变化率的概率分布差异中的至少一种。6.根据权利要求1所述的方法,其特征在于,所述从所述同步机器语音库中,挑选与所述第二机器语音声学特征匹配的同步机器语音单元,包括:从所述第二机器语音中划分出机器语音单元;确定划分出的各机器语音单元的读音特征;从所述同步机器语音库中,筛选读音特征与所述划分出的各机器语音单元的读音特征匹配的同步机器语音单元子集;对于各所述同步机器语音单元子集中的各同步机器语音单元,确定与相应的划分出的机器语音单元的声学特征差异度;挑选出对应最小声学特征差异度的同步机器语音单元,作为与所述第二机器语音声学特征匹配的同步机器语音单元。7.根据权利要求6所述的方法,其特征在于,所述对于各所述同步机器语音单元子集中的各同步机器语音单元,确定与相应的划分出的机器语音单元的声学特征差异度,包括:确定各所述同步机器语音单元子集中各同步机器语音单元的声学参数;确定划分出的各所述机器语音单元的声学参数;对于各同步机器语音单元和相应的划分出的机器语音单元,计算相应的声学参数的差异值;根据所述差异值,生成与所述差异值正相关的声学特征差异度。8.根据权利要求1所述的方法,其特征在于,所述将说话人语音库中与所述同步机器语音单元对应的说话人语音单元拼接,得到说话人目标语音,包括:将挑选出的所述同步机器语音单元,按照所对应的目标文本中的读音顺序排序;确定排序后的所述同步机器语音单元中相邻的同步机器语音单元的拼接位置;在说话人语音库中,查找与所述同步机器语音单元对应的说话人语音单元;按照确定的相邻的同步机器语音单元的拼接位置拼接相应的所述说话人语音单元,得到说话人目标语音。9.根据权利要求8所述的方法,其特征在于,所述确定排序后的所述同步机器语音单元中相邻的同步机器语音单元的拼接位置,包括:获取从挑选出的各所述同步机器语音单元划分出的语音帧;确定相邻的同步机器语音单元的拼接重叠语音帧数;其中,相邻的同步机器语音单元各自的与所述拼接重叠语音帧数对应的语音帧之间的差异度最小化;根据所述拼接重叠语音帧数确定排序后的所述同步机器语音单元中相邻的同步机器语音单元的拼接位置。10.根据权利要求9所述的方法,其特征在于,所述确定相邻的同步机器语音单元的拼接重叠语音帧数包括:按照以下公式确定相邻的同步机器语音单元的拼接重叠语音帧数:其中,T表示相邻的同步机器语音单元的拼接重叠语音帧数,t表示相邻的同步机器语音单元的拼接重叠语音帧中第t帧,CCt表示相邻的同步机器语音单元的拼接重叠语音帧中第t帧语音帧的差异度,表示求取T使得最小。11.根据权利要求1至10中任一项所述的方法,其特征在于,所述获取目标文本之前,所述方法还包括:收集说话人历史语音;识别所述说话人历史语音对应的文本内容;根据识别得到的所述文本内容生成异步机器语音单元序列;根据...
【专利技术属性】
技术研发人员:袁豪磊,梅晓,
申请(专利权)人:腾讯科技上海有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。