一种语音的转换方法、装置及设备制造方法及图纸

技术编号:33854944 阅读:10 留言:0更新日期:2022-06-18 10:42
本说明书实施例公开了一种语音的转换方法、装置及设备,该方法包括:获取待处理的第一文本信息,对第一文本信息中包含的满足预设条件的词语进行词语转译,以将第一文本信息中包含的满足预设条件的词语转换为具有相同语义的词语,得到转译的第二文本信息,预设条件至少由词语对应的音素的发音基频和/或由预设词语确定,基于第二文本信息,确定将第二文本信息转换为语音数据的转换参数,该转换参数包括语速控制参数、音量控制参数和音调控制参数中的一种或多种,基于该转换参数将第二文本信息转换为语音数据。通过本说明书实施例,可以使得最终转换后的语音数据更易于用户听见和听清,以及对语音内容的理解。以及对语音内容的理解。以及对语音内容的理解。

【技术实现步骤摘要】
一种语音的转换方法、装置及设备


[0001]本文件涉及计算机
,尤其涉及一种语音的转换方法、装置及设备。

技术介绍

[0002]对于某些人群(如老年人、听觉能力较弱的人、自然语言的初学者或处于特殊环境下的人等)来说,听力障碍是常见的生活烦恼,另外,由于其中某些人的学习能力减弱,对社会发展变化和对语言自身的发展变化的敏感度也有所下降,而当前的很多语言交流往往简单明快,且会经常夹杂当前热门或流行的网络词语,对于这些人来说往往无法听懂上述网络词语,因此,数字产品服务需要具备更适用于上述人群的特性,也是数字产品服务机构需要支持的方向之一。如何保证文本语音合成系统对用户(尤其是上述人群的用户)更加适用,更加易用户收听和理解成为当前需要解决的重要问题。
[0003]通常,当前由文本到语音的转换,大部分是针对通用的文本到语音的转换需求,针对上述人群的用户听觉和理解能力的文本到语音的转换则很少,这样就需要在上述由文本到语音的转换之后,再通过有一些物理方式改善用户的听力,如,可以再通过助听器改善用户的听力或通过扩增语音能量来改善用户听力等。但是,上述方式仅仅能够单纯的将文本信息转换为语音数据,并不能帮助用户提升语言理解能力,而对于一些通过扩增语音能量来改善用户听力的方式,大音量和噪音会增加人体听力损伤,长期佩戴会影响人们的听力,为此,需要提供一种对用户(尤其是上述人群的用户)更加适用、更加易于用户收听和理解的文本语音合成系统。

技术实现思路

[0004]本说明书实施例的目的是提供一种对用户(尤其是上述人群的用户)更加适用、更加易于用户收听和理解的文本语音合成系统。
[0005]为了实现上述技术方案,本说明书实施例是这样实现的:
[0006]本说明书实施例提供的一种语音的转换方法,所述方法包括:
[0007]获取待处理的第一文本信息;
[0008]对所述第一文本信息中包含的满足预设条件的词语进行词语转译,以将所述第一文本信息中包含的满足预设条件的词语转换为具有相同语义的词语,得到转译的第二文本信息,所述预设条件至少由词语对应的音素的发音基频和/或由预设词语确定;
[0009]基于所述第二文本信息,确定将所述第二文本信息转换为语音数据的转换参数,所述转换参数包括用于控制语音数据对应的参数,所述控制语音数据对应的参数包括语速控制参数、音量控制参数和音调控制参数中的一种或多种;
[0010]基于所述转换参数将所述第二文本信息转换为语音数据。
[0011]本说明书实施例提供的一种语音的转换装置,所述装置包括:
[0012]文本获取模块,获取待处理的第一文本信息;
[0013]词语转译模块,对所述第一文本信息中包含的满足预设条件的词语进行词语转
译,以将所述第一文本信息中包含的满足预设条件的词语转换为具有相同语义的词语,得到转译的第二文本信息,所述预设条件至少由词语对应的音素的发音基频和/或由预设词语确定;
[0014]转换参数确定模块,基于所述第二文本信息,确定将所述第二文本信息转换为语音数据的转换参数,所述转换参数包括用于控制语音数据对应的参数,所述控制语音数据对应的参数包括语速控制参数、音量控制参数和音调控制参数中的一种或多种;
[0015]语音转换模块,基于所述转换参数将所述第二文本信息转换为语音数据。
[0016]本说明书实施例提供的一种语音的转换设备,所述语音的转换设备包括:
[0017]处理器;以及
[0018]被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:
[0019]获取待处理的第一文本信息;
[0020]对所述第一文本信息中包含的满足预设条件的词语进行词语转译,以将所述第一文本信息中包含的满足预设条件的词语转换为具有相同语义的词语,得到转译的第二文本信息,所述预设条件至少由词语对应的音素的发音基频和/或由预设词语确定;
[0021]基于所述第二文本信息,确定将所述第二文本信息转换为语音数据的转换参数,所述转换参数包括用于控制语音数据对应的参数,所述控制语音数据对应的参数包括语速控制参数、音量控制参数和音调控制参数中的一种或多种;
[0022]基于所述转换参数将所述第二文本信息转换为语音数据。
[0023]本说明书实施例还提供了一种存储介质,其中,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:
[0024]获取待处理的第一文本信息;
[0025]对所述第一文本信息中包含的满足预设条件的词语进行词语转译,以将所述第一文本信息中包含的满足预设条件的词语转换为具有相同语义的词语,得到转译的第二文本信息,所述预设条件至少由词语对应的音素的发音基频和/或由预设词语确定;
[0026]基于所述第二文本信息,确定将所述第二文本信息转换为语音数据的转换参数,所述转换参数包括用于控制语音数据对应的参数,所述控制语音数据对应的参数包括语速控制参数、音量控制参数和音调控制参数中的一种或多种;
[0027]基于所述转换参数将所述第二文本信息转换为语音数据。
[0028]相较于现有技术,本说明书提供的一种语音的转换方法,通过对待处理的第一文本信息中包含的预设词语进行词语转译,使得转译后的文本信息更易于理解,此外,还可以通过音素的发音基频判断待处理的第一文本信息中是否包含指定类型的词语(如发音基频高于预设阈值的词语等),如果包含,则对该词语进行词语转译,进而实现了可以降低待处理的第一文本信息中的典型高音频词语出现的概率,从而使得后续合成的语音数据整体能量更多的分布于中低频率段,有利于用户(尤其是有利于如老年人、听觉能力较弱的人、自然语言的初学者或处于特殊环境下的人等人群的用户)听见和听清,另外,还可以通过第二文本信息确定将第二文本信息转换为语音数据的转换参数,进而通过该转换参数对第二文本信息进行语音转换,从而可以通过语速控制参数实现放慢合成语音数据的播放速度,同时,可以通过音量控制参数和音调控制参数等强调语音的重点内容字词,这样,可以进一步
增加用户对语音内容的理解,因此,通过上述方式实现的文本语音合成系统,其合成的语音数据相比于常用的文本语音合成系统,更有利于人们(尤其是上述人群的用户)听见,听懂,从而,可以提高文本语音合成系统的使用率。
[0029]本说明书提供的一种语音的转换装置、设备以及存储介质,与语音的转换方法具有相同或相似的有益效果。
附图说明
[0030]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0031]图1为本说明书一种语音的转换方法实施例;
[0032]图2为本说明书另一种语音的转换方法实施例;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音的转换方法,所述方法包括:获取待处理的第一文本信息;对所述第一文本信息中包含的满足预设条件的词语进行词语转译,以将所述第一文本信息中包含的满足预设条件的词语转换为具有相同语义的词语,得到转译的第二文本信息,所述预设条件至少由词语对应的音素的发音基频和/或由预设词语确定;基于所述第二文本信息,确定将所述第二文本信息转换为语音数据的转换参数,所述转换参数包括用于控制语音数据对应的参数,所述控制语音数据对应的参数包括语速控制参数、音量控制参数和音调控制参数中的一种或多种;基于所述转换参数将所述第二文本信息转换为语音数据。2.根据权利要求1所述的方法,所述预设条件由预设词语确定,所述对所述第一文本信息中包含的满足预设条件的词语进行词语转译,得到第二文本信息,包括:检测所述第一文本信息中是否包括所述预设词语;如果检测到所述第一文本信息中包括所述预设词语,则从预设的第一转译关系中获取所述第一文本信息中包括的预设词语对应的第一转译词语,并使用所述第一转译词语替换所述第一文本信息中的预设词语,得到第二文本信息。3.根据权利要求1或2所述的方法,所述预设条件包括词语对应的音素的发音基频大于预设频率阈值,所述对所述第一文本信息中包含的满足预设条件的词语进行词语转译,得到第二文本信息,包括:检测所述第一文本信息中是否包括音素的发音基频大于预设频率阈值的第一词语;如果检测到所述第一文本信息中包括所述第一词语,则从预设的第二转译关系中获取所述第一词语对应的第二转译词语,并使用所述第二转译词语替换所述第一文本信息中的第一词语,得到第二文本信息。4.根据权利要求3所述的方法,所述方法还包括:获取发音基频大于预设频率阈值的声母音素构成的声母集合;基于所述声母集合中的声母音素和预设的韵母集合中的韵母音素,确定包括音素的发音基频大于预设频率阈值的高频词语的高频词集合;确定所述高频词集合中的每个高频词语对应的转译词语,并将所述高频词集合中的每个高频词语及其对应的转译词语存储于所述第二转译关系中,所述转译词语对应的发音基频不高于所述转译词语对应的高频词语对应的发音基频,所述转译词语与所述转译词语对应的高频词语的语义相同。5.根据权利要求4所述的方法,所述检测所述第一文本信息中是否包括音素的发音基频大于预设频率阈值的第一词语,包括:对所述第一文本信息进行分词处理,得到所述第一文本信息对应的分词;基于所述第二转译关系,确定所述第一文本信息中是否包含所述第二转译关系中的高频词语;如果包括,则确定所述第一文本信息中包括音素的发音基频大于预设频率阈值的第一词语。
6.根据权利要求1所述的方法,所述转换参数还包括韵律标记信息,所述基于所述第二文本信息,确定将所述第二文本信息转换为语音数据的转换参数,包括:对所述第二文本信息进行主成分提取,得到所述第二文本信息对应的主成分信息;确定所述第二文本信息对应的主成分信息中的每个词语对应的转换参数;确定所述第二文本信息中除所述主成分信息之外的信息中的每个词语对应的韵律标记信息,并确定所述第二文本信息中除所述主成分信息之外的信息对应的目标参数,所述目标参数包括所述语速控制参数、所述音量控制参数和所述音调控制参数中的一种或多种。7.根据权利要求1所述的方法,所述基于所述转换参数将所述第二文本信息转换为语音数据,包括:将所述转换参数和所述第二文本信息输入到预先训练的语音转换模型中,得...

【专利技术属性】
技术研发人员:乔宏利王洪斌蒋宁吴海英刘敏
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1