【技术实现步骤摘要】
语音合成系统评测方法、装置、可读存储介质及终端设备
[0001]本专利技术属于自然语言处理
,尤其涉及一种语音合成系统评测方法、装置、计算机可读存储介质及终端设备。
技术介绍
[0002]随着技术的发展,当前出现了很多种的语音合成系统,用于实现从文本到语音(Text To Speech,TTS)的转换过程,不同的语音合成系统之间往往存在较大的性能差异,需要根据实际情况从中选取合适的语音合成系统来执行语音合成任务。但目前往往只能依靠用户的主观感受来对语音合成系统的优劣进行评测,效率低下且准确度较低。
技术实现思路
[0003]有鉴于此,本专利技术实施例提供了一种语音合成系统评测方法、装置、计算机可读存储介质及终端设备,以解决现有的语音合成系统评测方法效率低下且准确度较低的问题。
[0004]本专利技术实施例的第一方面提供了一种语音合成系统评测方法,可以包括:
[0005]将预设的文本序列分别输入至待评测的若干个不同的语音合成系统中,并分别获取各个语音合成系统的输出语音序列;
[00 ...
【技术保护点】
【技术特征摘要】
1.一种语音合成系统评测方法,其特征在于,包括:将预设的文本序列分别输入至待评测的若干个不同的语音合成系统中,并分别获取各个语音合成系统的输出语音序列;获取与所述文本序列对应的基准语音序列;根据预设的若干个评测维度分别计算各个语音合成系统的输出语音序列与所述基准语音序列之间的整体偏差距离;选取与所述基准语音序列之间的整体偏差距离最小的语音合成系统作为优选语音合成系统,并使用所述优选语音合成系统执行语音合成任务。2.根据权利要求1所述的语音合成系统评测方法,其特征在于,所述根据预设的若干个评测维度分别计算各个语音合成系统的输出语音序列与所述基准语音序列之间的整体偏差距离,包括:分别计算目标语音序列与所述基准语音序列在各个评测维度上的偏差距离,所述目标语音序列为任意一个语音合成系统的输出语音序列;根据所述目标语音序列与所述基准语音序列在各个评测维度上的偏差距离计算所述目标语音序列与所述基准语音序列之间的整体偏差距离。3.根据权利要求2所述的语音合成系统评测方法,其特征在于,所述评测维度包括特征向量、时长和音强;所述分别计算目标语音序列与所述基准语音序列在各个评测维度上的偏差距离,包括:计算所述目标语音序列与所述基准语音序列在特征向量这一评测维度上的偏差距离;计算所述目标语音序列与所述基准语音序列在时长这一评测维度上的偏差距离;计算所述目标语音序列与所述基准语音序列在音强这一评测维度上的偏差距离。4.根据权利要求3所述的语音合成系统评测方法,其特征在于,所述计算所述目标语音序列与所述基准语音序列在特征向量这一评测维度上的偏差距离,包括:根据下式计算所述目标语音序列与所述基准语音序列在特征向量这一评测维度上的偏差距离:其中,k为所述基准语音序列中的音节序号,1≤k≤K,K为所述基准语音序列中的音节总数,P
sk
为所述目标语音序列中的第k个音节的特征向量,P
nk
为所述基准语音序列中的第k个音节的特征向量,DTW为动态时间归整函数,M
k
为所述目标语音序列的第k个音节的特征向量的维数,N
k
为所述基准语音序列的第k个音节的特征向量的维数,D
p
为所述目标语音序列与所述基准语音序列在特征向量这一评测维度上的偏差距离。5.根据权利要求3所述的语音合成系统评测方法,其特征在于,所述计算所述目标语音序列与所述基准语音序列在时长这一评测维度上的偏差距离,包括:根据下式计算所述目标语音序列与所述基准语音序列在时长这一评测维度上的偏差距离:
其中,k为所述基准语音序列中的音节序号,1≤k≤K,K为所述基准语音序列中的音节总数,T
sk
为所述目标语音序列中的第k个音节...
【专利技术属性】
技术研发人员:苏雪琦,王健宗,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。