【技术实现步骤摘要】
语音合成的方法及装置
本专利技术实施例涉及计算机
,具体涉及一种语音合成的方法及装置。
技术介绍
随着科技的发展,机器已经可以通过语音合成技术进行说话。所谓的语音合成技术,也被称为从文本到语音(TexttoSpeech,TTS),其目标是让机器通过识别和理解,把文本信息变成人造语音输出,是现代人工智能发展的重要分支。语音合成能够在质量检测、机器问答、残障辅助等领域发挥极大作用,方便人们的生活。然而,现有的机器所能合成语音往往具有固定的模式,生成的语音在韵律方面较为生硬,与真人具有明显的差异,因此在某些对合成语音的拟人度要求比较高的场景下,终端用户往往不能接受如此生硬的韵律。
技术实现思路
本专利技术实施例的一个目的在于提供一种语音合成的方法及装置,解决语音合成自然度较差的问题。第一方面,本专利技术实施例提供一种语音合成的方法,包括:获取交互式问答结果的文本,所述文本包括:常量文本和变量文本;从常量录音库获取与所述常量文本对应的常量语音;根据所述变量文本,获取变 ...
【技术保护点】
1.一种语音合成的方法,其特征在于,包括:/n获取交互式问答结果的文本,所述文本包括:常量文本和变量文本;/n从常量录音库获取与所述常量文本对应的常量语音;/n根据所述变量文本,获取变量语音;/n根据所述文本中的内容,对所述常量语音和变量语音进行拼接,并调整经过拼接的所述常量语音和变量语音的语音合成自然度。/n
【技术特征摘要】
1.一种语音合成的方法,其特征在于,包括:
获取交互式问答结果的文本,所述文本包括:常量文本和变量文本;
从常量录音库获取与所述常量文本对应的常量语音;
根据所述变量文本,获取变量语音;
根据所述文本中的内容,对所述常量语音和变量语音进行拼接,并调整经过拼接的所述常量语音和变量语音的语音合成自然度。
2.根据权利要求1所述的方法,其特征在于,所述根据所述变量文本,获取变量语音,包括:
判断变量录音库中是否有与所述变量文本对应的变量语音;
如果有,则从变量录音库获取与所述变量文本对应的变量语音,根据所述文本中的内容,对所述常量语音和变量语音进行拼接,并调整所述常量语音和变量语音的语音合成自然度;
如果没有,则通过端到端模型获取目标变量语音。
3.根据权利要求2所述的方法,其特征在于,所述调整所述常量语音和变量语音的语音合成自然度,包括:
对所述常量语音和变量语音的音量和/或语速进行调整;
和/或,
对所述常量语音和变量语音中信号能量值小于预设数值的语音信号进行切除;
和/或,
对所述常量语音和变量语音中信号能量值小于预设数值,但具有预设清辅音发音的语音信号进行保留。
4.根据权利要求1所述的方法,其特征在于,所述调整所述常量语音和变量语音拼接处的语音合成自然度,包括:
对变量语音进行语音信号衰减处理;
对与所述变量语音进行拼接的常量语音进行语音信号衰减处理。
5.根据权利要求4所述的方法,其特征在于,所述对变量语音进行语音信号衰减处理,包括:
根据所述变量语音中的每个语音信号的能量值,确定所述变量语音的语音信号的平均能量值;
根据所述平均能量值和预设的语音信号衰减度,确定语音信号衰减的位置;
根据所述语音信号衰减的位置和预设衰减系数,进行语音信号衰减处理;
所述对与所述变量语音进行拼接的常量语音进行语音信号衰减处理,包括:
根据预设的语音信号衰减度,对与所述变量语音进行拼接的常量语音进行语音信号衰减处理。
6.根据权利要求5所述的方法,...
【专利技术属性】
技术研发人员:黄磊,蒋宁,杨春勇,靳丁南,权圣,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。