文本转音频方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：24582604 阅读：52 留言：0更新日期：2020-06-21 01:19

本申请公开了一种文本转音频方法、装置、计算机设备及存储介质，属于语音信号处理领域。方法包括：获取待转换文本；根据最优拆分粒度对待转换文本进行拆分，得到至少一段待转换文本片段，其中，对采用最优拆分粒度的文本进行音频转换时，单位文字的音频转换时间最短；对各段待转换文本片段进行音频转换，得到各段待转换文本片段对应的音频片段；对各段音频片段进行拼接，生成待转换文本对应的目标音频。采用本申请的文本转音频方法，能够通过最优拆分粒度对待转换文本进行拆分，使得拆分得到的待转换文本片段的音频转换效率得到提高，继而提高大段文本的音频转换效率，进一步减少音频转换过程中出现卡顿的概率，使得文本转音频过程更为流畅。

Text to audio method, device, computer equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
文本转音频方法、装置、计算机设备及存储介质
本申请实施例涉及语音信号处理领域，特别涉及一种文本转音频方法、装置、计算机设备及存储介质。
技术介绍
随着人工智能技术的不断发展，人类基于智能电子设备所实现的娱乐活动越来越丰富，且给人类的生活带来了极大的便利。如在终端具备的传统阅读功能的基础上，还实现有声阅读的阅读方式，进一步丰富了终端的阅读场景；又如对于盲人、儿童、老人等文字阅读能力较低的特殊群体而言，可通过具备文本转音频功能的终端来实现对文本信息的获取。然而，在相关技术所提供的文本转音频过程中，存在着不能快速地将大段文本转换成音频的问题，且转换时长与文本字数呈现正相关的关系，即文本内容越多，转换的时间就越久。
技术实现思路
本申请实施例提供了一种文本转音频方法、装置、计算机设备及存储介质，所述技术方案如下：一方面，提供了一种文本转音频方法，所述方法包括：获取待转换文本；根据最优拆分粒度对所述待转换文本进行拆分，得到至少一段待转换文本片段，其中，对采用所述最优拆分粒度的文本进行音频转换...

【技术保护点】
1.一种文本转音频方法，其特征在于，所述方法包括：/n获取待转换文本；/n根据最优拆分粒度对所述待转换文本进行拆分，得到至少一段待转换文本片段，其中，对采用所述最优拆分粒度的文本进行音频转换时，单位文字的音频转换时间最短；/n对各段所述待转换文本片段进行音频转换，得到各段所述待转换文本片段对应的音频片段；/n对各段所述音频片段进行拼接，生成所述待转换文本对应的目标音频。/n

【技术特征摘要】
1.一种文本转音频方法，其特征在于，所述方法包括：
获取待转换文本；
根据最优拆分粒度对所述待转换文本进行拆分，得到至少一段待转换文本片段，其中，对采用所述最优拆分粒度的文本进行音频转换时，单位文字的音频转换时间最短；
对各段所述待转换文本片段进行音频转换，得到各段所述待转换文本片段对应的音频片段；
对各段所述音频片段进行拼接，生成所述待转换文本对应的目标音频。

2.根据权利要求1所述的方法，其特征在于，所述根据最优拆分粒度对所述待转换文本进行拆分，得到至少一段待转换文本片段，包括：
根据所述最优拆分粒度，通过折半法对所述待转换文本进行拆分，得到至少一段所述待转换文本片段，所述待转换文本片段包含的文字数小于或等于所述最优拆分粒度，所述折半法用于对所述待转换文本进行均匀拆分，得到与所述最优拆分粒度最接近的拆分粒度。

3.根据权利要求2所述的方法，其特征在于，所述待转换文本被拆分为n个所述待转换文本片段，n为大于等于2的整数；
所述得到至少一段所述待转换文本片段之后，所述方法还包括：
获取相邻的第k待转换文本片段和第k+1待转换文本片段，k为大于等于1且小于等于n-1的整数；
若所述第k待转换文本片段的片尾文字与所述第k+1待转换文本片段的片头文字属于同一词汇，则对所述第k待转换文本片段和所述第k+1待转换文本片段进行调整，其中，调整后所述第k待转换文本片段的片尾文字与所述第k+1待转换文本片段的片头文字不属于同一词汇。

4.根据权利要求1至3任一所述的方法，其特征在于，所述获取待转换文本之前，所述方法还包括：
对样本文本进行转音频测试，所述转音频测试用于测试所述样本文本在不同拆分粒度下的转音频时长；
根据所述转音频时长和所述样本文字的字数，确定出不同拆分粒度下单位文字的音频转换时间；
将最低音频转换时间对应的拆分粒度确定为所述最优拆分粒度。

5.根据权利要求1至3任一所述的方法，其特征在于，所述对...

【专利技术属性】
技术研发人员：刘佳泽，罗忠岚，
申请(专利权)人：广州酷狗计算机科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人