佛乐的人声合成方法、装置、设备及存储介质制造方法及图纸

技术编号：29084643 阅读：26 留言：0更新日期：2021-06-30 09:47

本发明专利技术涉及人工智能技术领域，公开了一种佛乐的人声合成方法、装置、设备及存储介质。该方法通过利用音乐轨道抓取算法，提取乐谱信息中的乐理数据、歌词和歌词中每个字在乐理数据中的位置信息，基于歌词查询预设的佛学知识词典，将歌词转换为拼音序列，识别拼音序列中每个字的拼音的音节，并根据乐理数据，确定每个音节的人声发音，得到歌词对应的声学特征序列，通过声码合成器将声学特征序列合成与乐谱信息对应的佛乐音频，基于拼音的音节来对佛乐的乐谱信息进行人声的转换，并进行合成，采用该种方式进行人声的合成，其产生的佛乐音频音高和气息都较为稳定，提升了用户的听觉体验，以及提高可人声合成效率。以及提高可人声合成效率。以及提高可人声合成效率。

全部详细技术资料下载

【技术实现步骤摘要】
佛乐的人声合成方法、装置、设备及存储介质

[0001]本申请涉及人工智能
，具体涉及一种佛乐的人声合成方法、装置、设备及存储介质。

技术介绍

[0002]音乐作为人类智慧活动的高级产物，具有相当复杂的结构。随着语音合成技术的趋向成熟，在交通、教育、医疗和社交等领域得到了广泛的应用。如交通语音导航、语言学习发音、医疗语音控制等，便利了人们的工作和生活。而更进一步的歌声合成技术，考虑到乐谱的影响，各音符的发音丰富多样，大大增加了歌声合成的技术难度。
[0003]目前，对于歌曲的合成主要是通过录制一些声音，然后通过软件将录制到的声音进行适当的编辑后进行简单合成，而对于人声的合成虽然存在一些唱声合成模型可以实现，但是需要额外输入许多声音特征，并且其更多的是实现一种声音转换的功能，直接由谱到唱声，尤其是中文的唱声合成是一个相当具有挑战性的工作，当前的唱声合成模型的处理效率。尤其是在佛教领域，尚无歌声合成技术应用于唱经场景。

技术实现思路

[0004]本专利技术的主要目的是解决现有的唱声合成模型的人声合成效

【技术保护点】

【技术特征摘要】
1.一种佛乐的人声合成方法，其特征在于，所述佛乐的人声合成方法包括：获取待合成佛乐的乐谱信息；利用音乐轨道抓取算法，提取所述乐谱信息中的乐理数据、歌词和所述歌词中每个字在乐理数据中的位置信息；在预设的佛学知识词典中查询与所述歌词匹配的拼音，并按照所述歌词将查询到的拼音转换为拼音序列；识别所述拼音序列中每个字的拼音的音节，并根据所述乐理数据，确定每个音节的人声发音，得到所述歌词对应的声学特征序列；通过声码合成器将所述声学特征序列合成为与所述乐谱信息对应的佛乐音频。2.根据权利要求1所述的佛乐的人声合成方法，其特征在于，所述识别所述拼音序列中每个字的拼音的音节包括：将所述拼音序列与预设的拼音表进行匹配，识别出所述拼音序列中的声母和韵母，并对所述声母和韵母分别进行标记，得到识别标志；利用分词算法，按照所述识别标志对标识有识别标志的拼音序列进行分切，得到音节序列。3.根据权利要求2所述的佛乐的人声合成方法，其特征在于，在所述利用分词算法，按照所述识别标志对标识有识别标志的拼音序列进行分切，得到音节序列之后，还包括：识别所述音节序列中韵母的音调，并结合所述声母生成音调序列；利用预设的ID字典为音调序列中的声母和韵母配置单独的数字ID，生成ID序列。4.根据权利要求3所述的佛乐的人声合成方法，其特征在于，所述根据所述乐理数据，确定每个音节的人声发音，得到所述歌词对应的声学特征序列包括：根据所述音调序列中每个音节的位置信息，查询所述位置信息对应的音节在所述乐理数据中的持续时间；利用预设的长度控制器对所述音调序列中音节的持续时间的长度进行调整，得到持续时间序列；根据所述韵母的音调和所述韵母在所述乐理数据中的音阶，生成所述韵母的音乐的声学特征；在所述拼音序列中所有的韵母均转换成声学特征后，将所有的声学特征按照所述拼音序列的排序进行拼接，得到声学特征序列，其中，所述声学特征序列为MIDI格式的高音数据文件。5.根据权利要求4所述的佛乐的人声合成方法，其特征在于，在所述根据所述乐理数据，确定每个音节的人声发音，得到所述歌词对应的声学特征序列之后，还包括：将所述ID序列、所述持续时间序列和所述声学特征序列，通过相加的方式进行首尾拼接，得...

【专利技术属性】
技术研发人员：蒋慧军，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人