带情感的音频生成方法、装置、设备及存储介质制造方法及图纸

技术编号：34641105 阅读：18 留言：0更新日期：2022-08-24 15:16

本发明专利技术涉及音频生成领域，公开了一种带情感的音频生成方法、装置、设备及存储介质。该方法包括：接收多个带情感标签的语音数据，生成情感语音集；接收待转换的文字字符串，对文字字符串进行分句处理，得到N个短句字符和短句排序；根据预置识别算法，对短句字符进行情感分析处理，得到短句字符对应的情感标签；基于短句字符对应的情感标签，对情感语音集进行标签匹配处理，得到情感标签匹配的情感语音；基于情感标签匹配的情感语音，对短句字符进行音频生成处理，得到短句音频；根据短句排序，对N个短句音频进行拼接处理，得到文字字符串对应的文字情感音频。的文字情感音频。的文字情感音频。

全部详细技术资料下载

【技术实现步骤摘要】
带情感的音频生成方法、装置、设备及存储介质

[0001]本专利技术涉及音频生成领域，尤其涉及一种带情感的音频生成方法、装置、设备及存储介质。

技术介绍

[0002]前在我国发达城市，患近视的未成年数量居高不下，用眼过度是造成近视的不可忽视的原因之一。有声读物的出现，在一定程度上缓解了未成年患近视的概率。
[0003]然而，在读取文字时，有声读物的声音过于平淡，声音只能对文字的进行发声并没有对文字含义产生的情感变化，使得人听相关有声文字时较为疲劳，不能传递文字中蕴含的情感。因此，需要一种技术解决当前有声读物阅读过程中缺乏情感变化的问题。

技术实现思路

[0004]本专利技术的主要目的在于解决解决当前有声读物阅读过程中缺乏情感变化的技术问题。
[0005]本专利技术第一方面提供了一种带情感的音频生成方法，包括步骤：接收多个带情感标签的语音数据，生成情感语音集；接收待转换的文字字符串，对所述文字字符串进行分句处理，得到N个短句字符和短句排序，其中，N为正整数；根据预置识别算法，对所述短句字符进行情感分析处理，得到所述短句字符对应的情感标签；基于所述短句字符对应的情感标签，对所述情感语音集进行标签匹配处理，得到情感标签匹配的情感语音；基于所述情感标签匹配的情感语音，对所述短句字符进行音频生成处理，得到短句音频；根据所述短句排序，对N个所述短句音频进行拼接处理，得到所述文字字符串对应的文字情感音频；其中，所述根据预置识别算法，对所述短句字符进行情感分析处理，得到所述短句字符对应的情感标签包括：对...

【技术保护点】

【技术特征摘要】
1.一种带情感的音频生成方法，其特征在于，包括步骤：接收多个带情感标签的语音数据，生成情感语音集；接收待转换的文字字符串，对所述文字字符串进行分句处理，得到N个短句字符和短句排序，其中，N为正整数；根据预置识别算法，对所述短句字符进行情感分析处理，得到所述短句字符对应的情感标签；基于所述短句字符对应的情感标签，对所述情感语音集进行标签匹配处理，得到情感标签匹配的情感语音；基于所述情感标签匹配的情感语音，对所述短句字符进行音频生成处理，得到短句音频；根据所述短句排序，对N个所述短句音频进行拼接处理，得到所述文字字符串对应的文字情感音频；其中，所述根据预置识别算法，对所述短句字符进行情感分析处理，得到所述短句字符对应的情感标签包括：对所述短句字符进行顺序拆分处理，得到M个语言字符和字符排序，其中，M为正整数；根据预置字符向量表，对所述语言字符进行向量转换处理，得到字符向量；基于所述字符排序，将M个所述字符向量进行拼接处理，得到短语拼接矩阵；根据预置整体赋值算法，对所述短语拼接矩阵进行维度赋值处理，得到短语赋值矩阵；根据预置分类算法，对所述短语赋值矩阵进行分类处理，得到所述短句字符对应的情感标签。2.根据权利要求1所述的带情感的音频生成方法，其特征在于，所述根据预置整体赋值算法，对所述短语拼接矩阵进行维度赋值处理，得到短语赋值矩阵包括：读取所述短语拼接矩阵的短语拼接元素，计算所述短语拼接元素与相邻元素之间的欧式距离，得到前元素距离和后元素距离；分析所述前元素距离与预置距离阈值的大小关系，分析所述后元素距离与预置距离阈值的大小关系；将超过所述距离阈值的距离对应元素划分为非关联元素，将未超过所述距离阈值的距离对应元素划分为关联元素；基于预置关联区分算法，对所述短语拼接矩阵中关联元素进行区分赋值处理，得到短语赋值矩阵。3.根据权利要求1所述的带情感的音频生成方法，其特征在于，所述根据所述短句排序，对N个所述短句音频进行拼接处理，得到所述文字字符串对应的文字情感音频包括：创建音频框架；基于所述短句排序，按序读取N个所述短句音频的每一帧数据，得到帧序列数据集；将所述帧序列数据集写入至所述音频框架中，生成所述文字字符串对应的文字情感音频。4.根据权利要求1所述的带情感的音频生成方法，其特征在于，所述基于所述情感标签匹配的情感语音，对所述短句字符进行音频生成处理，得到短句音频包括：根据预置采样框，对所述情感标签匹配的情感语音进行切分采样处理，得到音频特征
...

【专利技术属性】
技术研发人员：唐向阳，蔡卓君，
申请(专利权)人：深圳市大头兄弟科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人