带情感的音频生成方法、装置、设备及存储介质制造方法及图纸

技术编号:34641105 阅读:18 留言:0更新日期:2022-08-24 15:16
本发明专利技术涉及音频生成领域,公开了一种带情感的音频生成方法、装置、设备及存储介质。该方法包括:接收多个带情感标签的语音数据,生成情感语音集;接收待转换的文字字符串,对文字字符串进行分句处理,得到N个短句字符和短句排序;根据预置识别算法,对短句字符进行情感分析处理,得到短句字符对应的情感标签;基于短句字符对应的情感标签,对情感语音集进行标签匹配处理,得到情感标签匹配的情感语音;基于情感标签匹配的情感语音,对短句字符进行音频生成处理,得到短句音频;根据短句排序,对N个短句音频进行拼接处理,得到文字字符串对应的文字情感音频。的文字情感音频。的文字情感音频。

【技术实现步骤摘要】
带情感的音频生成方法、装置、设备及存储介质


[0001]本专利技术涉及音频生成领域,尤其涉及一种带情感的音频生成方法、装置、设备及存储介质。

技术介绍

[0002]前在我国发达城市,患近视的未成年数量居高不下,用眼过度是造成近视的不可忽视的原因之一。有声读物的出现,在一定程度上缓解了未成年患近视的概率。
[0003]然而,在读取文字时,有声读物的声音过于平淡,声音只能对文字的进行发声并没有对文字含义产生的情感变化,使得人听相关有声文字时较为疲劳,不能传递文字中蕴含的情感。因此,需要一种技术解决当前有声读物阅读过程中缺乏情感变化的问题。

技术实现思路

[0004]本专利技术的主要目的在于解决解决当前有声读物阅读过程中缺乏情感变化的技术问题。
[0005]本专利技术第一方面提供了一种带情感的音频生成方法,包括步骤:接收多个带情感标签的语音数据,生成情感语音集;接收待转换的文字字符串,对所述文字字符串进行分句处理,得到N个短句字符和短句排序,其中,N为正整数;根据预置识别算法,对所述短句字符进行情感分析处理,得到所述短句字符对应的情感标签;基于所述短句字符对应的情感标签,对所述情感语音集进行标签匹配处理,得到情感标签匹配的情感语音;基于所述情感标签匹配的情感语音,对所述短句字符进行音频生成处理,得到短句音频;根据所述短句排序,对N个所述短句音频进行拼接处理,得到所述文字字符串对应的文字情感音频;其中,所述根据预置识别算法,对所述短句字符进行情感分析处理,得到所述短句字符对应的情感标签包括:对所述短句字符进行顺序拆分处理,得到M个语言字符和字符排序,其中,M为正整数;根据预置字符向量表,对所述语言字符进行向量转换处理,得到字符向量;基于所述字符排序,将M个所述字符向量进行拼接处理,得到短语拼接矩阵;根据预置整体赋值算法,对所述短语拼接矩阵进行维度赋值处理,得到短语赋值矩阵;根据预置分类算法,对所述短语赋值矩阵进行分类处理,得到所述短句字符对应的情感标签。
[0006]可选的,在本专利技术第一方面的第一种实现方式中,所述根据预置整体赋值算法,对
所述短语拼接矩阵进行维度赋值处理,得到短语赋值矩阵包括:读取所述短语拼接矩阵的短语拼接元素,计算所述短语拼接元素与相邻元素之间的欧式距离,得到前元素距离和后元素距离;分析所述前元素距离与预置距离阈值的大小关系,分析所述后元素距离与预置距离阈值的大小关系;将超过所述距离阈值的距离对应元素划分为非关联元素,将未超过所述距离阈值的距离对应元素划分为关联元素;基于预置关联区分算法,对所述短语拼接矩阵中关联元素进行区分赋值处理,得到短语赋值矩阵。
[0007]可选的,在本专利技术第一方面的第二种实现方式中,所述根据所述短句排序,对N个所述短句音频进行拼接处理,得到所述文字字符串对应的文字情感音频包括:创建音频框架;基于所述短句排序,按序读取N个所述短句音频的每一帧数据,得到帧序列数据集;将所述帧序列数据集写入至所述音频框架中,生成所述文字字符串对应的文字情感音频。
[0008]可选的,在本专利技术第一方面的第三种实现方式中,所述基于所述情感标签匹配的情感语音,对所述短句字符进行音频生成处理,得到短句音频包括:根据预置采样框,对所述情感标签匹配的情感语音进行切分采样处理,得到音频特征集;基于所述音频特征集,对所述短句字符进行声纹模拟处理,得到短句音频。
[0009]可选的,在本专利技术第一方面的第四种实现方式中,所述情感标签包括:开心标签、悲伤标签、生气标签、惊讶标签、平和标签。
[0010]可选的,在本专利技术第一方面的第五种实现方式中,在所述根据所述短句排序,对N个所述短句音频进行拼接处理,得到所述文字字符串对应的文字情感音频之后,还包括:基于所述情感标签,对所述文字情感音频进行片段标记处理,得到带有多个情感标记的文字情感音频。
[0011]本专利技术第二方面提供了一种带情感的音频生成装置,所述带情感的音频生成装置包括:接收模块,用于接收多个带情感标签的语音数据,生成情感语音集;分句模块,用于接收待转换的文字字符串,对所述文字字符串进行分句处理,得到N个短句字符和短句排序,其中,N为正整数;情感分析模块,用于根据预置识别算法,对所述短句字符进行情感分析处理,得到所述短句字符对应的情感标签;标签匹配模块,用于基于所述短句字符对应的情感标签,对所述情感语音集进行标签匹配处理,得到情感标签匹配的情感语音;音频生成模块,用于基于所述情感标签匹配的情感语音,对所述短句字符进行音频生成处理,得到短句音频;拼接模块,用于根据所述短句排序,对N个所述短句音频进行拼接处理,得到所述
文字字符串对应的文字情感音频。
[0012]本专利技术第三方面提供了一种带情感的音频生成设备,包括:存储器和至少一个处理器,所述存储器中存储有指令,所述存储器和所述至少一个处理器通过线路互连;所述至少一个处理器调用所述存储器中的所述指令,以使得所述带情感的音频生成设备执行上述的带情感的音频生成方法。
[0013]本专利技术的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述的带情感的音频生成方法。
[0014]在本专利技术实施例中,提供了一种通过录制并模拟有情感的声音,将任何文章用带有情感得朗读出来的方案。用户只需短短录制几句情感不同的音频,便能生成一篇完整的有声读物,这大大缩减了用户消耗的时间与精力,解决了当前有声读物阅读过程中缺乏情感变化的技术问题。
附图说明
[0015]图1为本专利技术实施例中带情感的音频生成方法的一个实施例示意图;图2为本专利技术实施例中带情感的音频生成装置的一个实施例示意图;图3为本专利技术实施例中带情感的音频生成装置的另一个实施例示意图;图4为本专利技术实施例中带情感的音频生成设备的一个实施例示意图。
具体实施方式
[0016]本专利技术实施例提供了一种带情感的音频生成方法、装置、设备及存储介质。
[0017]本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0018]为便于理解,下面对本专利技术实施例的具体流程进行描述,请参阅图1,本专利技术实施例中带情感的音频生成方法的一个实施例包括:101、接收多个带情感标签的语音数据,生成情感语音集;在本实施例中,带情感标签的语音数据是可以由用户自己选择“开心标签”、“悲伤标签”、“生气标签”、“惊讶标签”、“平和标签”,然后选择了标签后,对该情感标签录音的语音作为情感语音集中的数据,这本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种带情感的音频生成方法,其特征在于,包括步骤:接收多个带情感标签的语音数据,生成情感语音集;接收待转换的文字字符串,对所述文字字符串进行分句处理,得到N个短句字符和短句排序,其中,N为正整数;根据预置识别算法,对所述短句字符进行情感分析处理,得到所述短句字符对应的情感标签;基于所述短句字符对应的情感标签,对所述情感语音集进行标签匹配处理,得到情感标签匹配的情感语音;基于所述情感标签匹配的情感语音,对所述短句字符进行音频生成处理,得到短句音频;根据所述短句排序,对N个所述短句音频进行拼接处理,得到所述文字字符串对应的文字情感音频;其中,所述根据预置识别算法,对所述短句字符进行情感分析处理,得到所述短句字符对应的情感标签包括:对所述短句字符进行顺序拆分处理,得到M个语言字符和字符排序,其中,M为正整数;根据预置字符向量表,对所述语言字符进行向量转换处理,得到字符向量;基于所述字符排序,将M个所述字符向量进行拼接处理,得到短语拼接矩阵;根据预置整体赋值算法,对所述短语拼接矩阵进行维度赋值处理,得到短语赋值矩阵;根据预置分类算法,对所述短语赋值矩阵进行分类处理,得到所述短句字符对应的情感标签。2.根据权利要求1所述的带情感的音频生成方法,其特征在于,所述根据预置整体赋值算法,对所述短语拼接矩阵进行维度赋值处理,得到短语赋值矩阵包括:读取所述短语拼接矩阵的短语拼接元素,计算所述短语拼接元素与相邻元素之间的欧式距离,得到前元素距离和后元素距离;分析所述前元素距离与预置距离阈值的大小关系,分析所述后元素距离与预置距离阈值的大小关系;将超过所述距离阈值的距离对应元素划分为非关联元素,将未超过所述距离阈值的距离对应元素划分为关联元素;基于预置关联区分算法,对所述短语拼接矩阵中关联元素进行区分赋值处理,得到短语赋值矩阵。3.根据权利要求1所述的带情感的音频生成方法,其特征在于,所述根据所述短句排序,对N个所述短句音频进行拼接处理,得到所述文字字符串对应的文字情感音频包括:创建音频框架;基于所述短句排序,按序读取N个所述短句音频的每一帧数据,得到帧序列数据集;将所述帧序列数据集写入至所述音频框架中,生成所述文字字符串对应的文字情感音频。4.根据权利要求1所述的带情感的音频生成方法,其特征在于,所述基于所述情感标签匹配的情感语音,对所述短句字符进行音频生成处理,得到短句音频包括:根据预置采样框,对所述情感标签匹配的情感语音进行切分采样处理,得到音频特征
...

【专利技术属性】
技术研发人员:唐向阳蔡卓君
申请(专利权)人:深圳市大头兄弟科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1