个性化定制的AI声纹克隆方法、系统及其存储介质技术方案

技术编号:46630211 阅读:0 留言:0更新日期:2025-10-14 21:29
本发明专利技术公开了个性化定制的AI声纹克隆方法、系统及其存储介质,涉及人工智能与语音处理技术领域。该个性化定制的AI声纹克隆方法,包括以下步骤:语言信号转换有效性判定;声纹特征数据获取与处理;个性化声纹特征匹配。本发明专利技术通过采集的语音信号转换为数字语音数据,并在信号转换过程进行有效性判定,然后将转换合格后的数字语音数据通过梅尔频率倒谱系数算法提取声纹特征,以获取声纹特征数据并进行声纹特征处理,最后进行声纹特征转换并与设定的语音文本结合,实现了语音数据的有效性采集、对声纹特征提取的精准量化以及与语音文本结合的声纹特征辨识度提高,进而有效解决了现有技术中声纹克隆过程的声纹特征还原度不高的问题。

【技术实现步骤摘要】

本专利技术涉及人工智能与语音处理,尤其个性化定制的ai声纹克隆方法、系统及其存储介质。


技术介绍

1、个性化定制的声纹克隆更注重对目标声纹细节的捕捉和还原以满足特定场景的需求;声纹克隆的本质是提取目标声音的独特声学特征,个性化声纹克隆首先采集用户的语音样本,内容需涵盖不同语音速度、语气和发音场景,以覆盖全面的声纹特征,并且通过梅尔频谱模拟人耳对声音的感知捕捉频率信息,以从预处理后的音频中提取核心特征,再进行个性化微调,用目标声纹数据微调模型,使其适应特定声纹特征,最后输入文本生成对应声纹的语音。

2、例如公告号为:cn117672182b中国专利技术专利公开的一种基于人工智能的声音克隆方法及系统,包括:通过将原始文本正则化处理,并依次转换为若干待转换句和若干待转换词,获取待转换词的拼音,并将其中各字的拼音进行标注,得到第一标注,将字的拼音中的声母和韵母拆分,并将字的拼音的第一标注赋给韵母,再对字的拼音中的声母进行标注,根据预设规则,确定音素信息,然后重新组合词组,并根据用户说话语速,确定重新组合后的各词组之间的停顿时间,最后根据字和对应的音素信本文档来自技高网...

【技术保护点】

1.个性化定制的AI声纹克隆方法,其特征在于,包括以下步骤:

2.如权利要求1所述个性化定制的AI声纹克隆方法,其特征在于,所述有效性判定,包括以下步骤:

3.如权利要求2所述个性化定制的AI声纹克隆方法,其特征在于,所述提取声纹特征,包括以下步骤:

4.如权利要求1所述个性化定制的AI声纹克隆方法,其特征在于,所述声纹特征处理,包括以下步骤:

5.如权利要求4所述个性化定制的AI声纹克隆方法,其特征在于,所述声纹特征维度判定,包括以下步骤:

6.如权利要求5所述个性化定制的AI声纹克隆方法,其特征在于,所述声纹特征转换,包括以...

【技术特征摘要】

1.个性化定制的ai声纹克隆方法,其特征在于,包括以下步骤:

2.如权利要求1所述个性化定制的ai声纹克隆方法,其特征在于,所述有效性判定,包括以下步骤:

3.如权利要求2所述个性化定制的ai声纹克隆方法,其特征在于,所述提取声纹特征,包括以下步骤:

4.如权利要求1所述个性化定制的ai声纹克隆方法,其特征在于,所述声纹特征处理,包括以下步骤:

5.如权利要求4所述个性化定制的ai声纹克隆方法,其特征在于,所述声纹特征维度判定,包括以下步骤:

6.如权利要求5所述个性化定制的ai声纹克隆方法,其特征在于,所述声纹特征转换,包括以下步骤:

7.如...

【专利技术属性】
技术研发人员:冯武刘华安于翠楠
申请(专利权)人:湖南博极生命科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1