音频信号处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：23086710 阅读：27 留言：0更新日期：2020-01-11 01:43

本申请实施例提供了一种音频信号处理方法、装置、电子设备及存储介质，涉及信息处理技术领域。该方法包括：获取用户所录制的待处理音频信号；提取待处理音频信号的音频特征；获取待处理音频信号的原声音频信号的标准音频特征，原声音频信号包括原声声音信号和背景音频信号；基于待处理音频信号的音频特征和标准音频特征，对待处理音频信号进行修正处理，得到修正后的音频信号。本申请技术方案利用易于获取的原声音频信号的标准音频特征，对待处理音频信号进行修正处理，从而实现了对用户所录制的音频的美化，不依赖干声模版，扩大了声音美化技术的适用范围，避免了人工标注出现的错误，提升了音频美化的效果。

Audio signal processing method, device, electronic equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
音频信号处理方法、装置、电子设备及存储介质
本申请涉及计算机
，具体而言，本申请涉及一种音频信号处理方法、装置、电子设备及存储介质。
技术介绍
声音是由物体振动产生的，以波的形式通过介质(空气或固体、液体)传播，并能被人或动物的听觉器官所感知。语音是指人类通过发音器官发出来的、具有一定意义的、用来进行社会交际的声音。不同的人发出的语音的可以通过音高、节奏、音色等因素来进行区分。因此，将人说话或者唱歌的语音进行标准化处理时可以通过调整语音的音高、节奏、音色等特征来实现。例如，在体验电影或者电视剧等的配音时，可以将后配的语音与配音演员的标准语音进行比对，从音高、节奏、音色等方面进行处理，实现声音的美化。又如，唱歌是一种深受群众喜爱的娱乐方式。受乐感，歌唱技巧，以及设备等限制，人们在唱歌时经常出现跑调或者没踩对节奏等现象。为了解决这一问题，市场上出现很多通过计算机软件自动美化歌声的软件，如antares的autotune，唱吧的一键修音等。现有技术中，无论是对语音进行美化还是对歌声进行美化时，...

【技术保护点】
1.一种音频信号处理方法，其特征在于，所述方法包括：/n获取用户所录制的待处理音频信号；/n提取所述待处理音频信号的音频特征，所述待处理音频信号包括背景音频信号和待处理声音信号；/n获取与所述待处理音频信号对应的原声音频信号的标准音频特征，所述原声音频信号包括原声声音信号和所述背景音频信号；/n基于所述待处理音频信号的音频特征和所述标准音频特征，对所述待处理音频信号进行修正处理，得到修正后的音频信号。/n

【技术特征摘要】
1.一种音频信号处理方法，其特征在于，所述方法包括：
获取用户所录制的待处理音频信号；
提取所述待处理音频信号的音频特征，所述待处理音频信号包括背景音频信号和待处理声音信号；
获取与所述待处理音频信号对应的原声音频信号的标准音频特征，所述原声音频信号包括原声声音信号和所述背景音频信号；
基于所述待处理音频信号的音频特征和所述标准音频特征，对所述待处理音频信号进行修正处理，得到修正后的音频信号。

2.根据权利要求1所述的方法，其特征在于，所述待处理音频信号的音频特征包括所述待处理声音信号的语音特征，所述标准音频特征包括所述原声声音信号的标准语音特征和标准节奏特征；
所述基于所述待处理音频信号的音频特征和所述标准音频特征，对所述待处理音频信号进行修正处理，包括：
根据所述标准语音特征、标准节奏特征和所述待处理声音信号的语音特征，确定所述待处理音频信号的节奏修正参数；
根据所述节奏修正参数，对所述待处理音频信号进行节奏修正处理。

3.根据权利要求2所述的方法，其特征在于，所述标准节奏特征包括所述原声音频信号所对应的文字的标准字节奏特征和标准句子节奏特征，所述节奏修正参数包括句子节奏对齐参数和字节奏对齐参数；
所述根据所述标准语音特征、标准节奏特征和所述待处理音频信号的语音特征，确定所述待处理音频信号的节奏修正参数，包括：
基于所述标准语音特征、所述标准句子节奏特征和所述待处理声音信号的语音特征，得到所述待处理音频信号的句子节奏特征、以及句子节奏对齐参数；
基于所述待处理音频信号的句子节奏特征、所述标准句子节奏特征和标准字节奏特征，得到所述待处理音频信号的字节奏特征；
基于所述待处理音频信号的字节奏特征和所述标准字节奏特征，得到字节奏对齐参数。

4.根据权利要求3所述的方法，其特征在于，所述标准字节奏特征包括所述原声音频信号所对应的文字中的每个字对应的开始时间戳和结束时间戳；
所述标准句子节奏特征包括所述原声音频信号所对应的文字中的每个句子对应的开始时间戳和结束时间戳；
所述待处理音频信号的字节奏特征包括所述待处理音频信号所对应的文字中的每个字对应的开始时间戳和结束时间戳；
所述待处理音频信号的句子节奏特征包括所述待处理音频信号所对应的文字中的每个句子对应的开始时间戳和结束时间戳。

5.根据权利要求2所述的方法，其特征在于，所述标准语音特征包括标准初始语音特征和标准音素瓶颈特征，所述待处理声音信号的语音特征包括初始语音特征和音素瓶颈特征；
所述标准语音特征是通过以下方式得到的：
提取所述原声声音信号的标准初始语音特征；
基于所述标准初始语音特征，提取所述原声声音信号的标准音素瓶颈特征；
所述待处理声音信号的音频特征是通过以下方式得到的：
提取所述待处理声音信号的初始语音特征；
基于所述初始语音特征，提取所述待处理声音信号的音素瓶颈特征。

6.根据权利要求5所述的方法，其特征在于，所述根据所述标准语音特征、标准节奏特征和所述待处理声音信号的语音特征，确定所述待处理音频信号的节奏修正参数，包括：
基于所述标准音素瓶颈特征、所述标准句子节奏特征和所述待处理声音信号的音素瓶颈特征，得到所述待处理音频信号的句子节奏特征、以及句子节奏对齐参数；
基于所述待处理音频信号的句子节奏特征、所述标准句子节奏特征、所述标准初始语音特征、所述初始语音特征和所述标准字节奏特征，得到所述待处理音频信号的字节奏特征；
基于所述待处理音频信号的字节奏特征和所述标准字节奏特征，得到字节奏对齐参数。

7.根据权利要求2所述的方法，其特征在于，所述根据所述节奏修正参数，对所述待处理音频信号进行节奏修正处理，包括：
根据所述句子节奏对齐参数和字节奏对齐参数，将所述待处理音频信号和所述原声音频信号分别进行句子节奏对齐和字节奏对齐。

8.根据权利要求7所述的方法，其特征在于，所述根据所述句子节奏对齐参数和字节奏对齐参数，将所述待处理音频信号和所述原声音频信号分别进行句子节奏对齐和字节奏对齐，包括：
根据所述句子节奏对齐参数将每个句子在所述待处理音频信号中对应的时长与所述原声音频信号中对应的时长对齐；
根据所述字节奏对齐参数将每个字在所述待处理音频信号中对应的时长与所述原声音频信号中对应的时长对齐。

9.根据权利要求2-8任一项所述的方法，其特征在于，所述标准音频特征还包括所述原声声音信号的标准音高特征，所述待处理音频信号的音频特征还包括所述待处理声音信号的音高特征；
所述基于所述待处理音频信号的音频特征和所述标准音频特...

【专利技术属性】
技术研发人员：朱睿，黄俊，王燕南，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人