一种声音处理的方法、装置、设备和介质制造方法及图纸

技术编号：23559962 阅读：30 留言：0更新日期：2020-03-25 05:06

本申请属于人工智能中的语音处理技术领域，公开了一种声音处理的方法、装置、设备和介质，本申请公开的一种声音处理的方法包括，提取采集的语音数据的音色特征以及音调特征，并根据获取的各乐器的音色特征，确定与语音数据的音色特征最相近的音色特征对应的乐器，获得该乐器按照该音调特征弹奏的音乐和对应音调特征设置的色彩特征，以及根据弹奏的音乐和色彩特征生成语音转换内容。这样，将用户的语音数据转换为匹配的乐器弹奏的相应音乐以及色彩特征，从而可以通过音乐和色彩呈现用户语音，提高了用户声音的辨识度。

A sound processing method, device, equipment and medium

全部详细技术资料下载

【技术实现步骤摘要】
一种声音处理的方法、装置、设备和介质
本申请涉及语音处理
，尤其涉及一种声音处理的方法、装置、设备和介质。
技术介绍
人工智能(ArtificialIntelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。其中，语音技术是AI软件技术的方向之一。语音技术的关键技术有自动语音识别技术、语音合成技术以及声纹识别技术。让计算机能听、能看、能说、能感觉，是未来人机交互的发展方向，其中语音成为未来最被看好的人机交互方式之一。在陌生人语音社交产品领域，声音是用户之间相互接触的重要媒介。人们通常通过用户的声音标签，辨识用户的声音。用户在通过语音应用发布或回复语音时，语音应用通常通过声纹识别技术对待发布的语音进行识别，对用户的声音进行简单分类，为不同声音的用户建立声音标签。但是，采用这种方式，声音标签的类别较少，听众难以辨识用户声音...

【技术保护点】
1.一种声音处理的方法，其特征在于，包括：/n响应于针对语音应用页面的录音操作，采集语音数据；/n提取所述语音数据的音色特征和音调特征，所述音色特征表示振动频率与声音振幅之间的对应关系，所述音调特征表示时间与振动频率之间的对应关系；/n根据获取的各乐器的音色特征，确定与所述语音数据的音色特征最相近的音色特征对应的乐器；/n获得所述乐器按照所述音调特征弹奏的音乐；/n根据所述弹奏的音乐生成语音转换内容。/n

【技术特征摘要】
1.一种声音处理的方法，其特征在于，包括：
响应于针对语音应用页面的录音操作，采集语音数据；
提取所述语音数据的音色特征和音调特征，所述音色特征表示振动频率与声音振幅之间的对应关系，所述音调特征表示时间与振动频率之间的对应关系；
根据获取的各乐器的音色特征，确定与所述语音数据的音色特征最相近的音色特征对应的乐器；
获得所述乐器按照所述音调特征弹奏的音乐；
根据所述弹奏的音乐生成语音转换内容。

2.如权利要求1所述的方法，其特征在于，还包括：
根据振动频率与色彩之间的对应关系，获得所述音调特征对应的色彩特征，所述色彩特征表示时间与色彩之间的对应关系；
根据所述音乐和所述色彩特征生成语音转换内容。

3.如权利要求2所述的方法，其特征在于，根据所述音乐和所述色彩特征生成语音转换内容，包括：
当接收到表征原声发布的操作指令时，将所述语音数据、所述音乐以及所述色彩特征进行合成，获得包含所述语音数据的语音转换内容。

4.如权利要求2所述的方法，其特征在于，根据所述音乐和所述色彩特征生成语音转换内容，包括：
当接收到表征非原声发布的操作指令时，将所述音乐和所述色彩特征进行合成，获得不包含所述语音数据的语音转换内容。

5.如权利要求3所述的方法，其特征在于，将所述语音数据、所述音乐以及所述色彩特征进行合成，获得包含所述语音数据的语音转换内容，包括：
提取所述语音数据的音量特征，所述音量特征表示时间与音量之间的对应关系；
根据所述语音数据的音量特征以及预设音量权重，调整所述音乐的音量特征，所述音乐的音量特征中每一时间对应的音量均低于所述语音数据的音量特征中的相应音量；
将所述语音数据、调整后的音乐以及所述色彩特征进行合成，获得包含所述语音数据的语音转换内容。

6.如权利要求1-5任一项所述的方法，其特征在于，采集语音数据，包括：
实时采集输入的语音数据，当采集时长高于指定时长时，结束该次语音采集。

7.如权利要求1-5任一项所述的方法，其特征在于，根据获取的各乐器的音色特征，确定与所述语音数据的音色特征最相近的音色特征对应的乐器，包括：
根据所述语音数据的音色特征，生成用户声音频谱；
获取各乐器的乐器声音频谱，所述乐器声音频谱是根据所述乐器的音色特征生成的，所述用户声音频谱和所述乐器声音频谱均表示振动频率与声音振幅之间的对应关系；
确定与所述用户声音频谱最相近的乐器声音频谱所对应的乐器。

8.如权利要求7所述的方法，其特征在于，确定与所述用户声音频...

【专利技术属性】
技术研发人员：王伟航，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人