角色拆分方法、装置、电子设备及存储介质制造方法及图纸

技术编号：37244580 阅读：34 留言：0更新日期：2023-04-20 23:25

本发明专利技术实施例涉及一种角色拆分方法、装置、电子设备及存储介质，包括：从录制的原始视频中提取出群杂音频数据，所述群杂音频数据至少包括两个或两个以上群杂角色对应的语音数据；从所述群杂音频数据中提取出多个语音数据片段；提取每个所述语音数据片段的声纹特征；根据每个所述语音数据片段的声纹特征，确定每个所述语音数据片段对应的角色数据。由此，可以实现对多个群杂角色的语音数据进行角色拆分，这能够为后续应用，例如在AI智能配音项目中，为不同的群杂角色也模拟出不同的音色提供了实现基础，从而能够提高观众对AI配音影视的观影体验。观影体验。观影体验。

全部详细技术资料下载

【技术实现步骤摘要】
角色拆分方法、装置、电子设备及存储介质

[0001]本专利技术实施例涉及视频处理领域，尤其涉及一种角色拆分方法、装置、电子设备及存储介质。

技术介绍

[0002]AI智能配音项目是指：使用少数(甚至是一个)配音员将整部影视中所有角色的台词录制完成，然后通过AI变声技术将配音员的音色转换为多个音色，再经过精细的后期制作形成AI配音影视。
[0003]由此可见，在AI智能配音项目中，角色拆分是一个很重要的工作阶段。所谓角色拆分就是将不同角色的语音数据分配到不同的音轨，以实现后续将不同音轨上的语音数据转换为不同的音色。
[0004]然而，目前的角色拆分技术只能够将重要角色的语音数据拆分出来，而将所有群杂角色的语音数据统一分配到一个音轨上，这就导致在AI配音影视中，多个群杂角色的音色相同，尤其是在群杂角色之间进行对话时，由于音色相同，因此观众听起来像是同一个群杂角色在自己跟自己对话，极大影响了观众的观影体验。

技术实现思路

[0005]鉴于此，为解决目前的角色拆分技术只能够将重要角色的语音数据拆分出来...

【技术保护点】

【技术特征摘要】
1.一种角色拆分方法，其特征在于，包括：从录制的原始视频中提取出群杂音频数据，所述群杂音频数据至少包括两个或两个以上群杂角色对应的语音数据；从所述群杂音频数据中提取出多个语音数据片段；提取每个所述语音数据片段的声纹特征；根据每个所述语音数据片段的声纹特征，确定每个所述语音数据片段对应的角色数据。2.根据权利要求1所述的方法，其特征在于，所述从录制的原始视频中提取出群杂音频数据，包括：对录制的原始视频进行场景划分，得到多个视频片段，每个所述视频片段对应一个场景；针对每个所述视频片段，从所述视频片段中提取出群杂音频数据，以针对所述群杂音频数据执行所述从所述群杂音频数据中提取出多个语音数据片段以及之后的所有步骤。3.根据权利要求2所述的方法，其特征在于，所述对录制的原始视频进行场景划分，得到多个视频片段，包括：对录制的原始视频进行分帧处理，得到所述原始视频的多个视频帧；针对每个所述视频帧，确定所述视频帧的色彩量；针对每相邻的两个所述视频帧，确定其中的后一个视频帧与前一个视频帧的色彩量之差；若所述色彩量之差大于预设阈值，则将所述前一个视频帧对应的时间点确定为转场时间点；基于至少一个所述转场时间点对所述原始视频进行场景划分，得到多个视频片段。4.根据权利要求1所述的方法，其特征在于，所述从录制的原始视频中提取出群杂音频数据，包括：获取所述原始视频的台词剧本；从所述台词剧本中确定群杂角色对应台词的发声时间段；从录制的原始视频中，提取所述发声时间段内的音频数据确定为所述群杂音频数据。5.根据权利要求1所述的方法，其特征在于，所述根据每个所述语音数据片段的声纹特征，确定每个所述语音数据片段对应的角色数据，包括：根据每个所述语音数据片段的声纹特征，对多个所述语音数据片段进行分类；为同一类别中的所述语音数据片段确定相同的角色数据，为不同类别中的所述语音数据...

【专利技术属性】
技术研发人员：李娜，李海，刘俊晖，谢丹铭，
申请(专利权)人：成都爱奇艺智能创新科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人