音频可视化模型训练及音频可视化方法、装置及设备制造方法及图纸

技术编号：29401252 阅读：12 留言：0更新日期：2021-07-23 22:38

本发明专利技术提供一种提供音频可视化模型训练及音频可视化方法、装置及设备，包括：获取包括用户信息、用户历史播放视频、目标音频、目标视频、目标音频是否关联的关系标签的训练样本；将训练样本输入音频可视化模型，对目标音频进行特征提取，得到目标音频的第一特征表示；对用户信息、用户历史播放视频进行特征提取得到用户特征、用户兴趣表达特征，对目标视频进行特征提取得到第二特征表示，将用户特征、用户兴趣表达特征和第二特征表示联合处理得到第三特征表示；确定第一特征表示和第三特征表示之间的相似度；根据相似度及训练样本中的关系标签，更新音频可视化模型的参数。本发明专利技术可以对同一音频进行个性化视频搭配，满足多样化的用户需求。

全部详细技术资料下载

【技术实现步骤摘要】
音频可视化模型训练及音频可视化方法、装置及设备
本专利技术涉及音视频
，尤其涉及一种音频可视化模型训练及音频可视化方法、装置及设备。
技术介绍
在音频播放过程中，用户通过音响感知、情绪感受、形象联想与理性感悟，完成对音频作品由感性到理性的审美体验过程。音频具有形象思维的特点，在情感的伴随下，通过想象联想，获得音频形象、生活情景以及意境等形象，音频可视化因此而衍生出来。音频可视化主要实现以视频动画诠释音乐情绪，将音频素材和视频融为一体。相关技术中推出的一种音频播放场景为，根据用户当前播放的音频，自动为播放的音频搭配动态视频，不仅从听觉模式打动用户内心，而且通过视觉模式为用户带来冲击力。相关技术中自动为播放的音频搭配动态视频，主要通过建立视频类型标签与单曲风格映射规则，在音频播放过程中，根据音频的单曲风格，根据映射规则搭配对应的视频类型标签中的视频。在确定映射规则时，主要研究音频内容理解、情感检测，图形图像平移、缩放、旋转、切变复杂处理，最终呈现音频表现力，给用户带来极大的视觉刺激。但这种技术脱离了用户兴趣偏好，没有以用户个性化偏好为驱动进行视频搭配，难以满足多样化的用户需求。
技术实现思路
本专利技术实施例提供一种音频可视化方法、装置、设备及介质，可以根据用户的兴趣偏好，实现对同一音频进行的个性化视频搭配，满足多样化的用户需求。第一方面，本专利技术实施例提供一种音频可视化模型训练方法，该方法包括：获取训练样本，所述训练样本包括用户信息、用户历史播放视频、目标音频...

【技术保护点】
1.一种音频可视化模型训练方法，其特征在于，该方法包括：/n获取训练样本，所述训练样本包括用户信息、用户历史播放视频、目标音频、目标视频、表征所述目标音频和目标视频是否相关联的关系标签；/n将所述训练样本输入音频可视化模型，对所述目标音频进行特征提取，得到所述目标音频的第一特征表示；/n对所述用户信息、用户历史播放视频与目标视频的关系进行特征提取得到用户特征、用户兴趣表达特征，对所述目标视频进行特征提取得到第二特征表示，将所述用户特征、所述用户兴趣表达特征和所述第二特征表示联合处理得到第三特征表示；/n确定所述第一特征表示和所述第三特征表示之间的相似度；/n根据所述相似度及所述训练样本中的关系标签，更新所述音频可视化模型的参数。/n

【技术特征摘要】
1.一种音频可视化模型训练方法，其特征在于，该方法包括：
获取训练样本，所述训练样本包括用户信息、用户历史播放视频、目标音频、目标视频、表征所述目标音频和目标视频是否相关联的关系标签；
将所述训练样本输入音频可视化模型，对所述目标音频进行特征提取，得到所述目标音频的第一特征表示；
对所述用户信息、用户历史播放视频与目标视频的关系进行特征提取得到用户特征、用户兴趣表达特征，对所述目标视频进行特征提取得到第二特征表示，将所述用户特征、所述用户兴趣表达特征和所述第二特征表示联合处理得到第三特征表示；
确定所述第一特征表示和所述第三特征表示之间的相似度；
根据所述相似度及所述训练样本中的关系标签，更新所述音频可视化模型的参数。

2.根据权利要求1所述的方法，其特征在于，所述训练样本还包括知识图谱；对目标音频/目标视频进行特征提取，包括：
确定所述目标音频/目标视频在所述知识图谱中对应的目标节点，及确定通过边与所述目标节点建立关联关系的邻居节点；
对所述邻居节点的属性信息、所述邻居节点连接所述目标节点的边对应的关联关系进行特征提取，得到所述目标节点在所述知识图谱中与邻居节点的关系表达特征；
所述目标节点在所述知识图谱中与邻居节点的关系表达特征，包括所述目标音频在所述知识图谱中与邻居节点关系表达的所述第一特征表示或所述目标视频在所述知识图谱中与邻居节点关系表达的所述第二特征表示；
所述知识图谱为将实体定义为节点，将存在关联关系的节点通过边连接，并根据所述关联关系的类型确定边的类型，根据节点的相关信息对所述节点进行属性信息填充所构建得到的图谱，所述实体包括音频和视频。

3.根据权利要求2所述的方法，其特征在于，采用如下方式构建所述知识图谱：
定义实体类型、实体属性信息、与不同类型关联关系对应的边及判定各类型的关联关系的规则，所述实体类型包括视频类型和音频类型；
根据定义的所述实体类型、所述实体属性信息，从源数据库中抽取不同实体类型的实体作为节点，从所述节点的相关信息中抽取所述节点的属性信息；
根据判定各类型的关联关系的规则，确定不同节点之间是否存在关联关系，并确定存在关联关系时，根据关联关系的类型利用对应类型的边连接所述不同节点。

4.根据权利要求3所述的方法，其特征在于，还包括：
利用不同的表格分别存储所抽取的节点、抽取的节点的属性信息、确定的是否存在关联关系的结果、边的连接信息；
将所述抽取的节点作为索引项，对所述不同的表格进行融合得到该节点的表项内容，所述表项内容包括所述抽取的节点的属性信息、所述抽取的节点所关联的邻居节点、所述抽取的节点所关联的邻居节点与所述抽取的节点的关联关系的类型。

5.根据权利要求2所述的方法，其特征在于，对所述邻居节点的属性信息、所述邻居节点连接所述目标节点的边对应的关联关系进行特征提取，得到所述目标节点在所述知识图谱中与邻...

【专利技术属性】
技术研发人员：展丽霞，肖强，孔昭阳，董家骥，李勇，
申请(专利权)人：杭州网易云音乐科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人