The invention discloses a music matching method, system, equipment and storage medium for video files. The method includes: extracting various video features of the initial video files from the initial video files to be music matching, generating the music audio files of the initial video files combined with the video features, and generating the test based on the original video files and music audio files. According to the user's portrait model and evaluation parameters of the viewing object of the test video file, the music audio file in the test video file is amended to generate the standby video file. The invention reduces the overall cost of video music score, combines video content characteristics and user feedback, and carries out video music score, so that users can obtain better experience when watching video.
【技术实现步骤摘要】
视频文件的配乐方法、系统、设备及存储介质
本专利技术涉及视频配乐
,尤其涉及一种视频文件的配乐方法、系统、设备及存储介质。
技术介绍
在制作面向受众群体的视频文件时,通常是先制作出视频内容,然后根据视频内容进行后期配乐,最终形成向广大用户播放的视频,这一点在时下的广告视频制作过程中体现的尤其明显。在现有的广告视频制作过程中,广告商设计人员会优先根据委托人的要求设计出视频内容,然后挑选已有的音频文件对视频进行后期配乐,如此,广告视频不仅整体成本高,且没有考虑到受众群体对于视频配乐的偏好要求。现有的也存在自动的音乐生成算法,但是,现有的音乐自动生成算法无法将音乐与视频内容特征结合起来,视频配乐效果一般。
技术实现思路
本专利技术的主要目的在于提供一种视频文件的配乐方法、系统、设备及存储介质,旨在提高创作广告视频新配乐的质量,降低配乐成本,并结合广告视频内容特征和用户反馈,对广告视频配乐进行优化调整,从而使用户在收看广告视频时获得更好的收看体验。为实现上述目的,本专利技术提供一种视频文件的配乐方法,所述视频文件的配乐方法包括以下步骤:从待配乐的初始视频文件中提取出所述初始视频文件的各项视频特征,并结合各项所述视频特征生成所述初始视频文件的配乐音频文件;基于所述初始视频文件和配乐音频文件,生成测试视频文件;根据所述测试视频文件收看对象的用户画像模型和评价参数,对所述测试视频文件中配乐音频文件进行修正,生成待用视频文件。可选地,所述视频特征包括:光流强度特征、色度直方图特征、shot边界特征,所述从待配乐的初始视频文件中提取出所述视频文件的各项视频特征的步骤包括: ...
【技术保护点】
1.一种视频文件的配乐方法,其特征在于,所述视频文件的配乐方法包括以下步骤:从待配乐的初始视频文件中提取出所述初始视频文件的各项视频特征,并结合各项所述视频特征生成所述初始视频文件的配乐音频文件;基于所述初始视频文件和配乐音频文件,生成测试视频文件;根据所述测试视频文件收看对象的用户画像模型和评价参数,对所述测试视频文件中配乐音频文件进行修正,生成待用视频文件。
【技术特征摘要】
1.一种视频文件的配乐方法,其特征在于,所述视频文件的配乐方法包括以下步骤:从待配乐的初始视频文件中提取出所述初始视频文件的各项视频特征,并结合各项所述视频特征生成所述初始视频文件的配乐音频文件;基于所述初始视频文件和配乐音频文件,生成测试视频文件;根据所述测试视频文件收看对象的用户画像模型和评价参数,对所述测试视频文件中配乐音频文件进行修正,生成待用视频文件。2.如权利要求1所述的视频文件的配乐方法,其特征在于,所述视频特征包括:光流强度特征、色度直方图特征、shot边界特征,所述从待配乐的初始视频文件中提取出所述视频文件的各项视频特征的步骤包括:提取所述初始视频文件中各视频图像对应的各光流图,和所述视频图像的色度直方图;将各所述光流图的平均光流强度作为所述初始视频文件的光流强度特征;将所述色度直方图进行归一化处理之后,作为所述初始视频文件的色度直方图特征;检测所述视频图像的shot边界,将所述shot边界所述初始视频文件的shot边界特征。3.如权利要求1所述的视频文件的配乐方法,其特征在于,所述视频特征还包括:视频情感分数特征,所述从待配乐的初始视频文件中提取出所述视频文件的各项视频特征的步骤还包括:读取所述初始视频文件的视频内容,检测并统计所述视频内容中标识视频情感的情感数据;将所述情感数据输入至预设情感分析模型,以供所述预设情感分析模型对所述情感数据进行预测得到所述视频内容的情感分数;将所述情感分数作为所述初始视频文件的视频情感分数特征。4.如权利要求1至3任一项所述的视频文件的配乐方法,其特征在于,结合各项所述视频特征生成所述初始视频文件的配乐音频文件的步骤包括:将各项所述视频特征输入至预设配乐模型,所述预设配置模型通过添加的预设训练样本进行学习训练,所述预设训练样本包括:音视频数据和纯音频数据;在所述预设配乐模型中,结合各项所述视频特征生成所述初始视频文件的配乐音频文件。5.如权利要求4所述的视频文件的配乐方法,其特征在于,在所述将各项所述视频特征输入至预设配乐模型的步骤之前,所述方法还包括:检测所述初始视频文件的lookback特征,并将所述lookback特征输入至所述预设配乐模型。6.如权利要求4所述的视频文件的配乐方法,其特征在于,所述预设配乐模型为基于序列神经网络生成音频文件的配乐模型,在所述预设配乐模型中,结合各项所述视频特征生成所述初始视频文件的配乐音频文件的步骤包括:根据所述初始视频文件的各项所述视频特征和所述lookback特征,生成音符序列;将所述音符序列输入音符时长序列神经网络,以供所述音符时长神经网络根据所述音符序列和所述l...
【专利技术属性】
技术研发人员:裴勇,郑文琛,杨强,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。