基于用户需求的短视频智能生成系统及方法技术方案

技术编号：37378808 阅读：12 留言：0更新日期：2023-04-27 07:21

本方案属于视频生成技术领域，具体涉及基于用户需求的短视频智能生成系统及方法。包括，视频剪辑单元，用于对待剪辑视频进行视频识别处理，并将识别包含有目标人物的视频按帧进行剪辑，然后将剪辑后的每一帧视频按照时间先后顺序发送至视频处理单元，视频处理单元，用于接收剪辑后的视频，并将前后两帧视频内容进行对比，当视频中出现前后两帧为同一画面信息时系统自动裁剪去重。本方案可以对用户自己拍摄的视频进行识别剪辑，并基于视频图像信息，对包含有重复画面的视频帧进行去重剪辑，使得视频中长时间保持不同的画面，使得视频内容简洁丰富无重复，视频中的每一帧画面均进行了变化，提升了用户观看体验。提升了用户观看体验。提升了用户观看体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于用户需求的短视频智能生成系统及方法

[0001]本方案属于视频生成
，具体涉及基于用户需求的短视频智能生成系统及方法。

技术介绍

[0002]短视频是指在各种新媒体平台上播放的、适合在移动状态和短时休闲状态下观看的、高频推送的视频内容，几秒到几分钟不等。内容融合了技能分享、幽默搞怪、时尚潮流、社会热点、街头采访、公益教育、广告创意、商业定制等主题。由于内容较短，可以单独成片，也可以成为系列栏目。
[0003]不同于微电影和直播，短视频制作并没有像微电影一样具有特定的表达形式和团队配置要求，具有生产流程简单、制作门槛低、参与性强等特点，又比直播更具有传播价值，超短的制作周期和趣味化的内容对短视频制作团队的文案以及策划功底有着一定的挑战，优秀的短视频制作团队通常依托于成熟运营的自媒体或IP，除了高频稳定的内容输出外，也有强大的粉丝渠道；短视频的出现丰富了新媒体原生广告的形式。
[0004]但是当今市场的短视频制作往往需要专业的人才，入门门槛较高，对于一些不需要特别精细制作的情景来说，这无疑浪费了人力物力，当今市场需要一种辅助方法，能够使得不具备视频编辑专业知识的人员也能快速制作出高质量的短视频。
[0005]申请号为CN202011581378.7的专利公开了短视频智能生成方法及装置，包括以下：获取用于制作视频的快讯；从所述快讯中提取多个核心句子；根据多个所述核心句子从预建立的素材资源库中检索对应的图片素材以及视频素材，以多个所述核心句子、检索到的图片素材以及视频素材作为准备材料；获取用...

【技术保护点】

【技术特征摘要】
1.基于用户需求的短视频智能生成系统，其特征在于：包括，视频剪辑单元，用于对待剪辑视频进行视频识别处理，并将识别包含有目标人物的视频按帧进行剪辑，然后将剪辑后的每一帧视频按照时间先后顺序被发送至视频处理单元；视频处理单元，用于接收剪辑后的视频，并将前后两帧视频内容进行对比，当前后两帧视频出现同一画面信息时，将顺序在前的该帧视频中的视频信息剪辑剪掉，然后将剪掉后的视频进行重新合并，所述已剪辑视频的每一视频帧对应的视频场景信息为至少一个人物画面信息，所述视频处理单元将处理后的全部视频帧发送至人脸识别单元；人脸识别单元，采用人脸识别算法对视频中每一帧图像进行目标人脸识别，获得包括目标人脸图像的各帧图像，采用核相关滤波算法，对包括目标人脸图像的各帧进行目标跟踪，包括：检测目标人脸图像在各帧图像中的位置，计算目标人脸图像在相邻帧图像中的位置偏移量；如果位置偏移量小于设定阈值，则将所述相邻帧图像判定为包括同一目标人物的人脸图像的帧图像，如果位置偏移量大于设定阈值，则将相邻帧图像判定为不是目标人物的人脸图像的帧图像，进而将该帧图像删除，当该帧视频未出现目标人物的图像时，则将该帧图像删除；视频生成单元，对与所述至少一种人物画面信息对应的所述候选视频片段进行融合处理，得到至少一段目标视频片段，根据所述视频场景信息，确定出包含每一所述目标视频片段的精彩视频片段的起始位置和终止位置；根据所述起始位置和所述终止位置对所述待剪辑视频生成最终视频。2.根据权利要求1所述的基于用户需求的短视频智能生成系统，其特征在于：还包括修正单元，所述修正单元用于对帧图像的清晰度和/或分辨率进行修正。3.根据权利要求1所述的基于用户需求的短视频智能生成系统，其特征在于：还包括表情采集单元和标记单元，所述表情判断单元包括图像采集模块和表情判断模块，当用户看到剪辑后的视频时，图像采集模块用于采集用户的表情，进而判断用户的满意情况，所述满意情况包括满意或不满意，当用户观看该帧视频表现出不满意时，则标记单元对该帧视频进行标记，当用户看完所有视频时，则标记单元对该段视频中的所有不满意的视频帧进行标记，而后反馈给视处理单元，进而视频处理单元将标记视频帧进行剪辑。4.根据权利要求3所述的基于用户需求的短视频智能生成系统，其特征在于：还包括表情判断规则：当用户的嘴角微微上弯或者张嘴大小时，则表示用户满意，当用户皱眉时，则表用户不满意，所述表情判断单元用于根据图像中的特征来判断用户此时的满意度。5.根据权利要求1所述的基于用户需求的短视频智能生成系统，其特征在于：还包括声音提取模块和声音处理模块，声音提取模块对所述生成后的视频中的声音进行提取并分析，当整个视频中的声音分贝在合理范围内时不做处理，而是添加与之相匹配的背景音乐，并根据视频时长进行调整背景音乐的时长使得背景音乐的时长与视频的时长相匹配，当视频中的声音分贝大于日常聊天分贝范围内时，声音处理模块则调低声音使得声音分贝位于正常范围内，使得整个视频内容更加丰富...

【专利技术属性】
技术研发人员：王晶，刘才果，张俊林，罗建华，
申请(专利权)人：空间视创重庆科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人