一种基于人脸识别的影像审看及编辑系统设计方法技术方案

技术编号：36803851 阅读：13 留言：0更新日期：2023-03-09 00:02

本发明专利技术涉及一种基于人脸识别的影像审看及编辑系统设计方法，属于计算机软件领域。本发明专利技术通过训练先后建立人像检测模型和人脸识别模型，通过视频抽帧，对图像内容进行检测识别，首先通过人像检测获取人脸结果坐标，自动计算识别目标区域像素大小，进行目标人像的画面占比估算，形成画面信息组成部分；通过人脸识别将人像检测输出的人脸图像进行身份识别，将识别结果整合画面布局信息返回至视频编辑界面，智能化标注当前帧的画面信息，形成帧轨附加信息。本发明专利技术将人脸识别应用于影像审看、影像编辑领域的设计，并针对该领域工作选取合适的算法，优化框架，加入向量数据库，大大提升识别准确率与效率。识别准确率与效率。识别准确率与效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于人脸识别的影像审看及编辑系统设计方法

[0001]本专利技术属于计算机软件领域，具体涉及一种基于人脸识别的影像审看及编辑系统设计方法。

技术介绍

[0002]如今，影像审看、编辑已经成为各领域的重要工作部分，特别是在新闻工作、自媒体等多个领域。然而目前市场上的影像编辑工具主要以本地软件化为主，对协同办公并不友好，且主打编辑功能多样，缺少智能化，用户仍需要观看整个视频后才能获取影像内容信息，然后再进行审核或者编辑。对于需要审看、编辑的视频数量多、内容杂，必然会产生工作量大、影像内容定位困难的问题，将大量时间浪费在视频内容查找上，导致工作效率低下。
[0003]针对目前影像审看、编辑工具的痛点，现有利用图像检测和人脸识别技术，提供一种可行的在线智能影像审看及编辑系统实现方案，并通过算法、框架进行优化，提升识别准确率与效率。以人物为主体，通过人像检测获取图片、视频画面内的人脸区域，并通过区域像素估算人物画面占比，并通过人脸识别对目标人物进行识别，将识别结果以及时间戳、画面占比信息进行整合，形成视频脚本展现给用户，有效辅助对申请、报送的图片、音视频等资料快速进行审看把关，使用户更好地专注于视频审看、编辑，而不是内容查找。

技术实现思路

[0004](一)要解决的技术问题
[0005]本专利技术要解决的技术问题是如何提供一种基于人脸识别的影像审看及编辑系统设计方法，以解决影像审看、编辑工作效率低下的问题。
[0006](二)技术方案
[0007]为了解决上述技术问题，本专...

【技术保护点】

【技术特征摘要】
1.一种基于人脸识别的影像审看及编辑系统设计方法，其特征在于，该方法包括如下步骤：S1、上传视频：使用对象存储技术，将视频上传至存储服务，不同用户根据对应权限拉取相关数据，在线对视频进行播放观看、编辑，实现协同办公；S2、上传报道人物画像：根据需求可以选择是否上传报道人物画像，如果选择上传，执行步骤S3；否则，执行步骤S4；S3、图像解析：图像解析会调用训练好的人脸识别模型，负责将上传的人物画像提取为多维向量特征，存入Milvus向量数据库，从而更新模型的特征库；S4、视频解析：视频解析包括人像检测和人脸识别两部分；首先使用人像检测模型对视频的帧画面进行人像检测，将检测到包含人脸的图像进行处理；使用人脸识别模型对处理过的人脸图像进行人脸识别；S5、对视频解析的结果进行包装，传入前端渲染，按人员或内容进行标记，生成两种形式的结果；第一种为时间轨形式的轨道结果；第二种为显式显示的文字结果；S6、人工评审：人工审看S5的结果，记录/标记每幅或每帧画面或每个镜头具体的意见，综合生成最终的审看结果清单，相关清单文本文件支持导出。2.如权利要求1所述的基于人脸识别的影像审看及编辑系统设计方法，其特征在于，所述影像审看及编辑系统包括：表示层、传输层、服务层以及数据层；表示层是面向用户的Web端，实现Web式的在线影像编辑，方便协同办公，数据共享；传输层负责表示层与服务层之间进行数据传输；服务层负责本系统所有业务功能的实现；数据层负责对特征向量数据以及用户信息、系统历史数据进行存储。3.如权利要求2所述的基于人脸识别的影像审看及编辑系统设计方法，其特征在于，表示层采用React开发框架进行构建；传输层采用HTTP网络请求相关技术进行数据传输，同时在接口设计上保持RESTful风格；服务层采用SpringBoot技术，利用SpringAOP实现系统的日志、异常处理以及权限控制功能，采用Pytorch、Opencv相关技术实现人像检测算法以及人脸识别算法，同时利用FlaskPythonWeb框架对算法进行线上部署，最后使用ResTemplate实现业务服务器与算法服务器之间的通讯；数据层采用Milvus向量数据库对模型提取的向量特征进行存储、检索和比对，采用MySQL数据库进行用户个人信息以及系统相关数据的存储，采用OOS对象存储服务对各类办件、活动音视频、活动图片进行存储。4.如权利要求1所述的基于人脸识别的影像审看及编辑系统设计方法，其特征在于，所述步骤S4中，第一种为时间轨形式的轨道结果，在现有视频进度条上显示，列出时码、主体人员和画面占比信息，相同的人物识别结果会进行多帧聚合。5.如权利要求1所述的基于人脸识别的影像审看及编辑系统设计方法，其特征在于，所述步骤S4中，第二种为显式显示的文字结果，包括：时间戳、人物姓名和画面占比信息，形成视频脚本，以便人工审看时能够快速查找，提供辅助参考。6.如权利要求1
‑

【专利技术属性】
技术研发人员：樊一航，杨芳，彭璐，
申请(专利权)人：北京计算机技术及应用研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人