【技术实现步骤摘要】
【国外来华专利技术】基于人脸复原的视频会议框架
相关申请的交叉引用
[0001]本申请要求于2021年1月6日提交的美国临时申请63/134,522和于2021年9月30日提交的美国申请17/490,103的优先权,这些专利申请的全部内容通过引用并入本文中。
[0002]本公开涉及与人脸复原(或人脸幻构)有关的视频会议,其可基于界标特征将真实细节从真实低质量(low
‑
quality,LQ)人脸复原到高质量(high
‑
quality,HW)人脸。
技术介绍
[0003]国际标准化组织(ISO)/国际电工委员会(IEC)/电气和电子工程师协会(IEEE)正在积极地寻找基于AI的视频编码技术,尤其地关注基于深度神经网络(Deep Neural Network,DNN)的技术。已经成立了各种特设小组来研究神经网络压缩(Neural Network Compression,NNR)、机器视频编码(Video Coding for Machine,VCM)、基于神经网络的视频编码(Neural Network
‑
based Video Coding,NNVC)等。中国新一代人工智能产业技术创新战略联盟(AITISA)和数字音视频编解码技术标准工作组(AVS)还建立了相应的专家组来研究类似技术的标准化。
[0004]视频会议最近变得越来越重要,这通常需要低带宽传输来支持多个终端用户的联合会议。与通常的视频压缩任务相比,会议场景中的视频主要具有类似的内容,即,作为视频的主 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于视频编码的方法,由至少一个处理器执行,所述方法包括:获取视频数据;从所述视频数据的至少一帧中检测至少一个人脸;从所述视频数据的所述至少一帧中确定所述至少一个人脸的人脸界标特征集合;以及至少部分地由神经网络基于确定的所述人脸界标特征集合对所述视频数据进行编码。2.根据权利要求1所述的方法,其特征在于,所述视频数据包括所述视频数据的已编码码流。3.根据权利要求2所述的方法,其特征在于,确定所述人脸界标特征集合包括对至少一个下采样序列进行上采样,所述至少一个下采样序列是通过解压缩所述已编码码流而获取的。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:确定扩展人脸区域EFA,所述扩展人脸区域包括从在所述视频数据的所述至少一帧中检测到的所述至少一个人脸的区域扩展的边界区域;从所述EFA确定EFA特征集合;以及至少部分地由所述神经网络基于确定的所述人脸界标特征集合对所述视频数据进行进一步编码。5.根据权利要求4所述的方法,其特征在于,确定所述EFA和确定所述EFA特征集合包括对所述至少一个下采样序列进行上采样,所述至少一个下采样序列是通过解压缩所述已编码码流而获取的。6.根据权利要求5所述的方法,其特征在于,确定所述EFA和确定所述EFA特征集合还包括:通过对抗生成网络重建所述EFA特征,所述EFA特征中的每一个分别对应于所述人脸界标特征集合中的所述人脸界标特征中的一个。7.根据权利要求6所述的方法,其特征在于,至少部分地由所述神经网络基于确定的所述人脸界标集合对所述视频数据进行编码还包括:通过聚合所述人脸界标集合、所述已重建的EFA特征和通过对所述至少一个下采样序列进行上采样而获取的上采样序列,至少部分地由所述神经网络基于确定的所述人脸界标特征集合对所述视频数据进行编码。8.根据权利要求7所述的方法,其特征在于,来自所述视频数据的所述至少一帧的所述至少一个人脸被确定为是所述视频数据的所述至少一帧中的多个人脸中的最大的人脸。9.根据权利要求7所述的方法,其特征在于,所述方法还包括:针对所述视频数据的所述至少一帧中的所述多个人脸中的每一个,从所述视频数据的所述至少一帧中确定除了所述至少一个人脸的所述人脸界标特征集合之外的多个人脸界标特征集合;以及至少部分地由所述神经网络基于确定的所述人脸界标集合和确定的所述多个人脸界标特征集合对所述视频数据进行编码。10.根据权利要求9所述的方法,其特征在于,所述神经网络包括深度神经网络DNN。11.一种用于视频编码的装置,所述装置包括:至少一个存储器,配置为存储计算机程序代码;至少一个处理器,配置为访问所述计算机程序代码,以及按照所述计算机程序代码的指示操作,所述计算机程序代码包括:
获取代码,配置为使得所述至少一个处理器获取视频数据;检测代码,配置为使得所述至少一个处理器从所述视频数据的至少一帧中检测至少一个人脸;确定代码,配...
【专利技术属性】
技术研发人员:蒋薇,王炜,刘杉,
申请(专利权)人:腾讯美国有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。