点云属性编解码方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:29465094 阅读:14 留言:0更新日期:2021-07-27 17:53
本申请公开了一种点云属性编解码方法、装置、计算机设备和存储介质。该方法包括:接收包括边界框的点云数据集;确定所述边界框是对称的还是不对称的;及,当边界框是不对称时,对所述点云数据集执行四叉树二叉树QtBt划分。

Point cloud attribute encoding and decoding method, device, computer equipment and storage medium

【技术实现步骤摘要】
点云属性编解码方法、装置、计算机设备及存储介质引用并入本申请要求于2020年1月9日提交的、申请号为62/958,837的美国临时申请的优先权、于2020年1月10日提交的、申请号为62/959,422的美国临时申请的优先权、于2020年1月13日提交的、申请号为62/960,661的美国临时申请的优先权、于2020年1月23日提交的、申请号为62/964,841的美国临时申请的优先权,以及于2021年1月6日提交的美国申请第17/142,706号的优先权,其全部内容通过引用并入本申请中。
本申请实施例涉及视频编解码技术,尤其涉及一种点云属性编解码方法、装置、计算机设备及存储介质。
技术介绍
世界的高级三维(3D)表示能够实现更加沉浸式的交互和通信。它们还允许机器理解、解释和导航我们的世界。3D点云已经成为这类信息的启用表示。已经识别出与点云数据相关联的多个用例,并且已经开发了对点云表示和压缩的相应要求。点云是指在3D空间中的一组点,每个点具有相关联的属性,例如颜色、材料特性等。点云可以用于重建对象或场景作为此类点的组合。可以在各种设置中使用多个相机和深度传感器捕获所述点,并且所述点可以由数千到数十亿个点组成,以便真实地表示重建的场景。需要压缩技术来减少表示点云所需的数据量。因此,在实时通信和六自由度(6DoF)虚拟现实中,需要使用点云的有损压缩技术。另外,在自动驾驶和文化遗产应用等的动态映射的环境中,寻求无损点云压缩技术。运动图像专家组(MPEG)开始研究解决几何形状和属性的压缩的标准,例如颜色和反射率、可缩放/渐进编码、随时间捕获的点云序列的编码以及对点云子集的随机访问。
技术实现思路
本申请实施例和点云编解码技术有关,提供了一种点云属性编解码方法、装置、计算机设备及存储介质。本申请实施例提供了一种点云属性编解码方法,包括:接收包括边界框的点云数据集;确定所述边界框是对称的还是不对称的;及,当边界框是不对称时,对所述点云数据集执行四叉树二叉树QtBt划分。本申请实施例还提供了一种点云属性编解码装置,包括:接收模块,用于接收包括边界框的点云数据集;确定模块,用于确定所述边界框是对称的还是不对称的;及,划分模块,用于当边界框是不对称时,对所述点云数据集执行四叉树二叉树QtBt划分。本申请实施例还提供一种计算机设备,包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行,以实现如上所述的点云属性编解码方法。本申请实施例还提供一种非暂时性计算机可读介质,其上存储有指令,当所述指令由计算机执行时,使得所述计算机执行如上所述的点云属性编解码方法。本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述点云属性编解码的方法。由上述技术方案可见,本专利技术实施例提供的方法,能够简化当前的QtBT设计,并且允许更灵活的分区方式,提高了最大分割总数的值,从而提升了视频编解码的增益。附图说明根据以下详细说明和附图,所公开的主题的进一步的特征、性质和各种优点将更加显而易见,其中:图1A是根据本申请一实施例的在G-PCC中生成LoD的方法示意图;图1B是根据本申请一实施例的在G-PCC中用于P/U-提升的结构示意图;图2是根据本申请一实施例的通信系统的结构示意图;图3是根据本申请一实施例的在环境中放置G-PCC压缩器和G-PCC解压缩器的示意图;图4是根据本申请一实施例的G-PCC压缩器的功能性结构示意图;图5是根据本申请一实施例的G-PCC解压缩器的功能性结构示意图;图6是根据本申请一实施例的点云属性编解码方法的流程示意图;以及图7示出了根据本申请实施例的计算机设备的示意图。具体实施方式图1A是示出在基于图的点云压缩G-PCC中生成细节层次(LoD)的方法示意图。参考图1A,在当前G-PCC属性编解码中,基于每个3D点的距离生成每个3D点(例如,P0-P9)的LoD(即,组),然后基于LoD的顺序110进行预测,对每个LoD中3D点的属性值进行编码,而不是以3D点的原始顺序105来进行预测。例如,通过计算3D点P0、P5和P4(它们在3D点P2之前编码或解码)的基于距离的加权平均值,来预测3D点P2的属性值。G-PCC中的当前锚定方法,如下所述。首先,计算3D点的邻域的可变性,可以检查相邻的值是如何不同的,并且如果可变性低于阈值,则通过预测属性值(ai)i∈0...k-1,使用基于当前点i的最近邻点的距离进行的线性插值过程,来计算基于距离的加权平均预测。令是当前点i的k个最近邻点的集合,令是它们的已解码/已重建的属性值,并且令是它们到当前点i的距离。然后由下式给出预测的属性值注意,当对属性进行编码时,所有点云的几何位置都已经是可用的。另外,相邻点以及它们已重建的属性值,在编码器和解码器中都可用作k维树结构,所述k维树结构便于以相同的方式,针对每个点执行最近相邻搜索。其次,如果可变性高于阈值,则执行率失真优化(RDO,rate-distortionoptimized)预测器选择。基于在生成LoD时进行邻点搜索的结果,创建多个预测器候选或多个候选预测值。例如,当通过使用预测器来对3D点P2的属性值进行编码时,从3D点P2分别到3D点P0、P5和P4的距离进行加权平均后的值,可以被设置为预测器索引等于0。然后,从3D点P2到最近邻点P4的距离被设置为预测器索引等于1。而且,如以下表1中示出的,将从3D点P2到下一个最近邻点P5和P0的距离,分别被设置为预测器索引等于2和3。表1用于属性编解码的预测器候选的样本预测器索引预测值0平均1P4(第一最近邻点)2P5(第二最近邻点)3P0(第三最近邻点)在创建预测器候选之后,通过应用率失真优化程序来选择最佳预测器,然后,将选定的预测器索引映射到截断的一元(TU)编码,其中,截断的一元编码的二进制数将进行算术编码。注意,在表1中,较短的TU编码将分配给较小的预测器索引。定义预测器候选的最大数量MaxNumCand,并且进行编码,写到属性头中。在当前实现方式中,预测器候选的最大数量MaxNumCand被设置为等于numberOfNearestNeighborsInPrediction+1,并且用于对截断的一元二进制化的预测器索引进行编码和解码。G-PCC中用于属性编解码的提升变换,建立在上述预测变换之上。预测方案和提升方案之间本文档来自技高网
...

【技术保护点】
1.一种点云属性编解码方法,其特征在于,包括:/n接收包括边界框的点云数据集;/n确定所述边界框是对称的还是不对称的;及,/n当所述边界框是不对称时,对所述点云数据集执行四叉树二叉树QtBt划分。/n

【技术特征摘要】
20200109 US 62/958,837;20200110 US 62/959,422;20201.一种点云属性编解码方法,其特征在于,包括:
接收包括边界框的点云数据集;
确定所述边界框是对称的还是不对称的;及,
当所述边界框是不对称时,对所述点云数据集执行四叉树二叉树QtBt划分。


2.根据权利要求1所述的方法,其特征在于,进一步包括:
当所述边界框是不对称时,将第一标识设置为第一值;
当所述边界框是对称时,将所述第一标识设置为第二值。


3.根据权利要求2所述的方法,其特征在于,所述第一标识为asymmetric_bbox_enabled_flag,所述第一值为1。


4.根据权利要求2所述的方法,其特征在于,所述第二值为0,所述方法还包括:
当所述边界框是对称时,对所述点云数据集应用八叉树划分。


5.根据权利要求1所述的方法,其特征在于,所述当所述边界框是不对称时,对所述点云数据集执行四叉树二叉树QtBt划分包括:
当节点划分级别达到0时,对所述点云数据集应用隐式QtBt划分。


6.根据权利要求1-5中任一项所述的方法,其特征在于,进一步包括:
基于第二标识,启用或者禁用显式分割判决信令。


7.根据权利要求6所述的方法,其特征在于,所述第二标识为qtbt_enabled_flag。


8.根据权利要求6所述的方法,其特征在于,所述基于第二标识,启用或者禁用显式分割判决信令包括:
当所述第二标识被设置为第一值时,启用所...

【专利技术属性】
技术研发人员:芮世薰文格尔史蒂芬刘杉高文张翔
申请(专利权)人:腾讯美国有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1