【技术实现步骤摘要】
场景处理方法、装置、设备、存储介质以及产品
本公开涉及数据处理领域,尤其涉及自动驾驶以及智能交通等领域。
技术介绍
无人车,也即自动驾驶车辆,是在大数据的基础上进行的自动驾驶控制,可以应对各种场景。为了控制准确,需要对车辆覆盖的各种场景进行测试。从车辆测试覆盖的角度考虑,测试的场景越多覆盖越全面。但是随着场景数量级的上升,面对海量场景,做一次全量测试的周期和资源需求就会显著增加,因此从实际使用的角度出发,可以在满足一定覆盖率的情况下尽可能减少资源事件消耗。传统的测试方案中,一般会对海量场景采用一定比例的随机、均匀采样进行测试,以保持与原始样本分布一致。该方案虽然能够实现海量场景的压缩效果,但是该方案的明显缺点是,在保持样本整体分布不变的情况下,均匀采样导致样本多样性下降,尤其是占比较低的低频率场景(即不常见场景)会因为稀疏采样导致丢失,因此会引起测试覆盖不充分,进而引起漏测风险。
技术实现思路
本公开提供了一种场景处理方法、装置、设备、存储介质以及产品。根据本公开的一方面,提供了一种场景处理方法, ...
【技术保护点】
1.一种场景处理方法,包括:/n基于场景集的目标压缩系数和所述场景集中每个场景的重要性程度值,确定出每个所述场景被采样的概率;/n基于每个所述场景被采样的概率,对所述场景集进行采样。/n
【技术特征摘要】
1.一种场景处理方法,包括:
基于场景集的目标压缩系数和所述场景集中每个场景的重要性程度值,确定出每个所述场景被采样的概率;
基于每个所述场景被采样的概率,对所述场景集进行采样。
2.根据权利要求1所述的方法,所述基于场景集的目标压缩系数和所述场景集中每个场景的重要性程度值,确定出每个所述场景被采样的概率之前,还包括:
统计所述场景的每个时刻的事件发生数量;
基于每个时刻的事件发生数量,确定出所述场景的重要性程度值。
3.根据权利要求2所述的方法,其中,所述基于每个时刻的事件发生数量,确定出所述场景的重要性程度值,包括:
基于每个时刻的事件发生数量分别计算每个时刻对应的信息熵;
统计所述信息熵低于或等于第一阈值的时刻,得到小熵时段长度;
计算所述小熵时段长度在所述场景的总时段长度中的占比,作为所述场景的重要性程度值。
4.根据权利要求2所述的方法,其中,所述基于每个时刻的事件发生数量,确定出所述场景的重要性程度值,包括:
统计所述事件发生数量低于或等于第二阈值的时刻,得到低频率事件的时段长度;
统计所述事件发生数量高于或等于第三阈值的时刻,得到高频率事件的时段长度;
计算所述低频率事件的时段长度和所述高频率事件的时段长度之和在所述场景的总时段长度中的占比,作为所述场景的重要性程度值。
5.根据权利要求1所述的方法,其中,所述基于场景集的目标压缩系数和所述场景集中每个场景的重要性程度值,确定出每个所述场景被采样的概率,包括:
基于所述场景的重要性程度值,确定出所述场景被采样的初始概率;
基于所述场景被采样的初始概率,得到所述场景对应的初始压缩系数;
计算所述场景对应的目标压缩系数与所述场景对应的初始压缩系数的比值;
将所述场景被采样的初始概率与所述比值的乘积,作为所述场景被采样的概率,以得到每个所述场景被采样的概率。
6.根据权利要求5所述的方法,其中,所述基于所述场景的重要性程度值,确定出所述场景被采样的初始概率,包括:
将所述场景的重要性程度值作为所述场景被采样的初始概率。
7.根据权利要求5所述的方法,其中,所述基于所述场景被采样的初始概率,得到所述场景对应的初始压缩系数,包括:
基于所述场景被采样的初始概率得到所述场景对应的被采样的初始期望值;
统计所有所述场景对应的所述初始期望值,得到所述场景集被采样的所述场景的期望个数;
计算所述期望个数与所述场景集中所述场景的总个数的比值,得到所述初始压缩系数。
8.根据权利要求1-7任一项所述的方法,还包括:
对采样得到的目标场景进行测试,得到第一测试结果。
9.根据权利要求8所述的方法,还包括:
对所述场景集的全部场景进行测试,得到第二测试结果;
确定所述第一测试结果与所述第二测试结果之间的差异信息;
基于所述差异信息,调整针对所述目标压缩系数的所述重要性程度值。
10.一种场景处理装置,包括:
第一确定模块,用于基于场景集的目标压缩系数和所述场景集中每个场景的重要性程度值,确定出每个所述场景被采样的概率;
场景采样模块,用于基于每个所...
【专利技术属性】
技术研发人员:朱建华,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。