【技术实现步骤摘要】
一种数据中位数确定方法及装置
[0001]本申请涉及多方安全计算领域,具体而言,涉及一种数据中位数确定方法及装置。
技术介绍
[0002]随着企业对数据保护意识的增强,多方安全计算作为一种有效的数据保护技术逐步在企业业务中得到应用。在多方安全计算中,算子是最底层、最基础、也是最重要的计算单元,复杂的统计以及机器学习都需要建立在算子的基础之上。
[0003]而中位数是其中一种非常重要的算子之一,它是按顺序排列的一组数据中居于中间位置的数,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分,即在这组数据中,有一半的数据比他大,有一半的数据比他小,中位数是以它在所有标志值中所处的位置确定的全体单位标志值的代表值,不受分布数列的极大或极小值影响,从而在一定程度上提高了中位数对分布数列的代表性。比如人口统计、人均收入统计等都会使用到中位数。
[0004]因此,在多个参与方进行数据联合计算的场景下,经常需要对多个参与方持有的数据计算中位数。目前业内多方安全计算中位数算子,其执行逻辑普遍是对多方 ...
【技术保护点】
【技术特征摘要】
1.一种数据中位数确定方法,其特征在于,包括:根据多个参与方中每个参与方的本地原始数据确定所有本地原始数据的中位数的取值范围;根据所述取值范围以及所有本地原始数据确定所述中位数的位置索引;根据本地原始数据的大小将所述本地原始数据划分为多个区间,并根据划分后的本地原始数据确定对应的累加序列;其中,所述累加序列中的每一数值大小表征所述本地原始数据落入对应区间之前及落入对应区间中的所有数据的数量;对多个参与方中每个参与方的累加序列进行密态按序相加,得到密态累积序列;根据所述密态累积序列以及所述位置索引确定所述中位数所在的目标区间,并根据所述目标区间以及划分后的本地原始数据确定候选数据列表;根据多个参与方中每个参与方的候选数据列表确定所述中位数。2.根据权利要求1所述的数据中位数确定方法,其特征在于,所述根据多个参与方中每个参与方的本地原始数据确定所有本地原始数据的中位数的取值范围,包括:对所述本地原始数据进行求和得到对应的数据和,并确定所述本地原始数据中的第一数据数量;对所述数据和进行密态化得到第一密态数据;对多个参与方中每个参与方的第一数据数量进行求和得到所有参与方的第二数据数量;根据所述第二数据数量以及多个参与方中每个参与方的第一密态数据,计算多个第一密态数据的均值得到第二密态数据,并根据所述第二密态数据执行多方安全计算标准差算子得到第三密态数据;根据所述第二密态数据以及所述第三密态数据确定中位数的密态取值范围,并根据所述密态取值范围得到所述取值范围。3.根据权利要求2所述的数据中位数确定方法,其特征在于,所述根据所述取值范围以及所有本地原始数据确定所述中位数的位置索引,包括:根据所述取值范围对所述本地原始数据进行过滤,得到在所述取值范围之内的数据集以及在所述取值范围之外的第三数据数量;根据所述第二数据数量确定所述中位数的初始索引;根据所述中位数的初始索引以及多个参与方中每个参与方的数据集中小于所述取值范围的第四数据数量确定所述位置索引。4.根据权利要求1
‑
3任一项所述的数据中位数确定方法,其特征在于,所述根据划分后的本地原始数据确定对应的累加序列,包括:记录每个区间内的第五数据数量;针对第i个区间,对第1个区间的第五数据数量至第i个区间的第五数据数量进行求和,得到所述累加序列中的第i个数值大小;其中,1≤i≤N,N为区间数量且为正整数。5.根据权利要求1
‑
3任一项所述的数据中位数确定方法,其特征在于,所述根据所述密态累积序列以及所述位置索引确定所述中位数所在的目标区间,包括:将所述密态累积序列中的数据依次与所述位置索引的大小进...
【专利技术属性】
技术研发人员:尤志强,卞阳,赵东,朱崇炳,
申请(专利权)人:富算科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。