一种数据统计方法、系统及介质技术方案

技术编号:34772030 阅读:21 留言:0更新日期:2022-08-31 19:35
本发明专利技术涉及一种数据统计方法、系统及介质。其中,该数据统计方法包括:S1.获取用户填写的真实数据;S2.将用户填写的真实数据与服从特定分布的随机数进行运算,得到待统计数据;S3.计算待统计数据的均值,得到用户真实数据的均值;S4.根据用户真实数据的均值与待统计数据的二阶距,得到用户真实数据的方差。这样能够在用户的真实数据统计的同时对该真实数据隐蔽处理,使统计端不能直接呈现出用户的真实数据,统计人员不用面对用户的真实数据,也不能够从接收到的待统计数据中知晓用户的真实数据,既有效保护了用户的隐私,不会被泄露,又提高了用户配合统计的积极性和用户填写数据的真实性,数据统计的准确率高,能够反映出真实情况。出真实情况。出真实情况。

【技术实现步骤摘要】
一种数据统计方法、系统及介质


[0001]本专利技术涉及数据统计
,特别是涉及一种数据统计方法、装置及介质。

技术介绍

[0002]在社会生活中,为了获取某一方面的知识或者情况,通常会对相关数据进行统计,以便为进一步处理给予决策支持。例如:如果想知道不同年龄段儿童成长发育情况,就需要统计他们的身高、体重、腰围等数据的均值与方差;如果想了解社会的贫富差距情况,就需要统计人们的收入数据的均值与方差;如果想了解成年人身体某一器官的大小或者长短,就需要统计成年人相关器官的大小或者长短的均值与方差。
[0003]而上述被统计的数据来源多种多样:有的来自于政府部门,有的来源于企事业单位,也有的来自于问卷调查。
[0004]但是,申请人发现:目前的数据统计通常直接获得原始数据,一旦使用不当就会泄露公民的隐私,从而导致采用这种统计方法进行问卷调查时,进一步增加了人们(被调查者)的疑虑,害怕自己的真实数据被泄露,并给自己带来困扰和麻烦,因而使人们不愿意配合调查或者填报假数据来敷衍,最终导致该项数据统计结果失真,准确率和真实性大大降低,根本无法反映不了真实的情况。

技术实现思路

[0005]本专利技术提供了一种数据统计方法、系统及计算机可读存储介质,通过在用户的真实数据的同时将用户的真实数据隐蔽处理为待统计数据,使统计端不能直接呈现出用户的真实数据,统计人员不用面对用户的真实数据,也不能够从接收到的待统计数据中知晓用户的真实数据,能够有效保护用户的隐私,不会被泄露,提高用户配合统计的积极性和用户填写数据的真实性,从而提高数据统计的准确率,使数据统计能够反映出真实情况。
[0006]第一方面,本专利技术提供了一种数据统计方法,包括:
[0007]S1.获取用户填写的真实数据;
[0008]S2.将用户填写的真实数据与服从特定分布的随机数进行运算,得到待统计数据;
[0009]S3.计算待统计数据的均值,得到用户真实数据的均值;
[0010]S4.根据用户真实数据的均值与待统计数据的二阶距,得到用户真实数据的方差。
[0011]进一步地,所述S2包括:
[0012]产生服从特定分布的随机数,并将该随机数定义为第一随机变量;
[0013]将用户填写的真实数据定义为服从特定分布的第二随机变量;
[0014]将该服从特定分布的第二随机变量与服从特定分布的第一随机变量进行运算,得到待统计数据对应的随机变量。
[0015]进一步地,S2中的所述服从特定分布的随机数是服从高斯分布、均匀分布、伯努利分布、贝塔分布、柯西分布、卡方分布、两点分布、二项分布、几何分布、超几何分布、泊松分布中任意一种的随机数,所述服从特定分布的随机变量是服从高斯分布、均匀分布、伯努利
分布、贝塔分布、柯西分布、卡方分布、两点分布、二项分布、几何分布、超几何分布、泊松分布中任意一种的随机变量。
[0016]进一步地,S2中的所述运算为加法、减法、乘法或者除法。
[0017]进一步地,步骤S3按照以下公式计算待统计数据的均值,得到用户真实数据的均值E(Y);
[0018]当S2的所述运算为加法时,则利用以下公式(1)和(2)计算得到用户真实数据的均值E(Y):
[0019]E(X+Y)=E(X)+E(Y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0020]E(Y)=E(X+Y)

E(X)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0021]其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,X为第一随机变量,Y为第二随机变量,x
i
为产生服从特定分布的随机数,y
i
为用户填写的真实数据,X+Y为待统计数据对应的随机变量,N为数据集合中样值个数;
[0022]当S2的所述运算为减法时,则利用以下公式(3)和(4)计算得到用户真实数据的均值:
[0023]E(X

Y)=E(X)

E(Y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0024]E(Y)=E(X)

E(X

Y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0025]其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,X为第一随机变量,Y为第二随机变量,x
i
为产生服从特定分布的随机数,y
i
为用户填写的真实数据,X

Y为待统计数据对应的随机变量,N为数据集合中样值个数;
[0026]当S2的所述运算为乘法时,则利用以下公式(5)和(6)计算得到用户真实数据的均值E(Y):
[0027]E(XY)=E(X)E(Y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0028]E(Y)=E(XY)/E(X)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0029]其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,X为第一随机变量,Y为第二随机变量,x
i
为产生服从特定分布的随机数,y
i
为用户填写的真实数据,XY为待统计数据对应的随机变量,N为数据集合中样值个数;
[0030]当S2的所述运算为除法时,则利用以下公式(7)和(8)计算得到用户真实数据的均值E(Y):
[0031]E(X/Y)=E(X)/E(Y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0032]E(Y)=E(X)/E(X/Y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0033]其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,X为第一随机变量,Y为第二随机变量,x
i
为产生服从特定分布的随机数,y
i
为用户填写的真实数据,X/Y为待统计数据对应的随机变量,N为数据集合中样值个数。
[0034]进一步地,步骤S4具体为:根据用户真实数据的均值与待统计数据的二阶距按照以下公式计算得到用户真实数据的方差D(Y);
[0035]当S2的所述运算为加法时,则利用以下公式(9)

(11)计算得到用户真实数据的方差D(Y):
[0036]E[(X+Y)2]=E[X2+2XY+Y2]=E(X2)+2E(X)E(Y)+E(Y2)
ꢀꢀꢀ
(9)
[0037]E(Y2)=E[(X+Y)2]‑
E(X2)

2E(X)E(Y)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0038]D(Y)=E(Y2)

E2(Y)
...

【技术保护点】

【技术特征摘要】
1.一种数据统计方法,其特征在于,所述方法包括:S1.获取用户填写的真实数据;S2.将用户填写的真实数据与服从特定分布的随机数进行运算,得到待统计数据;S3.计算待统计数据的均值,得到用户真实数据的均值;S4.根据用户真实数据的均值与待统计数据的二阶距,得到用户真实数据的方差。2.如权利要求1所述的方法,其特征在于,所述S2包括:产生服从特定分布的随机数,并将该随机数定义为第一随机变量;将用户填写的真实数据定义为服从特定分布的第二随机变量;将该服从特定分布的第二随机变量与服从特定分布的第一随机变量进行运算,得到待统计数据对应的随机变量。3.如权利要求2所述的方法,其特征在于,S2中的所述服从特定分布的随机数是服从高斯分布、均匀分布、伯努利分布、贝塔分布、柯西分布、卡方分布、两点分布、二项分布、几何分布、超几何分布、泊松分布中任意一种的随机数,所述服从特定分布的随机变量是服从高斯分布、均匀分布、伯努利分布、贝塔分布、柯西分布、卡方分布、两点分布、二项分布、几何分布、超几何分布、泊松分布中任意一种的随机变量。4.如权利要求1或2或3所述的方法,其特征在于,S2中的所述运算为加法、减法、乘法或者除法。5.如权利要求2所述的方法,其特征在于,步骤S3按照以下公式计算待统计数据的均值,得到用户真实数据的均值E(Y);当S2的所述运算为加法时,则利用以下公式(1)和(2)计算得到用户真实数据的均值E(Y):E(X+Y)=E(X)+E(Y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)E(Y)=E(X+Y)

E(X)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,X为第一随机变量,Y为第二随机变量,x
i
为产生服从特定分布的随机数,y
i
为用户填写的真实数据,X+Y为待统计数据对应的随机变量,N为数据集合中样值个数;当S2的所述运算为减法时,则利用以下公式(3)和(4)计算得到用户真实数据的均值E(Y):E(X

Y)=E(X)

E(Y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)E(Y)=E(X)

E(X

Y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,X为第一随机变量,Y为第二随机变量,x
i
为产生服从特定分布的随机数,y
i
为用户填写的真实数据,X

Y为待统计数据对应的随机变量,N为数据集合中样值个数;当S2的所述运算为乘法时,则利用以下公式(5)和(6)计算得到用户真实数据的均值E
(Y):E(XY)=E(X)E(Y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)E(Y)=E(XY)/E(X)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)其中,为随机数的均值(E(X)选取的时候注意不能为0),为用户真实数据的均值,为待统计数据的均值,X为第一随机变量,Y为第二随机变量,x
i
为产生服从特定分布的随机数,y
i
为用户填写的真实数据,XY为待统计数据对应的随机变量,N为数据集合中样值个数;当S2的所述运算为除法时,则利用以下公式(7)和(8)计算得到用户真实数据的均值E(Y):E(X/Y)=E(X)/E(Y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)E(Y)=E(X)/E(X/Y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,X为第一随机变量,Y为第二随机变量,x
i
为产生服从特定分布的随机数,y
i
为用户填写的真实数据,X/Y为待统计数据对应的随机变量,N为数据集合中样值个数。6.如权利要求5所述的方法,其特征在于,步骤S4具体为:根据用户真实数据的均值与待统计数据的二阶距按照以下公式计算用户真实数据的方差D(Y);当S2的所述运算为加法时,则利用以下公式(9)

(11)计算得到用户真实数据的方差D(Y):E[(X+Y)2]=E[X2+2XY+Y2]=E(X2)+2E(X)E(Y)+E(Y2)
ꢀꢀꢀꢀ
(9)E(Y2)=E[(X+Y)2]

【专利技术属性】
技术研发人员:张连波谢海军许骆泽子张小凤赵慧元苏秉华
申请(专利权)人:北京理工大学珠海学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1