收集与分析数据的方法与相关的装置制造方法及图纸

技术编号：22075182 阅读：78 留言：0更新日期：2019-09-12 13:58

本发明专利技术公开了一种收集与分析数据的方法，所述方法包括对具有一原始特征的一原始数据串执行一第一噪声步骤以生成具有一第一特征的一第一数据串；及对所述第一数据串执行一第二噪声步骤以生成具有一第二特征的一第二数据串，其中所述原始特征与所述第一特征之间的一第一变异度大于所述原始特征与所述第二特征之间的一第二变异度。因此，相较于现有技术，本发明专利技术可以用于保护数据的隐私以及提昇数据分析上的可利用率。

Methods for collecting and analyzing data and related devices

全部详细技术资料下载

【技术实现步骤摘要】
收集与分析数据的方法与相关的装置
本专利技术是涉及于一种收集与分析数据的方法与相关的装置，尤其涉及一种可利用一第一噪声产生步骤与一第二噪声产生步骤来对一原始数据串中的识别信息去识别化的方法与相关的装置。
技术介绍
在当代社会里，数据的利用对个人用户或是机构都相当的重要，然而，两者对数据获取途径的立场并不相同。公司或者学术团体等机构希望收集用户的数据以获取有用的信息，借以提昇服务的针对性或制定发展战略。相对的，所述个人用户会将他们的数据分享给感兴趣的第三方机构以获取多种不同的潜在利益，但更希望能确保他们的隐私，例如应用程序的使用纪录、定位记录或浏览器的历史记录不被泄漏。因此，如何最大化所述个人用户的服务使用经验以及最小化所述个人用户隐私的泄漏是人们需面对的一项困境。在现有技术中，随机响应(RandomizedResponse)机制(详见于参考文件[17])的使用引起了学术界相当的兴趣，且可以用于解决上述的困境。所述随机响应机制的概念，是在将数据分享给任何信任数据经手人之前，于用户端先对所述数据产生噪声。与需要仰赖可信任的第三方机构或者需要对数据的使用范围作限制的技术如集中式差分隐私(CentralizedDifferentialPrivacy)(详见于参考文件[6][7])或加密式的隐私保护(Encryption-BasedPrivacy-Preserving)(详见于参考文件[8][10])相对比，所述随机响应机制可以在用户端差分隐私(LocalDifferentialPrivacy)的定义下与拥有较广泛的数据的使用范围下提供严密的隐私保证。特别来说，所述...

【技术保护点】
1.一种收集与分析数据的方法，其特征在于包含：对具有一原始特征的一原始数据串执行一第一噪声步骤以生成具有一第一特征的一第一数据串；及对所述第一数据串执行一第二噪声步骤以生成具有一第二特征的一第二数据串，其中所述原始特征与所述第一特征之间的一第一变异度大于所述原始特征与所述第二特征之间的一第二变异度。

【技术特征摘要】
2018.03.01 US 62/636,8571.一种收集与分析数据的方法，其特征在于包含：对具有一原始特征的一原始数据串执行一第一噪声步骤以生成具有一第一特征的一第一数据串；及对所述第一数据串执行一第二噪声步骤以生成具有一第二特征的一第二数据串，其中所述原始特征与所述第一特征之间的一第一变异度大于所述原始特征与所述第二特征之间的一第二变异度。2.如权利要求1所述的方法，其特征在于所述第一噪声步骤包含：根据一真随机数产生器产生的一第一随机数集合，对所述原始数据串执行一永久随机响应以生成一暂时数据串；及根据所述真随机数产生器产生的一第二随机数集合，对所述暂时数据串执行一瞬时随机响应以生成所述第一数据串。3.如权利要求2所述的方法，其特征在于所述第二噪声步骤包含：根据所述真随机数产生器产生的一第三随机数集合，对所述第一数据串执行一合成随机响应以生成所述第二数据串。4.如权利要求1所述的方法，其特征在于：在对所述原始数据串执行所述第一噪声步骤后，所述原始数据串中的识别信息被去识别化。5.如权利要求1所述的方法，其特征在于另包含：接收一输入数据串並对所述输入数据串进行散列编码以生成具有所述原始特征的所述原始数据串。6.一种收集与分析数据的方法，其特征在于包含：对具有一特征分布的一原始数据串执行一第一噪声步骤以生成具有一第一分布的一第一数据串；及对所述第一数据串执行一第二噪声步骤以生成具有一第二分布的一第二数据串，其中所述特征分布与所述第一分布之间的一第一变异度大于所述特征分布与所述第二分布之间的一第二变异度。7.如权利要求6所述的方法，其特征在于所述第一噪声步骤包含：根据一真随机数产生器产生的一第一随机数集合，对所述原始数据串执行一永久随机响应以生成一暂时数据串；及根据所述真随机数产生器产生的一第二随机数集合，对所述暂时数据串执行一瞬时随机响应以生成所述第一数据串。8.如权利要求7所述的方法，其特征在于所述第二噪声步骤包含：根据所述真随机数产生器产生的一第三随机数集合，对所述第一数据串执行一合成随机响应以生成所述第二数据串。9.如权利要求6所述的方法，其特征在于：在对所述原始数据串执行所述第一噪声步骤后，所述原始数据串中的识别信息被去识别化。10.如权利要求6所述的方法，其特征在于另包含：接收输入数据串並對所述输入数据串进行散列编码以生成具有所述特征分布的所述原始数据串。11.一种收集与分析数据的装置，其特征在于包含：一第一处理器，用于对具有一原始特征的一原始数据串执行一第一噪声步骤以生...

【专利技术属性】
技术研发人员：邹耀东，振昊，张庆瑞，郭斯彦，
申请(专利权)人：钰创科技股份有限公司，
类型：发明
国别省市：中国台湾,71

全部详细技术资料下载我是这个专利的主人