The present disclosure describes a system and method for transmitting \user identifiable information\ from a client device when it is collecting telemetry data related to operation system or computing application characteristics. In the various examples, the telemetry data is collected to monitor the performance or use of the operating system or the computing application. The process of collecting telemetry data can involve capturing data associated with files that are not directly associated with the monitored operating system or the computing application. In the present disclosure, a cryptographic hash function is used to prevent the disclosure of user identifiable information in the file properties during the process of collecting telemetry data. The privacy of the user is protected by the unrealistic calculation of the calculation of the original file name from the hash value.
【技术实现步骤摘要】
【国外来华专利技术】在遥测数据的传输中保护用户可标识信息
技术介绍
操作系统和应用通常依赖于收集遥测数据来更好地了解如何执行或使用特定特征。通常,在给定时段期间,遥测数据可以辅助开发者隔离操作系统或应用的意外地使用大量资源的特征。使用这一信息,开发者可高效地排定哪些特征可能需要优化的优先次序以改进操作系统或应用的性能。用于存储的遥测数据通常是从与操作系统或应用相关联的所选文件夹收集的。在这些情境中,收集遥测数据的过程通常引入隐私暗示,尤其是在用户选择将个人信息存储在所选文件夹中时。这样的个人信息随后被收集,这对于用户而言可能是不合乎需要的。概述本公开描述了用于阻止在收集遥测数据时‘用户可标识信息’从客户机设备传输到实体的系统和方法。在各示例中,遥测数据被收集以监视存储在客户机设备上的操作系统或计算应用的性能。收集遥测数据的过程可涉及从客户机设备捕获不与预期操作系统或计算应用直接关联的数据。作为结果,用户可标识信息可在文件属性(诸如文件名)中被无意地揭示。本公开提出了使用密码散列函数来阻止用户可标识信息在所传输的遥测数据中被揭示的技术。用户的隐私最终可通过反转散列值并重建原始文件名的计算不切 ...
【技术保护点】
一种计算机实现的方法,包括:使用服务器接收第一文件列表,所述第一文件列表包括代替所述第一文件列表中的文件的文件名的散列值;将来自所述第一文件列表的文件名的散列值与来自第二文件列表的文件名的散列值相比较;确定来自所述第一文件列表的文件名的散列值与来自所述第二文件列表的文件名相匹配;标识文件名的相匹配的散列值的原始文件名;以及通过用所标识的原始文件名替换所述第一文件列表上的文件名的匹配的散列值来生成第三文件列表。
【技术特征摘要】
【国外来华专利技术】2015.04.27 US 14/697,4581.一种计算机实现的方法,包括:使用服务器接收第一文件列表,所述第一文件列表包括代替所述第一文件列表中的文件的文件名的散列值;将来自所述第一文件列表的文件名的散列值与来自第二文件列表的文件名的散列值相比较;确定来自所述第一文件列表的文件名的散列值与来自所述第二文件列表的文件名相匹配;标识文件名的相匹配的散列值的原始文件名;以及通过用所标识的原始文件名替换所述第一文件列表上的文件名的匹配的散列值来生成第三文件列表。2.如权利要求1所述的计算机实现的方法,其特征在于,所述第一文件列表包括客户机环境的文件系统中的所有文件。3.如权利要求1或2中的任一项所述的计算机实现的方法,其特征在于,所述第一文件列表包括与来自客户机环境的操作系统或计算应用中的至少一者相对应的文件。4.如权利要求1-3中的任一项所述的计算机实现的方法,其特征在于,进一步包括在从客户机环境接收到第一文件列表之前,从所述服务器向客户机环境传送标识要包括在所述第一文件列表中的所选文件群的信号。5.如权利要求1-4中的任一项所述的计算机实现的方法,其特征在于,所述第一文件列表包括与操作系统或计算应用中的至少一者相对应的白名单文件以及与客户机环境的用户相关联的非白名单文件。6.如权利要求5所述的计算机实现的方法,其特征在于,所述第二文件列表包括与所述操作系统或所述计算应用中的至少一者的新安装相对应的文件。7.一种计算设备,包括:处理单元;操作地耦合到所述处理单元并且其上具有多个模块的计算机可读介质,所述多个模块包括:标识符模块,所述标识符模块被配置成在由所述处理单元执行时标识一个或多个数据项的目录,所述一个或多个数据项中的每一数据项具有文件名和相关联的数据项大小;散列模块,所述散列模块被配置成在由所述处理单元执行时计算所述一个或多个数据项中的每一单独数据项的文件名的散列值;散列文件列表模块,所述散列文件列表模块被配置成在由所述处理单元执行时配置包括所述一个或多个数据项中的每一单独数据项的文件名的散列值以及相关联的数据项大小的数据项列表以供传输给服务器;以及输出接口,所述输出接口被配置成将包括所述一个或多个数据项中的单独数据项的文件名的散列值以及相关联的数据项大小的所述数据项列表传送给服务器。8.如权利要求7所述的计算设备,其特征在于,进一步包括通信模块,所述通信模块被配置成在由所述处理单元执行时从服务器接收所述一个或多个数据项的目录的指示。9.如权利要求7或8中的任一项所述的计算设备,其特征在于,所述一个或多个数据项包括与操作系统或计算应用中的至少一者相对应的数据项以及不与操作系统或计算应用相...
【专利技术属性】
技术研发人员:O·克罗吉乌斯,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。