数据处理方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:33338180 阅读:15 留言:0更新日期:2022-05-08 09:22
本申请实施例提供一种数据处理方法、装置、电子设备和可读存储介质,该方法包括:根据待检测对象的隐私声明和预设关键词集合,获取隐私声明的关键词集合,预设关键词集合中包含隐私声明的关键词集合中的关键词;获取待检测对象的外发数据;根据隐私声明的关键词集合和外发数据,对待检测对象进行隐私一致性检测,得到待检测对象的检测结果。本申请实施例中可以对待检测对象运行过程中真实外发数据进行检测,因此可以准确确定应用程序中真实采集的数据是否为应用程序的隐私声明中包括的数据,能够提高应用程序的隐私一致性检测的准确性。能够提高应用程序的隐私一致性检测的准确性。能够提高应用程序的隐私一致性检测的准确性。

【技术实现步骤摘要】
数据处理方法、装置、电子设备和可读存储介质


[0001]本申请实施例涉及信息安全技术,尤其涉及一种数据处理方法、装置、电子设备和可读存储介质。

技术介绍

[0002]应用程序的隐私声明,对用户使用应用程序时终端设备能够采集的用户的个人数据进行了说明。但对于一些恶意的应用程序或者出现漏洞的应用程序,终端设备采集的应用程序中用户的个人数据会超出应用程序的隐私声明限制的范围,会严重侵犯用户的隐私。因此,有必要对应用程序进行隐私一致性检测,即检测采集的应用程序中用户的个人数据是否在应用程序的隐私声明说明的范围内。

技术实现思路

[0003]本申请实施例提供一种数据处理方法、装置、电子设备和可读存储介质,以提高应用程序的隐私一致性检测的准确性。
[0004]第一方面,本申请实施例提供一种数据处理方法,执行该数据处理方法的执行主体可以为终端设备或终端设备中的芯片,或者服务器、服务器中的芯片、或者由服务器和终端设备交互实现,下述以执行主体为终端设备为例进行说明。该数据处理方法中,终端设备可以获取待检测对象的外发数据,该待检测对象的外发数据为待检测对象中真实外发的数据。待检测对象可以为应用程序、网站、网页,或者应用程序、网站的安装包。终端设备根据待检测对象的隐私声明和预设关键词集合,获取所述隐私声明的关键词集合。应理解,待检测对象中运行的数据为自定义的数据,并非用户真实的个人数据。
[0005]其中,所述预设关键词集合中包含所述隐私声明的关键词集合中的关键词。也就是说,终端设备可以获取所述隐私声明中与所述预设关键词集合中的关键词相同的关键词,得到所述隐私声明的关键词集合。应理解,预设关键词集合可以为开发人员预先维护的包括大量的关键词的集合,预设关键词集合中的关键词可以为从不同的隐私声明中提取的关键词。终端设备在获取隐私声明的关键词集合和所述外发数据后,可以根据所述隐私声明的关键词集合和所述外发数据,对所述待检测对象进行隐私一致性检测,得到所述待检测对象的检测结果。
[0006]因为本申请实施例中,终端设备可以获取待检测对象运行过程中真实外发的数据,并以该真实外发的数据检测待检测对象中采集的数据是否为应用程序的隐私声明中包括的数据,能够提高应用程序的隐私一致性检测的准确性。
[0007]在一种可能的实现方式中,终端设备可以根据所述预设关键词集合,获取所述外发数据中与所述预设关键词集合中的关键词相同的关键词,得到所述外发数据的第一关键词集合。其中,若所述隐私声明的关键词集合中包括所述第一关键词集合中所有的关键词,则确定所述待检测对象通过隐私一致性检测;若所述隐私声明的关键词集合中未包括所述第一关键词集合中的关键词,则确定所述待检测对象未通过隐私一致性检测。
[0008]上述方式中虽然能够依据待检测对象的外发数据的关键词和隐私声明的关键词集合中的关键词的比较,对待检测对象通过隐私一致性检测。但是若待检测对象的外发数据中不包括关键词,则无法确定外发数据中的关键词,进而无法对待检测对象进行隐私一致性检测。因此,在一种可能的实现方式中,终端设备可以预先存储预设额关键词集合中每个关键词对应的数据的格式,进而在终端设备获取待检测对象的外发数据时,可以根据待检测对象的外发数据的格式,以及预设关键词集合中每个关键词的格式,对待检测对象通过隐私一致性检测。其中,若隐私声明的关键词集合中的关键词对应的数据的格式包括外发数据的格式,则可以确定待检测对象通过隐私一致性检测,反之,待检测对象未通过隐私一致性检测。在该种实现方式中,即使外发数据中不包括关键词,终端设备也能够通过对数据的格式的分析,获取待检测对象的隐私一致性检测结果,适用范围广。
[0009]在一种实施例中,外发数据中可能包含有预设关键词集合中不存在的关键词,即预设关键词集合维护不完整。在该种场景下,终端设备可以获取所述待检测对象的外发数据中的第二关键词集合,进而判断第二关键词集合中是否包含预设关键词集合中不存在的关键词。其中,若所述预设关键词集合中未包含第二关键词集合中的第一关键词,则将所述第一关键词添加至所述预设关键词集合中。应理解,终端设备可以将待检测对象的外发数据进行分词,得到多个词语,且将预设词性的词语作为待检测对象的外发数据中的关键词,以得到待检测对象的第二关键词集合。
[0010]本申请实施例中,终端设备可以获取待检测对象的外发数据中的关键词,进而对预设关键词集合进行更新,以丰富预设关键词集合中的关键词,能够提高依据该预设关键词集合执行的隐私一致性检测的准确性。
[0011]在一种可能的实现方式中,终端设备获取待检测对象的检测结果后,可以显示待检测对象的检测结果,进而使得开发人员可以实时掌握待检测对象是否侵犯了用户隐私,在确定待检测对象未通过隐私一致性检测时,可以及时对待检测对象进行修改或调整,以避免侵犯用户的隐私。
[0012]在一种可能的实现方式中,终端设备可以获取所述待检测对象中与所述预设关键词集合中的关键词相同的关键词,得到所述待检测对象的关键词集合。应理解,终端设备中可以预先存储有预设埋点数据,预设埋点数据为待检测对象中可能外发的数据,但还未进行真正外发,该预设埋点数据可以为开发人员自定义的数据。其中,预设埋点数据与预设关键词集合中的关键词具有映射关系,其中,预设关键词集合中的每个关键词都对应有预设埋点数据。预设埋点数据可以为未编码的数据,和/或编码后的数据。示例性的,如预设关键词集合中包括身份证号码和性别两个关键词,则预设埋点数据可以为身份证号码对应的12345,或者编码后的12345,待外发的数据可以为“女”,或者编码后的“女”。
[0013]本申请实施例中,终端设备可以根据预设关键词集合中的关键词和预设埋点数据的映射关系,以及述待检测对象的关键词集合,确定所述待检测对象的埋点数据,该埋点数据为待检测对象中可能发送的数据,但还未真实外发。终端设备可以检测埋点数据是否真实外发,进而获取外发的埋点数据,该外发的埋点数据即为终端设备获取的待检测对象的外发数据。
[0014]本申请实施例中可以预先确定埋点数据(即待检测对象中可能外发的数据),进而通过外发的埋点数据对应用程序进行隐私一致性检测。因为埋点数据的数据量相较于待检
测对象所有的外发数据的数据量小,因此终端设备获取外发的埋点数据可以减小隐私一致性检测的计算量,提高应用程序的隐私一致性的检测效率。
[0015]或者,本申请实施例中,终端设备可以将待检测对象的关键词集合发送给服务器,由服务器根据待检测对象的关键词集合,以及所述预设关键词集合中的关键词和预设埋点数据的映射关系,确定埋点数据。相较于终端设备获取埋点数据的方式,由服务器获取埋点数据的方式可以尽可能少地避免在终端设备侧泄露隐私一致性的检测过程,避免其他恶意设备获取本申请实施例中的泄露隐私一致性的检测方法,安全性更高。另外,预设关键词集合中的关键词和预设埋点数据的映射关系需要占据大量的存储空间,该映射关系存储在服务器侧,可以减少终端设备中存储空间的占用,也能够提高终端设备的检测效率。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:根据待检测对象的隐私声明和预设关键词集合,获取所述隐私声明的关键词集合,所述预设关键词集合中包含所述隐私声明的关键词集合中的关键词;获取所述待检测对象的外发数据;根据所述隐私声明的关键词集合和所述外发数据,对所述待检测对象进行隐私一致性检测,得到所述待检测对象的检测结果。2.根据权利要求1所述的方法,其特征在于,所述根据待检测对象的隐私声明和预设关键词集合,获取所述隐私声明的关键词集合,包括:获取所述隐私声明中与所述预设关键词集合中的关键词相同的关键词,得到所述隐私声明的关键词集合。3.根据权利要求1或2所述的方法,其特征在于,所述获取所述待检测对象的外发数据,包括:获取所述待检测对象中与所述预设关键词集合中的关键词相同的关键词,得到所述待检测对象的关键词集合;根据所述预设关键词集合中的关键词和预设埋点数据的映射关系,以及所述待检测对象的关键词集合,获取埋点数据;获取外发的埋点数据。4.根据权利要求3所述的方法,其特征在于,所述预设埋点数据为未编码的数据和/或编码后的数据。5.根据权利要求3所述的方法,其特征在于,所述方法还包括:向服务器发送所述待检测对象的关键词集合,以请求所述埋点数据;接收来自所述服务器的所述埋点数据。6.根据权利要求3

5中任一项所述的方法,其特征在于,所述获取外发的埋点数据,包括:获取所述待检测对象的外发接口的数据;将所述外发接口的数据中与所述埋点数据相同的数据,作为所述外发的埋点数据。7.根据权利要求3

6中任一项所述的方法,其特征在于,所述获取外发的埋点数据,包括:遍历触发所述待检测对象的控件,以获取触发所述控件产生的外发的数据;将所述控件产生的外发的数据中与所述埋点数据相同的数据,作为所述外发的埋点数据。8.根据权利要求7所述的方法,其特征在于,所述遍历触发所述待检测对象的控件,包括:遍历确定所述待检测对象的页面中的控件;根据控件的调用顺序,构建控件的有向图;根据所述控件的有向图,遍历触发所述待检测对象的控件。9.根据权利要求8所述的方法,其特征在于,所述根据所述控件的有向图,遍历触发所述待检测对象的控件,包括:根据所述控件的有向图,且以深度优先的遍历策略,遍历触发所述待检测对象的控件;
或者,根据所述控件的有向图,且以广度优先的遍历策略,遍历触发所述待检测对象的控件。10.根据权利要求1或2所述的方法,其特征在于,所述根据所述隐私声明的关键词集合和所述外发数据,对所述待检测对象进行隐私一致性检测,得到所述待检测对象的检测结果,包括:获取所述外发数据中与所述预设关键词集合中的关键词相同的关键词,得到所述外发数据的第一关键词集合;若所述隐私声明的关键词集合中包括所述第一关键词集合中所有的关键词,则确定所述待检测对象通过隐私一致性检测;若所述隐私声明的关键词集合中未包括所述第一关键词集合中的关键词,则确定所述待检测对象未通过隐私一致性检测。11.根据权利要求...

【专利技术属性】
技术研发人员:张述姜燕
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1