一种应用程序的检测方法、装置及设备制造方法及图纸

技术编号：24854069 阅读：32 留言：0更新日期：2020-07-10 19:07

本说明书实施例公开了一种应用程序的检测方法、装置及设备，所述方法包括：在检测到宿主程序中的目标应用程序运行时，获取目标应用程序运行时打开的预设页面的页面内容以及用户在预设页面的输入信息；对预设页面的页面内容和用户的输入信息进行分词处理，得到预设页面的页面内容中包含的分词信息和用户的输入信息中包含的分词信息；将预设页面的页面内容中包含的分词信息和用户的输入信息中包含的分词信息，输入预先训练的页面识别模型，得到预设页面是对用户隐私信息存在恶意侵犯的诱导采集页面的目标概率；基于目标概率，确定目标应用程序的预设页面是否为对用户隐私信息存在恶意侵犯的诱导采集页面，以保护用户隐私信息。

全部详细技术资料下载

【技术实现步骤摘要】
一种应用程序的检测方法、装置及设备
本说明书涉及计算机
，尤其涉及一种应用程序的检测方法、装置及设备。
技术介绍
为适应电子设备的内存以及用户多样化的使用需求，小程序(即需要搭载在宿主程序运行的应用程序)应运而生，但恶意小程序会带来用户的隐私信息泄露以及财产损失等问题，因此，如何对小程序是否为对用户隐私信息存在恶意侵犯的恶意应用程序进行检测，以避免造成用户的隐私泄露以及经济损失等问题，成为程序开发者关注的焦点。目前，在对应用程序进行风险防控中，可以基于用户的举报信息，确定应用程序是否为对用户的隐私信息存在诱导采集的恶意应用程序，但是，通过用户的举报信息，确定应用程序是否存在风险，存在风险感知滞后性的问题，同时，由于应用程序的数量越来越多，通过采集用户的举报信息，确定应用程序是否存在风险，就存在对应用程序的检测效率低，检测准确性差的问题，因此，需要一种能够及时准确的对应用程序是否为对用户隐私信息存在恶意侵犯的恶意应用程序进行检测，以及对恶意应用程序进行处理的解决方案。
技术实现思路
本说明书实...

【技术保护点】
1.一种应用程序的检测方法，所述方法包括：/n在检测到宿主程序中的目标应用程序运行时，获取所述目标应用程序运行时打开的预设页面的页面内容以及用户在所述预设页面的输入信息，所述目标应用程序为搭载在宿主程序中的小程序；/n对所述预设页面的页面内容和所述用户的输入信息进行分词处理，得到所述预设页面的页面内容中包含的分词信息和所述用户的输入信息中包含的分词信息；/n将所述预设页面的页面内容中包含的分词信息和所述用户的输入信息中包含的分词信息，输入预先训练的页面识别模型，得到所述预设页面是对用户隐私信息存在恶意侵犯的诱导采集页面的目标概率，所述页面识别模型为基于预定的页面内容样本和预定用户的输入信息样本...

【技术特征摘要】
1.一种应用程序的检测方法，所述方法包括：
在检测到宿主程序中的目标应用程序运行时，获取所述目标应用程序运行时打开的预设页面的页面内容以及用户在所述预设页面的输入信息，所述目标应用程序为搭载在宿主程序中的小程序；
对所述预设页面的页面内容和所述用户的输入信息进行分词处理，得到所述预设页面的页面内容中包含的分词信息和所述用户的输入信息中包含的分词信息；
将所述预设页面的页面内容中包含的分词信息和所述用户的输入信息中包含的分词信息，输入预先训练的页面识别模型，得到所述预设页面是对用户隐私信息存在恶意侵犯的诱导采集页面的目标概率，所述页面识别模型为基于预定的页面内容样本和预定用户的输入信息样本进行训练得到的，用于判定诱导采集页面的概率的模型；
基于所述目标概率，确定所述目标应用程序的预设页面是否为对用户隐私信息存在恶意侵犯的诱导采集页面，以保护用户隐私信息，防止所述目标应用程序恶意侵犯用户隐私信息。

2.根据权利要求1所述的方法，所述页面识别模型包括命名实体识别模型，所述命名实体识别模型基于BERT模型构建。

3.根据权利要求2所述的方法，在将所述预设页面的页面内容中包含的分词信息和所述用户的输入信息中包含的分词信息，输入预先训练的页面识别模型，得到所述预设页面是对用户隐私信息存在恶意侵犯的诱导采集页面的目标概率之前，还包括：
在预设时间周期内，获取所述预定的页面内容样本和预定用户的输入信息样本，所述页面内容样本包括历史诱导采集页面的页面内容样本和历史非诱导采集页面的页面内容样本，所述输入信息样本为用户在所述预定的页面内容所属的页面的输入信息；
对所述页面内容样本和输入信息样本进行分词处理，得到所述页面内容样本中包含的分词信息和输入信息样本中包含的分词信息；
基于所述页面内容样本中包含的分词信息和输入信息样本中包含的分词信息，对包括所述命名实体识别模型的页面识别模型进行训练，得到训练后的所述页面识别模型。

4.根据权利要求3所述的方法，所述对所述预设页面的页面内容和所述用户的输入信息进行分词处理，得到所述预设页面的页面内容中包含的分词信息和所述用户的输入信息中包含的分词信息，包括：
基于预设特征提取算法，分别获取与所述预设页面的页面内容对应的页面特征，以及与所述用户的输入信息对应的输入特征；
基于预设特征匹配算法、所述页面特征和所述输入特征，确定所述预设页面是否为疑似诱导采集页面；
在确定所述预设页面为疑似诱导采集页面的情况下，对所述预设的页面内容和所述用户的输入信息进行分词处理，得到所述预设的页面内容中包含的分词信息和所述用户的输入信息中包含的分词信息。

5.根据权利要求4所述的方法，所述基于预设特征匹配算法、所述页面特征和所述输入特征，确定所述预设页面是否为疑似诱导采集页面，包括：
基于预设诱导关键词特征匹配规则，对所述页面特征进行诱导匹配检测，得到第一检测结果；
基于预设敏感信息特征匹配算法，对所述输入特征进行敏感信息匹配检测，得到第二检测结果；
基于所述第一检测结果和所述第二检测结果，确定所述预设页面是否为疑似诱导采集页面。

6.根据权利要求5所述的方法，所述基于预设诱导关键词特征匹配规则，对所述页面特征进行诱导匹配检测，得到第一检测结果，包括：
基于预设正则匹配规则，确定所述页面特征与预设诱导关键词特征的匹配率，并基于所述匹配率，确定所述第一检测结果。

7.根据权利要求1所述的方法，在所述基于所述目标概率，确定所述目标应用程序的预设页面是否为对用户隐私信息存在恶意侵犯的诱导采集页面之后，还包括：
在确定所述预设页面为诱导采集页面的情况下，输出预设报警信息。

8.一种应用程序的检测方法，应用于宿主程序，所述方法包括：
在检测到所述宿主程序中的目标应用程序运行时，基于预设特征提取算法，分别获取与所述预设页面的页面内容对应的页面特征，以及与所述预设页面中用户的输入信息对应的输入特征，所述目标应用程序为搭载在所述宿主程序中的小程序；
基于预设特征匹配算法、所述页面特征和所述输入特征，确定所述预设页面是否为疑似诱导采集页面；
在确定所述预设页面是疑似诱导采集页面的情况下，将所述预设页面的页面内容以及所述用户的输入信息发送至服务器，并接收所述服务器发送的所述预设页面是对用户隐私信息存在恶意侵犯的诱导采集页面的目标概率，所述目标概率为所述服务器基于所述预设页面的页面内容、所述用户的输入信息以及预先训练的页面识别模型而得到的概率，所述页面识别模型为基于预定的页面内容样本和预定用户的输入信息样本进行训练得到的，用于判定诱导采集页面的概率的模型；
基于所述目标概率，确定所述目标应用程序的预设页面是否为对用户隐私信息存在恶意侵犯的诱导采集页面，以保护用户隐私信息，防止所述目标应用程序恶意侵犯用户隐私信息。

9.根据权利要求1所述的方法，在所述基于所述目标概率，确定所述目标应用程序的预设页面是否为对用户隐私信息存在恶意侵犯的诱导采集页面之后，还包括：
在确定所述预设页面为诱导采集页面的情况下，输出预设报警信息。

10.一种应用程序的检测方法，应用于服务器，所述方法包括：
获取宿主程序提供的目标应用程序的预设页面的页面内容以及用户在所述预设页面的输入信息，所述目标应用程序为搭载在宿主程序中的小程序；
对所述预设页面的页面内容和所述用户的输入信息进行分词处理，得到所述预设页面的页面内容中包含的分词信息和所述用户的输入信息中包含的分词信息；
将所述预设页面的页面内容中包含的分词信息和所述用户的输入信息中包含的分词信息，输入预先训练的页面识别模型，得到所述预设页面是对用户隐私信息存在恶意侵犯的诱导采集页面的目标概率，所述页面识别模型为基于预定的页面内容样本和预定用户的输入信息样本进行训练得到的，用于判定诱导采集页面的概率的模型；
将所述目标概率发送给所述宿主程序，以使所述宿主程序基于所述目标概率，确定所述预设页面是否为对用户隐私信息存在恶意侵犯的诱导采集页面，以保护用户隐私信息，防止所述目标应用程序恶意侵犯用户隐私信息。

11.根据权利要求10所述的方法，所述获取宿主程序提供的目标应用程序的预设页面的页面内容以及用户在所述预设页面的输入信息，包括：
获取所述宿主程序提供的加密后的信息，所述加密后的信息为所述宿主程序基于预设加密算法，对所述预设页面的页面内容以及用户在所述预设页面的输入信息进行加密处理后的信息；
基于预设解密算法，对所述加密后的信息进行解密处理，得到所述预设页面的页面内容以及用户在所述预设页面的输入信息。

12.根据权利要求10所述的方法，在所述将所述预设页面的页面内容中包含的分词信息和所述用户的输入信息中包含的分词信息，输入预先训练的页面识别模型，得到所述预设页面是对用户隐私信息存在恶意侵犯的诱导采集页面的目标概率之后，还包括：
基于所述目标概率，确定所述预设页面是否为对用户隐私信息存在恶意侵犯的诱导采集页面；
在确定所述预设页面为诱导采集页面的情况下，向预设管理设备发送所述预设页面为诱导采集页面的报警信息。...

【专利技术属性】
技术研发人员：金璐，黄继堂，张鸿翔，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人