场景识别模型训练方法、场景识别方法及装置制造方法及图纸

技术编号：41327606 阅读：20 留言：0更新日期：2024-05-13 15:05

本说明书一个或多个实施例提供了一种场景识别模型训练方法、场景识别方法及装置。本实例基于多个样本应用程序构建训练样本集，即分别对每个样本应用程序进行遍历，得到其样本页面，再对各个样本页面的样本截图文件、样本布局文件进行数据提取，得到二维数组形式的样本页面数据；各个样本页面中提取到的样本页面数据和对应的样本场景标签可以形成训练样本集；通过该训练样本集对预设识别模型进行训练得到目标识别模型。相应的，对于任一应用程序，通过遍历其各个页面并进行数据提取，得到各个页面对应的二维数组形式的目标页面数据，利用上述目标识别模型基于上述目标页面数据对各个页面进行场景识别，即可得到该应用程序对应的服务场景。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书一个或多个实施例涉及信息处理，尤其涉及一种场景识别模型训练方法、场景识别方法及装置。

技术介绍

1、随着互联网技术的发展，各类应用程序层出不穷，逐渐成为人们生活中不可或缺的一种服务方式，为人们的日常生活和工作提供便利。这些应用程序有些在移动终端的操作系统内独立运行，有些则基于前述独立运行的应用程序的开放接口实现、无需安装即可使用(即小程序)。这些应用程序在使用过程中通常需要收集、使用用户相关数据；目前很多应用程序在对用户数据进行收集或使用时存在违规情况，对用户数据的隐私安全造成严重威胁。然而，由于同一应用程序可能提供一种或一种以上服务场景，同时不同的应用程序提供的服务场景也相同，而不同的服务场景所需收集或使用的数据不尽相同；应用程序的页面样式众多且风格迥异，难以准确确定其对应的服务场景，也就无法进一步确定其对用户数据的收集、使用是否存在违规情况。

2、有鉴于此，需要提供一种对应用程序进行场景识别的方案，以快速、准确地确定任一应用程序所对应的服务场景。

技术实现思路

1、...

【技术保护点】

1.一种场景识别模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述分别对多个样本应用程序进行遍历，获取各个所述样本应用程序的至少一个样本页面，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述样本页面的样本截图文件和样本布局文件中的至少一项，提取所述样本页面的样本页面数据，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述样本页面的样本截图文件和样本布局文件中的至少一项，提取所述样本页面的样本页面数据，包括：

5.根据权利要求1所述的方法，其特征在于，所述场景标签用于标记所述样本页面对应...

【技术特征摘要】

1.一种场景识别模型训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述分别对多个样本应用程序进行遍历，获取各个所述样本应用程序的至少一个样本页面，包括：

5.根据权利要求1所述的方法，其特征在于，所述场景标签用于标记所述样本页面对应的预设场景类型；

6.根据权利要求1所述的方法，其特征在于，所述将同一所述样本页面对应的所述样本页面数据和样本场景标签作为一个训练样本，对预设识别模型进行训练，包括以下至少一项：

7.一种场景识别方法，其特征在于，包括：

8.根据权利要求7所述的方法，其特征在于，还包括：

9.根据权利要求7所述的方法，其特征在于，所述根据所述目标页面的目标截图文件和目标布局文件中的至少一项，提取所述目标页面的目标页面数据，包括：

10.根据权利要求7所述的方法，其特征在于，所述根据所述目标页面的目标截图文件和目标布局文件中的至少一项，提取所述目标页面的目标页面数据，包括：

11.一种场景识别模型训练装置，其特征在于，包括：

12.根据权利要求11所述的装置，其特征在于...

【专利技术属性】
技术研发人员：陈文波，李明洋，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人