用户对象分类方法及装置、计算机可读介质和电子设备制造方法及图纸

技术编号：36975261 阅读：15 留言：0更新日期：2023-03-25 17:55

本公开提供一种用户对象分类方法及装置、计算机可读介质和电子设备，涉及数据处理技术领域。该方法包括：实时监测用户对象的应用程序切换行为，并基于所述应用程序切换行为生成应用程序标识序列；通过预训练语言模型对所述应用程序标识序列进行编码处理，得到应用程序标识词向量；根据所述应用程序标识词向量确定所述用户对象对应的行为特征向量；对所述行为特征向量进行聚类分类，确定所述用户对象的分类结果。本公开能够根据用户对象实时的应用程序切换行为生成应用程序标识序列实现对用户对象的分类，有效处理用户兴趣、偏好中的动态性和实时性，及时捕捉用户兴趣的变化，提高了分类结果的准确性，保证了分类结果的时效性。保证了分类结果的时效性。保证了分类结果的时效性。

全部详细技术资料下载

【技术实现步骤摘要】
用户对象分类方法及装置、计算机可读介质和电子设备

[0001]本公开涉及数据处理
，具体涉及一种用户对象分类方法、用户对象分类装置、计算机可读介质和电子设备。

技术介绍

[0002]随着数据存储资源和计算资源的飞速发展，大数据
得到越来越多的人的关注，其中，得到最广泛应用的就是用户画像。基于用户画像技术的很多应用已经被引入到了学术和工业中，如个性化推荐、广告系统等。
[0003]目前，相关的人群分类方案中，一般是通过用户的兴趣或偏好(用户经常浏览、关注的信息或者历史点击记录等)构建用户画像，并基于用户画像实现对人群的分类。但是，这种技术方案中，只能从有限的数据中估计用户的兴趣或爱好，无法保证用户兴趣、偏好中的动态性、实时性，并且不能很好地解决用户行为数据中的数据稀疏性和数据异质性对分类结果造成的影响，导致分类结果的准确性以及时效性较差。

技术实现思路

[0004]本公开的目的在于提供一种用户对象分类方法、用户对象分类装置、计算机可读介质和电子设备，进而至少在一定程度上提高人群分类结果的准确性以及时效性。
[0005]根据本公开的第一方面，提供一种用户对象分类方法，包括：
[0006]实时监测用户对象的应用程序切换行为，并基于所述应用程序切换行为生成应用程序标识序列；
[0007]通过预训练语言模型对所述应用程序标识序列进行编码处理，得到应用程序标识词向量；
[0008]根据所述应用程序标识词向量确定所述用户对象对应的行为特征向量；
[0009...

【技术保护点】

【技术特征摘要】
1.一种用户对象分类方法，其特征在于，包括：实时监测用户对象的应用程序切换行为，并基于所述应用程序切换行为生成应用程序标识序列；通过预训练语言模型对所述应用程序标识序列进行编码处理，得到应用程序标识词向量；根据所述应用程序标识词向量确定所述用户对象对应的行为特征向量；对所述行为特征向量进行聚类分类，确定所述用户对象的分类结果。2.根据权利要求1所述的方法，其特征在于，所述预训练语言模型由多个基于注意力机制的编码网络构成，所述编码网络包括多头自注意力网络和前馈神经网络；所述通过预训练语言模型对所述应用程序标识序列进行编码处理，得到应用程序标识词向量，包括：对所述应用程序标识序列进行转换处理，得到所述应用程序标识序列对应的字向量序列、段向量序列和位置向量序列；将所述字向量序列、所述段向量序列和所述位置向量序列的和输入到所述预训练语言模型中进行编码处理，得到应用程序标识词向量。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：基于预构建的掩码语言模型对所述应用程序标识序列进行随机掩码处理，所述随机掩码处理包括按照预设比例对应用程序标识序列进行随机替换处理和随机遮掩处理。4.根据权利要求1所述的方法，其特征在于，所述基于所述应用程序切换行为生成应用程序标识序列，包括：基于所述应用程序切换行为获取应用程序切换数据，所述应用程序切换数据包括终端标识数据、应用程序标识数据以及应用程序切换时间戳；对所述应用程序切换数据进行清洗处理，并根据清洗处理后的应用程序切换数据生成应用程序标识序列。5.根据权利要求4所述的方法，其特征在于，所述对所述应用程序切换数据进行清洗处理包括以下至少一种或者多种处理过程的组合：将检测到所述应用程序切换时间戳出现错误的应用程序...

【专利技术属性】
技术研发人员：苏钰，帅朝春，
申请(专利权)人：杭州逗酷软件科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人