一种应用于用户画像领域的数据增广方法技术

技术编号：33779241 阅读：17 留言：0更新日期：2022-06-12 14:33

本发明专利技术公开了一种应用于用户画像领域的数据增广方法，涉及用户画像标签预测领域；克服了标签率极低的问题，同时提高模型的泛化性，以便于根据用户行为数据预测多维度多标签的用户画像标签，并且有效结合自监督学习，能够在用户标签率极低的情况下实现用户分类，降低了人工标注数据集的成本，提高了模型的泛化能力，同时克服图神经网络由于拉普拉斯平滑现象导致其在标签率极低的图上性能急剧下降的问题，提高模型分类的准确性。提高模型分类的准确性。提高模型分类的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种应用于用户画像领域的数据增广方法

[0001]本专利技术涉及用户画像标签预测领域，具体涉及一种应用于用户画像领域的数据增广方法。

技术介绍

[0002]近年来，我国信息化建设速度已位居国际前列，随着信息化水平与普及率日益提高，根据CNNIC统计数据，我国网民人数规模已经突破10亿大关，截止2021年06月，我国网民规模已达到10.11亿，其中网络支付用户规模已近9亿。信息化快速发展“互联网+”应用越来越广泛和深入，只有了解市场、了解客户、了解竞争对手，才能推出物美价廉的产品，获得等多的市场青睐。最后是需要突破传统并建立新规则，传统金融机构想了解用户，更多的是选择依靠客户经理，依靠人与人的沟通，需要消耗大量的人力财力，并且由于用户间的差异性，很难达到有效的沟通。而用户画像系统则可以实现任何无需直接与用户对接便可以快速了解客户，最终目标是通过各类系统及产品，实现客户与公司绑定，实现真正意义的高用户忠诚度，此用户忠诚于系统，忠诚于公司的产品和服务，而不受限于人。
[0003]用户画像的概念最早是由交互设计之父Alan Copper提出的，他指出用户画像是虚拟用户的代表，是由一系列数据信息所组成的立体用户模型。简单来说，用户画像就是通过用户各种行为数据为用户制作标签，将每一个用户形象具体化，力求对用户特征进行客观准确描述的一种用户分析方法。用户画像最初是在电商领域得到应用的，由于实用效果非常明显且具有良好的适应性，它作为一种有效的目标用户分析工具迅速在计算机、图书情报等学科领域得到广泛应用。随着大数据技术的兴起，...

【技术保护点】

【技术特征摘要】
1.一种应用于用户画像领域的数据增广方法,其特征在于：包括以下步骤：S1：根据原始数据中用户的好友关系，构建用户异质网络图，图中每个节点都代表一个用户，图中每一条边都代表连接的两个用户拥有好友关系，通过图神经网络聚合当前节点的邻域节点信息，得到当前节点嵌入向量；S2:根据S1获取的当前节点嵌入向量，通过图神经网络分类器，得到多标签分类概率矩阵，对个节点的每个标签的概率进行过滤，大于阈值的生成节点标签；S3:根据用户异质网络图，利用自监督学习思想，采用图划分技术的自监督学习方式，得到若干个划分后的子图，在每个子图中对无标签节点进行对齐操作，使其与真正的标签匹配，为无标签节点生成伪标签；S4：对S2生成的节点标签、利用S3中生成的伪标签进行自检，一致则加入真实标签集，迭代进行训练多次，以扩充训练数据集。2.如权利要求1所述的应用于用户画像领域的数据增广方法,其特征在于：所述节点标签数量为1
‑
N个。3.如权利要求1所述的应用于用户画像领域的数据增广方法,其特征在于：所述S1具体包括：S1.1对待处理的原始数据进行缺失值填充、重复值过滤、异常值处理，得到处理后的用户行为数据；S1.2:利用用户好友关系，构建用户邻接矩阵；利用用户行为数据，构建用户特征矩阵；S1.3:根据所获得用户邻接矩阵和特征矩阵，利用图神经网络模型，通过图卷积算子，聚合邻域节点相关信息，得到节点的嵌入表示。4.如权利要求1所述的应用于用户画像领域的数据增广方法,其特...

【专利技术属性】
技术研发人员：赵相国，张官正，毕鑫，聂豪杰，王秋宇，
申请(专利权)人：东北大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人