标签分类模型训练方法、标签分类方法、装置及设备制造方法及图纸

技术编号:33206811 阅读:51 留言:0更新日期:2022-04-24 00:54
本申请提供一种标签分类模型训练方法、标签分类方法、装置及设备。该标签分类模型训练方法包括:获取无标签数据集和有标签数据集,基于所述无标签数据集和所述有标签数据集构建高斯图;使用所述有标签数据集训练得到初始标签分类模型;根据所述高斯图确定所述有标签数据集和所述无标签数据集之间的标签传播算法;基于所述标签传播算法,将所述无标签数据集中能够转换的无标签数据转换为有标签数据;将转换得到的有标签数据添加至所述有标签数据集中,得到新的有标签数据集;使用所述新的标签数据集重新训练所述初始标签分类模型,得到目标标签分类模型。本申请的方法可以提升对用户消费数据的标签分类效果。用户消费数据的标签分类效果。用户消费数据的标签分类效果。

【技术实现步骤摘要】
标签分类模型训练方法、标签分类方法、装置及设备


[0001]本申请涉及分类模型训练技术,尤其涉及一种标签分类模型训练方法、标签分类方法、装置及设备。

技术介绍

[0002]用户画像的概念最早由交互设计之父Alan Cooper提出,他指出,用户画像就是标签化的用户模型。具体来说就是将用户信息标签化,通过收集与分析消费者社会属性、消费习惯、兴趣爱好等数据,抽象出一个用户的全景画像,以帮助企业精准定位、精准营销、预测与决策。随着信用卡用户需求日益多样化以及信用卡营销管理的精细化,用户画像逐渐被信用卡行业广泛关注。用户画像不仅可以使发卡银行实现精准获取客户、精准营销、精准运营、精准管理,而且能够在极大程度上提升客户体验。
[0003]构建用户画像的核心就是给客户“贴标签”,即基于大数据分析和数据挖掘技术洞察客户行为、偏好,描绘用户不同类型特征,例如“白领精英”“境外消费者”“奢侈品爱好者”等。在数字化转型背景下,信用卡行业试图通过构建客户标签体系,多维度刻画用户特征,为用户提供更好的服务。
[0004]现有的技术方案需要人工给用户数据本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种标签分类模型训练方法,其特征在于,包括:获取无标签数据集和有标签数据集,基于所述无标签数据集和所述有标签数据集构建高斯图;使用所述有标签数据集训练得到初始标签分类模型;根据所述高斯图确定所述有标签数据集和所述无标签数据集之间的标签传播算法;基于所述标签传播算法,将所述无标签数据集中能够转换的无标签数据转换为有标签数据;将转换得到的有标签数据添加至所述有标签数据集中,得到新的有标签数据集;使用所述新的标签数据集重新训练所述初始标签分类模型,得到目标标签分类模型。2.根据权利要求1所述的方法,其特征在于,所述无标签数据集和所述有标签数据集中的数据均为二维数据,所述二维数据中的第一维度数据表示消费数据,第二维度数据表示所述消费数据的标签,所述无标签数据集中的第二维度数据为空值,所述基于所述无标签数据集和所述有标签数据集构建高斯图包括:基于所述无标签数据集和所述有标签数据集中的第一维度数据构建所述高斯图的顶点;根据所述无标签数据集和所述有标签数据集中每个第一维度数据之间的相似性构建所述高斯图的边。3.根据权利要求2所述的方法,其特征在于,根据所述高斯图确定所述有标签数据集和所述无标签数据集之间的标签传播算法包括:基于所述高斯图,获取关于所述高斯图中顶点和边的实值函数,所述实值函数包括无标签数据集的无标签实值函数和有标签数据集的有标签实值函数;基于所述高斯图获取拉普拉丝矩阵,所述拉普拉丝矩阵包括对角矩阵和权重矩阵;根据所述实值函数和所述拉普拉丝矩阵构建所述实值函数的能量函数;最小化所述能量函数,得到所述无标签实值函数和所述有标签实值函数之间的关系算法,所述关系算法为所述标签传播算法。4.根据权利要求3所述的方法,其特征在于,所述最小化所述能量函数,得到所述无标签实值函数和所述有标签实值函数之间的关系算法,包括:根据所述对角矩阵和所述权重矩阵生成所述高斯图的转移矩阵;最小化所述能量函数,得到初始关系算法,所述初始关系算法包含所述无标签实值函数、所述有标签实值函数、所述对角矩阵和所述权重矩阵;以所述转移矩阵替换所述初始关系算法中的对角矩阵和权重矩阵,得到所述关系算法,所述关系算法包含所述转移矩阵、所述无标签实值函数和所述有标签实值函数。5.根据权利要求3或4所述的方法,其特征在于,所述标签传播算法的输出为无标签实值函...

【专利技术属性】
技术研发人员:柴钊
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1