一种模型训练方法、业务分配方法、装置及设备制造方法及图纸

技术编号:29930434 阅读:18 留言:0更新日期:2021-09-04 18:57
本说明书实施例提供一种模型训练方法、业务分配方法、装置及设备,可应用于人工智能技术领域。所述方法包括:获取用户样本数据;所述用户样本数据包括有标签数据和无标签数据;将所述用户样本数据划分为分别对应于至少两种业务处理视角的单视角数据;针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果;根据所述数据聚类结构构造关联约束系数;基于所述用户样本数据确定平滑约束系数;综合所述数据聚类结果训练得到用户分类模型;所述用户分类模型用于根据用户数据确定用户类别。上述方法保证了半监督学习过程中对数据的有效利用,提高了用户分类的准确性,有利于后续过程中分配用户相应的业务。于后续过程中分配用户相应的业务。于后续过程中分配用户相应的业务。

【技术实现步骤摘要】
一种模型训练方法、业务分配方法、装置及设备


[0001]本说明书实施例涉及人工智能
,特别涉及一种模型训练方法、业务分配方法、装置及设备。

技术介绍

[0002]随着社会的发展和进步,对于业务类型的细分程度也在不断提高。这些业务可以是为用户提供相应服务的业务,也可以是需要用户及时进行处理的业务,相应的,不同类型的用户所需要获取的业务也都不尽相同。因此,预先根据用户的相关信息,判断用户可能会获取的业务,从而预先准备好相应业务对应的数据和资源,能够有效提高后续过程中的业务处理效率,改善用户的体验。
[0003]由于在模型训练过程中,为了兼顾标注样本数据的工作量和模型训练的准确性,会采样半监督学习的方式对模型进行训练,即利用一部分有标签数据和一部分无标签数据进行训练。但是,在实际应用中,样本数据可能本身对应有较多的类别,在同时利用多种类别的数据对模型进行训练时可能会影响模型训练的准确性。而只针对一部分数据进行标注时,也可能会使得有标签数据和无标签数据所对应的数据类别存在有一定差异,在综合有标签数据和无标签数据进行训练时可能会因为数据类别的不同而影响最终的训练效果,降低利用模型对用户进行分类时的准确性,从而影响用户的使用体验。因此,目前亟需一种能够准确有效地基于半监督学习方式对模型进行训练的方法。

技术实现思路

[0004]本说明书实施例的目的是提供一种模型训练方法、业务分配方法、装置及设备,以解决如何提高用户分类的准确性以提高用户处理业务的体验的问题。
[0005]为解决上述技术问题,本说明书实施例提供一种基于用户分类的模型训练方法,包括:获取用户样本数据;所述用户样本数据包括有标签数据和无标签数据;所述有标签数据对应有用户类别;将所述用户样本数据划分为分别对应于至少两种业务处理视角的单视角数据;所述业务处理视角用于指示数据的不同类别;针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果;根据所述数据聚类结果构造关联约束系数;所述关联约束系数用于调节各个业务处理视角下的单视角数据的训练结果的相似性;基于所述用户样本数据确定平滑约束系数;所述平滑约束系数用于调节有标签数据和无标签数据的训练结果的相似性;综合所述关联约束系数和平滑约束系数训练得到用户分类模型;所述用户分类模型用于根据用户数据确定用户类别。
[0006]本说明书实施例还提出一种基于用户分类的模型训练装置,包括:用户样本数据获取模块,用于获取用户样本数据;所述用户样本数据包括有标签数据和无标签数据;所述有标签数据对应有用户类别;单视角数据划分模块,用于将所述用户样本数据划分为分别对应于至少两种业务处理视角的单视角数据;所述业务处理视角用于指示数据的不同类别;聚类模块,用于针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚
类结果;关联约束系数构造模块,用于根据所述数据聚类结果构造关联约束系数;所述关联约束系数用于调节各个业务处理视角下的单视角数据的训练结果的相似性;平滑约束系数确定模块,用于基于所述用户样本数据确定平滑约束系数;所述平滑约束系数用于调节有标签数据和无标签数据的训练结果的相似性;训练模块,用于综合所述数据聚类结果训练得到用户分类模型;所述用户分类模型用于根据用户数据确定用户类别。
[0007]本说明书实施例还提出一种基于用户分类的模型训练设备,包括存储器和处理器;所述存储器,用于存储计算机程序指令;所述处理器,用于执行所述计算机程序指令以实现以下步骤:获取用户样本数据;所述用户样本数据包括有标签数据和无标签数据;所述有标签数据对应有用户类别;将所述用户样本数据划分为分别对应于至少两种业务处理视角的单视角数据;所述业务处理视角用于指示数据的不同类别;针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果;根据所述数据聚类结构构造关联约束系数;所述关联约束系数用于调节各个业务处理视角下的单视角数据的训练结果的相似性;基于所述用户样本数据确定平滑约束系数;所述平滑约束系数用于调节有标签数据和无标签数据的训练结果的相似性;综合所述数据聚类结果训练得到用户分类模型;所述用户分类模型用于根据用户数据确定用户类别。
[0008]为了解决上述技术问题,本说明书实施例还提出一种基于用户分类的业务分配方法,包括:获取目标用户的用户特征信息;将所述用户特征信息输入用户分类模型,得到用户类别;所述用户分类模型,通过以下方式获得:获取用户样本数据;所述用户样本数据包括有标签数据和无标签数据;所述有标签数据对应有用户类别;将所述用户样本数据划分为分别对应于至少两种业务处理视角的单视角数据;所述业务处理视角用于指示数据的不同类别;针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果;根据所述数据聚类结果构造关联约束系数;所述关联约束系数用于调节各个业务处理视角下的单视角数据的训练结果的相似性;基于所述用户样本数据确定平滑约束系数;所述平滑约束系数用于调节有标签数据和无标签数据的训练结果的相似性;综合所述关联约束系数和平滑约束系数训练得到用户分类模型;将对应于所述用户类别的业务分配至所述目标用户。
[0009]本说明书实施例还提出一种基于用户分类的业务分配装置,包括:特征信息获取模块,用于获取目标用户的用户特征信息;用户类别获取模块,用于将所述用户特征信息输入用户分类模型,得到用户类别;所述用户分类模型,通过以下方式获得:获取用户样本数据;所述用户样本数据包括有标签数据和无标签数据;所述有标签数据对应有用户类别;将所述用户样本数据划分为分别对应于至少两种业务处理视角的单视角数据;所述业务处理视角用于指示数据的不同类别;针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果;根据所述数据聚类结果构造关联约束系数;所述关联约束系数用于调节各个业务处理视角下的单视角数据的训练结果的相似性;基于所述用户样本数据确定平滑约束系数;所述平滑约束系数用于调节有标签数据和无标签数据的训练结果的相似性;综合所述关联约束系数和平滑约束系数训练得到用户分类模型;业务分配模块,用于将对应于所述用户类别的业务分配至所述目标用户。
[0010]本说明书实施例还提出一种基于用户分类的业务分配设备,包括存储器和处理器;所述存储器,用于存储计算机程序指令;所述处理器,用于执行所述计算机程序指令以
实现以下步骤:获取目标用户的用户特征信息;将所述用户特征信息输入用户分类模型,得到用户类别;所述用户分类模型,通过以下方式获得:获取用户样本数据;所述用户样本数据包括有标签数据和无标签数据;所述有标签数据对应有用户类别;将所述用户样本数据划分为分别对应于至少两种业务处理视角的单视角数据;所述业务处理视角用于指示数据的不同类别;针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果;根据所述数据聚类结果构造关联约束系数;所述关联约束系数用于调节各个业务处理视角下的单视角数据的训练结果的相似性;基于所述用户样本数据确定平滑约束系数;所述平滑约束系数用于调节有标签数据和无标签数据的训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户分类的模型训练方法,其特征在于,包括:获取用户样本数据;所述用户样本数据包括有标签数据和无标签数据;所述有标签数据对应有用户类别;将所述用户样本数据划分为分别对应于至少两种业务处理视角的单视角数据;所述业务处理视角用于指示数据的不同类别;针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果;根据所述数据聚类结果构造关联约束系数;所述关联约束系数用于调节各个业务处理视角下的单视角数据的训练结果的相似性;基于所述用户样本数据确定平滑约束系数;所述平滑约束系数用于调节有标签数据和无标签数据的训练结果的相似性;综合所述关联约束系数和平滑约束系数训练得到用户分类模型;所述用户分类模型用于根据用户数据确定用户类别。2.如权利要求1所述的方法,其特征在于,所述获取用户样本数据,包括:从用户样本数据对应的样本用户中选取标注用户;获取所述标注用户的历史业务记录;根据所述历史业务记录为所述标注用户设置用户类别;所述用户类别对应于所述标注用户的用户样本数据。3.如权利要求1所述的方法,其特征在于,所述业务处理视角,包括基本信息视角、资产信息视角、持有信息视角和行为信息视角中的至少一种。4.如权利要求1所述的方法,其特征在于,所述业务处理视角分别对应有至少两种数据特征;所述数据特征用于表述数据的不同类别;所述将所述用户数据划分为分别对应于至少两种业务处理视角的单视角数据之后,还包括:确定所述单视角数据下对应于不同数据特征的特征数据;相应的,所述针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果,包括:结合所述特征数据对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果。5.如权利要求1所述的方法,其特征在于,所述针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果,包括:获取各个业务处理视角下单视角数据之间的相似关系;基于所述相似关系构建加权关联矩阵;所述加权关联矩阵,用于表示各个业务处理视角下数据的聚类结果。6.如权利要求5所述的方法,其特征在于,所述获取各个业务处理视角下单视角数据之间的相似关系,包括:利用公式计算相似关系,式中,s(i,j)表示单视角数据x
i
与单视角数据x
j
之间的相似关系,V表示业务处理视角的个数,K
v
表示第v个业务处理视角下聚簇的个数,I(x
i
,x
j
)
(v,k)
为单视角数据x
i
与单视角数据x
j
第v个业务处理视角
下第k个聚簇中的相关性函数,其中,下第k个聚簇中的相关性函数,其中,是第v个视角的第k个聚簇,为单视角数据x
i
与单视角数据x
j
第v个业务处理视角下第k个聚簇中的簇内密度系数,其中,密度系数,其中,为聚簇中单视角数据的个数,为单视角数据x
i
和x
j
在聚簇中的距离,为聚簇中单视角数据的均值,7.如权利要求1所述的方法,其特征在于,所述根据所述数据聚类结果构造关联约束系数,包括:利用公式计算关联约束系数,式中,R
sim
为关联约束系数,|L|为有标签数据的个数,|U|为无标签数据的个数,f(x)为预先设置的用户分类模型,s(i,j)为单视角数据x
i
与x
j
的关联关系。8.如权利要求1所述的方法,其特征在于,所述基于所述用户数据确定平滑约束系数,包括:利用公式计算平滑约束系数,式中,R
smo
为平滑约束系数,|L|为有标签数据的个数,|U|为无标签数据的个数,f(x)为预先设置的用户分类模型,s(i,j)为单视角数据x
i
与x
j
的关联关系。9.如权利要求1所述的方法,其特征在于,所述将所述用户数据划分为分别对应于至少两种业务处理视角的单视角数据之前,还包括:对所述用户样本数据进行预处理;所述预处理包括:基于预设特征字段对所述用户样本数据进行补全。10.如权利要求1所述的方法,其特征在于,所述综合所述关联约束系数和平滑约束系数训练得到用户分类模型,包括:基于所述关联约束系数和平滑约束系数构造目标函数;根据所述目标函数对用户分类模型进行优化;所述用户分类模型用于确定不同业务处理视角下的用户数据所对应的用户类别。11.如权利要求10所述的方法,其特征在于,所述基于所述关联约束系数和平滑约束系数构造目标函数,包括:构造目标函数为L=R
emp

·
R
sim

·
R
smo
,式中,L为目标函数,R
emp
为经验损失,其中,
L|为有标签数据的个数,y
i
为有标签数据的用户类别,f(x
i
...

【专利技术属性】
技术研发人员:陈李龙王娜倪俊徐林嘉
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1