模型的确定方法技术

技术编号:39677721 阅读:10 留言:0更新日期:2023-12-11 18:55
本申请公开了一种模型的确定方法

【技术实现步骤摘要】
模型的确定方法、装置、设备及计算机存储介质


[0001]本申请涉及大数据
,尤其涉及一种模型的确定方法

装置

设备及计算机存储介质


技术介绍

[0002]在对业务产品进行优化时,对用户体验反馈信息进行聚类分析是十分必要的

[0003]现有技术中,通常在收集用户体验反馈信息之后,通过人工筛选进行用户体验反馈信息聚类,或者是设计者根据以往经验设定固定的预判结果,并根据设定的预判结果对用户体验反馈信息进行聚类

但是,基于人工筛选或设定固定预判结果的聚类方式或聚类模型较为单一,进而导致聚类的效率较低,得到的聚类结果也并不准确,而且适用的业务场景存在局限性


技术实现思路

[0004]本申请实施例提供一种模型的确定方法

装置

设备及计算机存储介质,通过聚类模型的目标函数值,选择不同的聚类模型组成最终的目标聚类模型,避免聚类模型单一,不仅提高了聚类的效率,提高了聚类结果的准确性,而且摆脱了业务场景的限制,适用于大部分业务场景,具备通用性

[0005]第一方面,本申请实施例提供一种模型的确定方法,包括:
[0006]获取第一预设数量的第一样本集和预设聚类模型,第一样本集包括第二预设数量和预设维度的向量化数据;
[0007]利用预设聚类模型对第一样本集进行聚类,得到聚类结果,并计算预设聚类模型的第一目标函数值,第一目标函数值表征聚类结果的聚集程度;
[0008]将第一目标函数值最小的第一聚类模型增加到聚类模型集合,从预设聚类模型中选取第二聚类模型,将第二聚类模型增加到聚类模型集合;
[0009]在聚类模型集合中聚类模型的数量小于第三预设数量的情况下,从预设聚类模型中选取第三聚类模型,将第三聚类模型增加到聚类模型集合,直至聚类模型集合中聚类模型的数量不小于第三预设数量,确定聚类模型集合中全部聚类模型为目标聚类模型;
[0010]其中,第一聚类模型和第二聚类模型的第二目标函数值小于第一聚类模型的第一目标函数值,第一聚类模型

第二聚类模型和第三聚类模型的第三目标函数值小于第二目标函数值

[0011]在一个可能实现的实施例中,还包括:
[0012]根据目标聚类模型中每个聚类模型的聚类结果,生成第三预设数量的邻接矩阵;
[0013]计算第三预设数量的邻接矩阵的加权平均值;
[0014]根据加权平均值,确定第一预设数量的第一样本集中每个样本的类别

[0015]在一个可能实现的实施例中,在获取第一预设数量的第一样本集和预设聚类模型之前,方法还包括:
[0016]获取多个维度的文本数据;
[0017]将文本数据转化成向量化数据,得到第二样本集;
[0018]从第二样本集中随机选取第二预设数量和预设维度的向量化数据,得到第一预设数量的第一样本集

[0019]在一个可能实现的实施例中,预设聚类模型包括第一子聚类模型,方法还包括:
[0020]在第一样本集不包括标记信息的情况下,利用第一子聚类模型对第一样本集进行聚类,得到第一聚类结果,并利用第一目标函数,计算第一预设聚类模型的第四目标函数值;其中,标记信息包括第一样本集中第一样本和第二样本为同一类别的信息;
[0021]将第四目标函数值最小的第四聚类模型增加到第一聚类模型集合,从第一子聚类模型中选取第五聚类模型,将第五聚类模型增加到第一聚类模型集合;
[0022]在第一聚类模型集合中聚类模型的数量小于第三预设数量的情况下,从第一子聚类模型中选取第六聚类模型,将第六聚类模型增加到第一聚类模型聚合,直至第一聚类模型集合中聚类模型的数量不小于第三预设数量,确定第一聚类模型集合中全部聚类模型为第一目标聚类模型;
[0023]其中,第四聚类模型和第五聚类模型的第五目标函数值小于第四聚类模型的第四目标函数值,第四聚类模型

第五聚类模型和第六聚类模型的第六目标函数值小于第五目标函数值

[0024]在一个可能实现的实施例中,预设聚类模型包括第二子聚类模型,方法还包括:
[0025]在第一样本集包括标记信息的情况下,利用二子聚类模型对第一样本集进行聚类,得到第二聚类结果,并利用第二目标函数,计算第二预设聚类模型的第七目标函数值;其中,标记信息包括第一样本集中第一样本和第二样本为同一类别的信息;
[0026]将第七目标函数值最小的第七聚类模型增加到第二聚类模型集合,从第二子聚类模型中选取第八聚类模型,将第八聚类模型增加到第二聚类模型集合;
[0027]在第二聚类模型集合中聚类模型的数量小于第三预设数量的情况下,从第二子聚类模型中选取第九聚类模型,将第九聚类模型增加到第二聚类模型集合,直至第二聚类模型集合中聚类模型的数量不小于第三预设数量,确定第二聚类模型集合中全部聚类模型为第二目标聚类模型;
[0028]其中,第七聚类模型和第八聚类模型的第八目标函数值小于第七聚类模型的第七目标函数值,第七聚类模型

第八聚类模型和第九聚类模型的第九目标函数值小于第八目标函数值

[0029]在一个可能实现的实施例中,第一目标函数满足以下条件:
[0030][0031]其中,表示类别为
h
的聚类中心点,
d(p
i
,
μ
h
)
表示样本
p
i
和聚类中心点的欧氏距离,
h
表示通过每个预设聚类模型得出的类别,
θ
为指示函数,
θ
(y
i

h)
用于判断样本
p
i
的类别
y
i
是否为
h
,若不是,则为0,
P
为第一样本集,
k
表示样本类别的数量

[0032]在一个可能实现的实施例中,第二目标函数满足以下条件:
[0033][0034]其中,表示类别为
h
的聚类中心点,
d(p
i

μ
h
)
表示样本
p
i
和聚类中心点的欧氏距离,
h
表示通过每个预设聚类模型得出的类别,
θ
为指示函数,
θ
(y
i

h)
用于判断样本
p
i
的类别
y
i
是否为
h
,若不是,则为0,
P
为第一样本集,表征实际样本
p
i
的类别
y
i
和样本
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种模型的确定方法,其特征在于,包括:获取第一预设数量的第一样本集和预设聚类模型,所述第一样本集包括第二预设数量和预设维度的向量化数据;利用所述预设聚类模型对所述第一样本集进行聚类,得到聚类结果,并计算所述预设聚类模型的第一目标函数值,所述第一目标函数值表征所述聚类结果的聚集程度;将所述第一目标函数值最小的第一聚类模型增加到聚类模型集合,从所述预设聚类模型中选取第二聚类模型,将所述第二聚类模型增加到所述聚类模型集合;在所述聚类模型集合中聚类模型的数量小于第三预设数量的情况下,从所述预设聚类模型中选取第三聚类模型,将所述第三聚类模型增加到所述聚类模型集合,直至所述聚类模型集合中聚类模型的数量不小于所述第三预设数量,确定所述聚类模型集合中全部聚类模型为目标聚类模型;其中,所述第一聚类模型和所述第二聚类模型的第二目标函数值小于所述第一聚类模型的第一目标函数值,所述第一聚类模型

所述第二聚类模型和所述第三聚类模型的第三目标函数值小于所述第二目标函数值
。2.
根据权利要求1所述的模型的确定方法,其特征在于,还包括:根据所述目标聚类模型中每个聚类模型的聚类结果,生成所述第三预设数量的邻接矩阵;计算所述第三预设数量的邻接矩阵的加权平均值;根据所述加权平均值,确定所述第一预设数量的第一样本集中每个样本的类别
。3.
根据权利要求1所述的模型的确定方法,其特征在于,在获取第一预设数量的第一样本集和预设聚类模型之前,所述方法还包括:获取多个维度的文本数据;将所述文本数据转化成向量化数据,得到第二样本集;从所述第二样本集中随机选取第二预设数量和预设维度的向量化数据,得到所述第一预设数量的第一样本集
。4.
根据权利要求1或3所述的模型的确定方法,其特征在于,所述预设聚类模型包括第一子聚类模型,所述方法还包括:在所述第一样本集不包括标记信息的情况下,利用所述第一子聚类模型对所述第一样本集进行聚类,得到第一聚类结果,并利用第一目标函数,计算所述第一预设聚类模型的第四目标函数值;其中,所述标记信息包括所述第一样本集中第一样本和第二样本为同一类别的信息;将所述第四目标函数值最小的第四聚类模型增加到第一聚类模型集合,从所述第一子聚类模型中选取第五聚类模型,将所述第五聚类模型增加到所述第一聚类模型集合;在所述第一聚类模型集合中聚类模型的数量小于所述第三预设数量的情况下,从所述第一子聚类模型中选取第六聚类模型,将所述第六聚类模型增加到所述第一聚类模型聚合,直至所述第一聚类模型集合中聚类模型的数量不小于所述第三预设数量,确定所述第一聚类模型集合中全部聚类模型为第一目标聚类模型;其中,所述第四聚类模型和所述第五聚类模型的第五目标函数值小于所述第四聚类模型的第四目标函数值,所述第四聚类模型

所述第五聚类模型和所述第六聚类模型的第六
目标函数值小于所述第五目标函数值
。5.
根据权利要求1或3所述的模型的确定方法,其特征在于,所述预设聚类模型包括第二子聚类模型,所述方法还包括:在所述第一样本集包括标记信息的情况下,利用所述二子聚类模型对所述第一样本集进行聚类,得到第二聚类结果,并利用第二目标函数,计算所述第二预设聚类模型的第七目标函数值;其中,所述标记信息包括所述第一样本集中第一样本和第二样本为同一类别的信息;将所述第七目标函数值最小的第七聚类模型增加到第二聚类模型集合,从所述第二子聚类模型中选取第八聚类模型,将所述第八聚类模型增加到所述第二聚类模型集合;在所述第二聚类模型集合中聚类模型的数量小于第三预设数量的情况下,从所述第二子聚类模型中选取第九聚类模型,将所述第九聚类模型增加到所述第二聚类模型集合,直至所述第二聚类模型集合中聚类模型的数量不小于所述第三预设数量,确定所述第二聚类模型集合中全部聚类模型为第二目标聚类模型;其中,所述第七聚类模型和所述第八聚类模型的第八目标函数值小于所述第七聚类模型的第七目标函数值,所述第七聚类模型

所述第八聚类模型和所述第九聚类模型的第九目标函数值小于所述第八目标函数值
。6.
根据权利要求4所述的模型的确定方法,其特征在于,所述第一目标函数满足以下条件:其中,表示类别为
h
的聚类中心点,
d(p
i
,
μ
h
)
表示样本
p
i
和聚类中心点的欧氏距离,
h
表示通过每个预设聚类模型得出的类别,
θ
为指示函数,
θ
(y

【专利技术属性】
技术研发人员:林利盈
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1