System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 推荐信息确定方法、装置、电子设备及非易失性存储介质制造方法及图纸_技高网

推荐信息确定方法、装置、电子设备及非易失性存储介质制造方法及图纸

技术编号:39971416 阅读:6 留言:0更新日期:2024-01-09 00:49
本申请公开了一种推荐信息确定方法、装置、电子设备及非易失性存储介质。其中,该方法包括:获取目标用户数据集;依据用户属性参数,确定每个目标用户数据的目标密度,以及目标用户数据集对应的平均密度;依据目标密度和平均密度,在目标用户数据所对应的数据点中确定预设数量个聚类中心,并依据聚类中心对目标用户数据进行聚类,得到预设数量个聚类簇;确定聚类簇中的目标用户数据的用户特征,并依据用户特征,确定聚类簇对应的推荐信息。本申请解决了由于相关技术在利用大数据对用户画像进行信息推荐时,采用手动选择用户数据聚类中心的方式,导致聚类效果差,造成用户推荐信息准确性差的技术问题。

【技术实现步骤摘要】

本申请涉及数据挖掘,具体而言,涉及一种推荐信息确定方法、装置、电子设备及非易失性存储介质


技术介绍

1、目前,通信市场已经达到饱和状态,持续依靠增加用户量来增加效益的发展模式已不再适用,如何利用数据挖掘技术基于大数据从多方面对用户进行画像,来增加用户粘合度变得至关重要。

2、然而,相关技术在利用大数据对用户画像进行信息推荐时,往往采用手动选择用户数据聚类中心的方式,导致聚类效果差,造成用户推荐信息准确性差的技术问题。

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种推荐信息确定方法、装置、电子设备及非易失性存储介质,以至少解决由于相关技术在利用大数据对用户画像进行信息推荐时,采用手动选择用户数据聚类中心的方式,导致聚类效果差,造成用户推荐信息准确性差的技术问题。

2、根据本申请实施例的一个方面,提供了一种推荐信息确定方法,包括:获取目标用户数据集,其中,目标用户数据集中包含多个目标用户数据,每个目标用户数据均包括多个用户属性参数;依据用户属性参数,确定每个目标用户数据的目标密度,以及目标用户数据集对应的平均密度,其中,目标密度用于表征在目标用户数据集中一个目标用户数据所对应的数据点周围其余的目标用户数据所对应的数据点的分布紧密程度;依据目标密度和平均密度,在目标用户数据所对应的数据点中确定预设数量个聚类中心,并依据聚类中心对目标用户数据进行聚类,得到预设数量个聚类簇;确定聚类簇中的目标用户数据的用户特征,并依据用户特征,确定聚类簇对应的推荐信息。

3、可选地,依据用户属性参数,确定每个目标用户数据的目标密度,以及目标用户数据集对应的平均密度包括:依据用户属性参数,确定目标用户数据集中目标用户数据所对应的数据点任意两两之间的目标距离,并依据目标距离,确定目标用户数据集对应的平均距离;依据目标距离和平均距离,确定目标用户数据的目标密度;计算目标用户数据集中目标用户数据的目标密度的平均值,得到目标用户数据集对应的平均密度。

4、可选地,依据目标距离和平均距离,确定目标用户数据的目标密度包括:将目标用户数据集中,与第一用户数据所对应的数据点的目标距离不大于平均距离的其余的目标用户数据,添加至第一用户数据对应第一数据集中,其中,第一用户数据为目标用户数据集中任一目标用户数据;统计第一数据集中目标用户数据的数量,得到第一数量;依据第一用户数据与第一数据集中各个目标用户数据之间的目标距离、以及第一数量进行计算,得到第一用户数据的目标密度。

5、可选地,依据目标密度和平均密度,在目标用户数据所对应的数据点中确定预设数量个聚类中心包括:将目标用户数据集中目标密度不小于平均密度的目标用户数据,添加至第二数据集中;将第二数据集中目标密度最大的目标用户数据所对应的数据点,确定为聚类中心,并将聚类中心添加至中心点集合中;依据第二数据集中各个目标用户数据所对应的数据点到中心点集合的第一距离,在第二数据集的目标用户数据所对应的数据点中确定新的聚类中心,并添加至中心点集合中,直至中心点集合中的聚类中心的个数等于预设数量。

6、可选地,在第二数据集的目标用户数据所对应的数据点中确定新的聚类中心包括:确定第二数据集中目标用户数据对应的第一距离,其中,第一距离为第二数据集中目标用户数据所对应的数据点到中心点集合中各个聚类中心的目标距离中最小的目标距离;将第二数据集中第一距离最大的目标用户数据所对应的数据点,确定为新的聚类中心,并将聚类中心添加至中心点集合中。

7、可选地,依据用户特征,确定聚类簇对应的推荐信息包括:在聚类簇中随机选择预设比例的目标用户数据进行特征提取,得到用户特征,其中,用户特征至少用于表征所述聚类簇所对应的用户群体的数据流量使用程度、语音通话使用程度、无线网流量使用程度中至少之一,使用程度用于表征流量/通话的使用数据量大小/时长;确定与用户特征所对应的推荐信息,并将推荐信息发送至目标用户数据所对应的移动终端设备。

8、可选地,获取目标用户数据集包括:获取原始用户数据集,其中,原始用户数据集中至少包括以下至少之一:用户账号信息、通信记录;获取原始用户数据集中原始用户数据的目标属性,其中,目标属性包括以下至少之一:月均主叫通话时长、月均通话人数、月均异网通话人数、月均数据流量、月均无线网流量、月均发送点对点短信/彩信量;采用对应的缺省值对获取到的原始用户数据的目标属性中的异常值和/或缺失值进行修正,得到目标用户数据集。

9、根据本申请实施例的另一个方面,还提供了一种推荐信息确定装置,包括:用户数据获取模块,用于获取目标用户数据集,其中,目标用户数据集中包含多个目标用户数据,每个目标用户数据均包括多个用户属性参数;目标密度确定模块,用于依据用户属性参数,确定每个目标用户数据的目标密度,以及目标用户数据集对应的平均密度,其中,目标密度用于表征在目标用户数据集中一个目标用户数据所对应的数据点周围其余的目标用户数据所对应的数据点的分布紧密程度;聚类中心确定模块,用于依据目标密度和平均密度,在目标用户数据所对应的数据点中确定预设数量个聚类中心,并依据聚类中心对目标用户数据进行聚类,得到预设数量个聚类簇;推荐信息确定模块,用于确定聚类簇中的目标用户数据的用户特征,并依据用户特征,确定聚类簇对应的推荐信息。

10、根据本申请实施例的又一方面,还提供了一种电子设备,包括:存储器和处理器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行推荐信息确定方法。

11、根据本申请实施例的再一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的计算机程序,其中,非易失性存储介质所在设备通过运行计算机程序执行推荐信息确定方法。

12、在本申请实施例中,采用获取目标用户数据集,其中,目标用户数据集中包含多个目标用户数据,每个目标用户数据均包括多个用户属性参数;依据用户属性参数,确定每个目标用户数据的目标密度,以及目标用户数据集对应的平均密度,其中,目标密度用于表征在目标用户数据集中一个目标用户数据所对应的数据点周围其余的目标用户数据所对应的数据点的分布紧密程度;依据目标密度和平均密度,在目标用户数据所对应的数据点中确定预设数量个聚类中心,并依据聚类中心对目标用户数据进行聚类,得到预设数量个聚类簇;确定聚类簇中的目标用户数据的用户特征,并依据用户特征,确定聚类簇对应的推荐信息的方式,通过基于数据集中数据点间的距性和密性来选取传统k-means算法的聚类中心,达到了避免传统k-means算法由于人为选择聚类中心不当而导致聚类效果大受影响的目的,进而解决了由于相关技术在利用大数据对用户画像进行信息推荐时,采用手动选择用户数据聚类中心的方式,导致聚类效果差,造成用户推荐信息准确性差技术问题。

本文档来自技高网...

【技术保护点】

1.一种推荐信息确定方法,其特征在于,包括:

2.根据权利要求1所述的推荐信息确定方法,其特征在于,依据所述用户属性参数,确定每个所述目标用户数据的目标密度,以及所述目标用户数据集对应的平均密度包括:

3.根据权利要求2所述的推荐信息确定方法,其特征在于,依据所述目标距离和所述平均距离,确定所述目标用户数据的目标密度包括:

4.根据权利要求1所述的推荐信息确定方法,其特征在于,依据所述目标密度和所述平均密度,在所述目标用户数据所对应的数据点中确定预设数量个聚类中心包括:

5.根据权利要求4所述的推荐信息确定方法,其特征在于,在所述第二数据集的所述目标用户数据所对应的数据点中确定新的聚类中心包括:

6.根据权利要求1所述的推荐信息确定方法,其特征在于,依据所述用户特征,确定所述聚类簇对应的推荐信息包括:

7.根据权利要求1所述的推荐信息确定方法,其特征在于,获取目标用户数据集包括:

8.一种推荐信息确定装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:存储器和处理器,所述处理器用于运行存储在所述存储器中的程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的推荐信息确定方法。

10.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的计算机程序,其中,所述非易失性存储介质所在设备通过运行所述计算机程序执行权利要求1至7中任意一项所述推荐信息确定方法。

...

【技术特征摘要】

1.一种推荐信息确定方法,其特征在于,包括:

2.根据权利要求1所述的推荐信息确定方法,其特征在于,依据所述用户属性参数,确定每个所述目标用户数据的目标密度,以及所述目标用户数据集对应的平均密度包括:

3.根据权利要求2所述的推荐信息确定方法,其特征在于,依据所述目标距离和所述平均距离,确定所述目标用户数据的目标密度包括:

4.根据权利要求1所述的推荐信息确定方法,其特征在于,依据所述目标密度和所述平均密度,在所述目标用户数据所对应的数据点中确定预设数量个聚类中心包括:

5.根据权利要求4所述的推荐信息确定方法,其特征在于,在所述第二数据集的所述目标用户数据所对应的数据点中确定新的聚类中心包括:<...

【专利技术属性】
技术研发人员:杨君李国乐徐喆
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1