一种基于聚类和矩阵分解的事项推送方法和装置制造方法及图纸

技术编号:26342728 阅读:29 留言:0更新日期:2020-11-13 20:37
本申请提供了一种基于聚类和矩阵分解的事项推送方法和装置,其中,该方法包括:先构建用户标签矩阵,然后对用户进行聚类处理,得到多个用户群体簇,再针对每个用户群体簇生成用户对事项的评分矩阵,然后,通过ALS矩阵分解算法进行矩阵运算,从而进行事项推荐。因为是先对用户进行了标签聚类,再进行矩阵运算,因此可以有效减少矩阵运算的计算量,从而降低系统资源消耗。通过上述方案解决了现有的事项推送所存在的推送效率低下的技术问题,达到了对政务事项的高效精准推送的技术效果,提升了事项推送召回率。

An event push method and device based on clustering and matrix decomposition

【技术实现步骤摘要】
一种基于聚类和矩阵分解的事项推送方法和装置
本申请属于大数据处理
,尤其涉及一种基于聚类和矩阵分解的事项推送方法和装置。
技术介绍
目前,对于政务领域APP而言,在进行事项推荐的时候,一般都是基于热门事项进行推荐的,很少针对不同用户进行个性化推荐。有些政务APP,是使用协同过滤算法进行事项推荐的,然而,采用协同过滤算法在政务事项推荐上效果并不好,这主要是因为在政务领域会有个别办理量远远大于其他事项的事项,因为协同过滤算法的原理是找到与某事项相似的事项,进而向用户进行推荐。然而在这种情况下,几乎所有事项的相似事项都是最热门的几个事项,此时只使用协同过滤算法会导致大部分用户推荐事项相似,并不能达到个性化推荐的效果,实际推荐准确率并不高。考虑到可以将电商领域已有的机器学习算法用于政务领域的事项推荐中,然而,在实际应用中发现,政务领域场景事项很少,只有两百个左右,并且事项之间并没有很大的关联,不像电商场景中,物品的数量庞大,可能备选的商品数量达到几万甚至更多;并且商品之间的关联关系很大,只要对用户进行足够的消费刻画,就可以方便地为用户推荐本文档来自技高网...

【技术保护点】
1.一种基于聚类和矩阵分解的事项推送方法,其特征在于,所述方法包括:/n获取目标应用在预设时间段内的用户历史行为数据;/n根据所述用户历史行为数据、用户属性数据和事项标签体系,构建用户标签矩阵;/n根据所述用户标签矩阵和用户历史行为数据,对所述目标应用的用户进行聚类,得到多个类别中各个类别下的用户群体簇;/n从所述用户历史行为数据中获取每个类别下每个用户的历史行为信息,以确定出各个用户对事项的处理操作;/n根据每个用户群体簇中各个用户对事项的处理操作,构建各个用户群体簇中用户对事项的评分矩阵,其中,一个用户群体簇对应一个评分矩阵;/n通过ALS矩阵分解算法分别对每个群体簇的评分矩阵进行矩阵运算...

【技术特征摘要】
1.一种基于聚类和矩阵分解的事项推送方法,其特征在于,所述方法包括:
获取目标应用在预设时间段内的用户历史行为数据;
根据所述用户历史行为数据、用户属性数据和事项标签体系,构建用户标签矩阵;
根据所述用户标签矩阵和用户历史行为数据,对所述目标应用的用户进行聚类,得到多个类别中各个类别下的用户群体簇;
从所述用户历史行为数据中获取每个类别下每个用户的历史行为信息,以确定出各个用户对事项的处理操作;
根据每个用户群体簇中各个用户对事项的处理操作,构建各个用户群体簇中用户对事项的评分矩阵,其中,一个用户群体簇对应一个评分矩阵;
通过ALS矩阵分解算法分别对每个群体簇的评分矩阵进行矩阵运算,得到运算结果矩阵;
根据所述运算结果矩阵,向所述目标应用的用户推送事项。


2.根据权利要求1所述的方法,其特征在于,根据所述用户标签矩阵和用户历史行为数据,对所述目标应用的用户进行聚类,得到多个类别中各个类别下的用户群体簇,包括:
根据所述用户标签矩阵,计算聚类成不同数量类别下,数据的平均畸变程度;
将平均畸变程度作为纵坐标,将类别数量作为横坐标,绘制得到目标曲线;
通过肘部法则从所述目标曲线中确定聚类的类别数量;
根据确定的类别数量,通过KMeans算法将所述目标应用的用户划分为所述类别数量个用户群体簇。


3.根据权利要求2所述的方法,其特征在于,根据确定的类别数量,通过KMeans算法将所述目标应用的用户划分为所述类别数量个用户群体簇,包括:
从所述用户历史行为数据中选择所述类别数量个用户的样本数据作为初始聚类中心;
计算所述用户历史行为数据中各个用户的样本数据到每个初始聚类中心的距离,并将当前用户划分至距离最小的初始聚类中心所在的类中;
在划分完成之后,再针对每个类别计算聚类中心,并将计算得到的聚类中心作为优化的聚类中心,以优化的聚类中心作为初始聚类中心进行划分和聚类中心的计算,直至计算得到的聚类中心不变化。


4.根据权利要求1所述的方法,其特征在于,根据所述用户历史行为数据、用户属性数据和事项标签体系,构建用户标签矩阵,包括:
基于业务属性,为事项划分出不同类别,以建立事项标签体系;
获取用户历史行为数据和用户属性数据;
根据所述用户历史行为数据和用户属性数据,与所述事项标签体系进行对比,以确定各个用户所应携带的标签;
根据确定的各个用户所应携带的标签,构建所述用户标签矩阵。


5.根据权利要求1所述的方法,其特征在于,根据每个用户群体簇中各个用户对事项的处理操作,构建各个用户群体簇中用户对事项的评分矩阵,包括:
对当前用户群体簇中当前用户对各个事项的处理操作进行加权累加,得到当前用户对各个事项的评分加权值;
根据当前用户群体簇中各个用户对各个事项的评分加权值,得到当前用户群体簇的评分表;
根据当前用户群体簇的评分表,构建当前用户群体簇的用户对事项的评分矩阵。


6.根据权利要求1所述的方法,其特征在于,通过ALS矩阵分解算法分别对每个群体簇的评分矩阵进行矩阵运算,得到运算结果矩阵,包括:
通过最小化损失函数对评分矩阵中为0的值进行多次迭代运算,确定出满足预设模拟条件时矩阵中为0的值得预测值;
将得到的预测值,作为评分矩阵中评分为0的项的预测值。


7.根据权利要求6所述的方法,其特...

【专利技术属性】
技术研发人员:马晓楠权爱荣王雅楠
申请(专利权)人:中国工商银行股份有限公司工银科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1