【技术实现步骤摘要】
一种基于服务记录的混合型推荐算法系统
[0001]本专利技术涉及互联网计算
,特别是涉及一种基于服务记录的混合型推荐算法系统,该系统加权组合协同过滤推荐、基于内容的推荐和基于关联规则的推荐三种不同的算法框架,给用户推荐最优服务的同时,生成其他优质服务选项供用户选择。
技术介绍
[0002]随着互联网+的发展和SQL数据库管理的广泛应用,运营商在提供互联网服务的同时,也积累了大量的数据。面对这些潜在的价值,如何在保证用户隐私的前提下处理利用好这些数据信息在互联网竞争激烈的当下显得尤为重要。服务记录是用户基本信息、服务信息及建议信息的集合,怎么利用好这些数据为人们服务,创造出新的价值是值得考虑的问题。
[0003]推荐系统是一种对信息进行过滤的系统,用来分析预测用户对某项目(item)的“评分”或“偏好”。推荐系统中的推荐算法主要包括协同过滤推荐、基于内容推荐及基于相互关联性规则的推荐等。协同过滤推荐算法(Collaborative Filtering Recommendations,简称CF),其主要的功能是进行预测和推荐。CF技术通过对用户以往历史行为数据进行的分析,挖掘计算出用户的偏好,并通过得出的偏好进行用户的划分,进而给使用的用户推荐与其偏好相似的物品。协同过滤分为基于用户(user
‑
based)的协同过滤和基于项目(item
‑
based)的协同过滤两种,通俗来讲即为:人以类聚,物以群分。CF技术能够对机器难以进行自动内容分析的信息进行过滤,能够通过共享其他 ...
【技术保护点】
【技术特征摘要】
1.一种基于服务记录的混合型推荐算法系统,其特征在于包括以下步骤:1)服务记录数据预处理:该部分数据直接从数据库读取,包含用户的信息、服务的详细记录、建议和历史推荐服务等,并将其中的语音数据转为文字,图片信息通过Yolo算法进行识别储存,然后依次进行数据的减噪和归一化,得到标准、干净、连续的记录数据;2)基于服务记录的协同过滤推荐:主要工作是基于相似度计算,基于记录中相似度,找到评分最高的若干个物品推荐给用户;3)基于服务记录内容的推荐:根据用户之前有过的item,为用户推荐相似的item;4)基于服务记录内关联规则的推荐:主要工作是找到最大频繁项,然后在频繁项集中通过可信度的筛选获得其关联规则;5)基于服务记录的加权混合模型推荐:将上述2)、3)和4)三种算法的推荐结果进行组合,扬长避短,结合多个推荐系统算法的推荐结果,通过加权方式来获得每个推荐候选服务的加权得分,最终进行排序,获得推荐列表。2.根据权利要求1所述的一种基于服务记录的混合型推荐算法系统,其特征在于:所述步骤1)服务记录数据预处理步骤如下:11)去除唯一属性:是指服务记录数据信息中的一些id属性,这些属性并不能反映用户的特征信息,所以直接删除即可;12)处理缺失值:将数据信息中的缺失值进行补全,采用均值插补法,当一条信息属性的距离作为一种可以度量的值时,使用该信息属性的有效值的平均值来处理和插补缺失的值;当信息属性的距离是一种不可度量的值,使用这个属性的有效值的众数来替代插补缺失的值;13)数据标准化、正则化:数据的标准化采用z
‑
score标准化,这种模型主要适用于一些属性的最大值和最小值未知的情况,或有超出范围的分类离群数据,其基于一些原始数据的平均值和标准差。3.根据权利要求1所述的一种基于服务记录的混合型推荐算法系统,其特征在于:所述步骤2)基于服务记录的协同过滤推荐步骤如下:21)用户和服务的相似度计算;在二维偏好矩阵中,通过计算用户之间的相似度,将某个用户对所有服务的偏好作为一个向量,或者通过计算服务项目之间的相似度,将所有用户对某个服务的偏好作为一个向量;计算用户之间的相似度使用了Tanimoto系数进行计算结果相似度:其中,T表示用户/服务的相似度;x和y表示不同的用户或服务信息;22)相似邻居计算:以当前所取的点为中心,距离为K的区域中的所有点作为当前点的邻居,计算得到相邻用户和相邻服务,即通过对相似度的邻居计算来限制邻居的远近;23)计算推荐:基于相邻用户和相邻服务信息为用户进行推荐。4.根据权利要求3所述的一种基于服务记录的混合型推荐算法系统,其特征在于:所述步骤23)计算推荐基于相邻用户和相邻服务信息为用户进行推荐,其推荐步骤如下:231)基于用户的协同过滤推荐:以每个用户对所有服务项目的偏好为向量,计算各个
用户之间的相似度;232)基于item的协同过滤推荐:将所有用户对某个item服务的偏好作为一个向量,计算item之间的相似度,从而得到它的相似服务后,然后根据用户历史的偏好预测当前用户还没有表示偏好的服务,计算得到一个排序的服务列表作为推荐。5.根据权利要求1所述的一种基于服务记录的混合型推荐算法系统,其特征在于:所述步骤3)基于服务记录内容的推荐步骤如下:31)物品/项目表示:采用基于图排序的关键词提取算法TextRank,先将一些给定的文本T进行分割,然后进行分词和词性的标注处理,接着构建关键词图,随后就可以根据TextRank公式,对各节点的权重进行迭代,迭代公式如下:其中,d表示阻尼系数,用于平滑,通常取值为0.60
‑
0.85;V
i
表示某个网页,V
j
表示链接到V
i
的网页;In(V
i
)表示网页V
i
的所有入链的集合;最后对节点权重进行排序,得到文本关键词,进而抽取代表属性;32)用户偏好学习:对于内容推荐,使用Rocchio算法来获取用户...
【专利技术属性】
技术研发人员:顾守华,王飞,
申请(专利权)人:寿带鸟信息科技苏州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。