一种基于服务记录的混合型推荐算法系统技术方案

技术编号:32652997 阅读:12 留言:0更新日期:2022-03-17 10:59
本发明专利技术公开了一种基于服务记录的混合型推荐算法系统,包括以下步骤:1)服务记录数据预处理;2)基于服务记录的协同过滤推荐;3)基于服务记录内容的推荐;4)基于服务记录内关联规则的推荐;5)基于服务记录的加权混合模型推荐。通过上述方式,本发明专利技术通过对服务记录包含的用户信息、服务信息及服务建议信息的分析研究,将协同过滤、基于内容和关联规则的推荐三种算法模型进行加权融合,弥补各自的不足,为用户推荐最优的服务,创造价值。创造价值。创造价值。

【技术实现步骤摘要】
一种基于服务记录的混合型推荐算法系统


[0001]本专利技术涉及互联网计算
,特别是涉及一种基于服务记录的混合型推荐算法系统,该系统加权组合协同过滤推荐、基于内容的推荐和基于关联规则的推荐三种不同的算法框架,给用户推荐最优服务的同时,生成其他优质服务选项供用户选择。

技术介绍

[0002]随着互联网+的发展和SQL数据库管理的广泛应用,运营商在提供互联网服务的同时,也积累了大量的数据。面对这些潜在的价值,如何在保证用户隐私的前提下处理利用好这些数据信息在互联网竞争激烈的当下显得尤为重要。服务记录是用户基本信息、服务信息及建议信息的集合,怎么利用好这些数据为人们服务,创造出新的价值是值得考虑的问题。
[0003]推荐系统是一种对信息进行过滤的系统,用来分析预测用户对某项目(item)的“评分”或“偏好”。推荐系统中的推荐算法主要包括协同过滤推荐、基于内容推荐及基于相互关联性规则的推荐等。协同过滤推荐算法(Collaborative Filtering Recommendations,简称CF),其主要的功能是进行预测和推荐。CF技术通过对用户以往历史行为数据进行的分析,挖掘计算出用户的偏好,并通过得出的偏好进行用户的划分,进而给使用的用户推荐与其偏好相似的物品。协同过滤分为基于用户(user

based)的协同过滤和基于项目(item

based)的协同过滤两种,通俗来讲即为:人以类聚,物以群分。CF技术能够对机器难以进行自动内容分析的信息进行过滤,能够通过共享其他人的经验,避免信息分析的不精确和不完全,但是其存在可扩展和稀疏性问题,如果是新添加的服务,只有当此服务被某些用户喜欢过(或推荐过),它才可能被推荐给其他用户,否则永远不会被推荐。
[0004]基于内容的推荐(Content

based Recommendation,简称CB)是信息处理和过滤技术的进一步发展和延续,它是基于项目的内容和信息,而不需要再依赖用户对某个项目的评价,更多是利用用机器学习的方法从描述内容特征的案例中获取用户的兴趣信息。在基于服务记录内容的推荐系统中,item可以通过分析各个相关服务特征的属性来进行定义,系统基于评估目标对象的特点,学习目标用户的兴趣,考察用户信息资料和待预测项目之间相匹配程度。CB技术没有冷启动和稀疏问题,有较好的可解释性,能够推荐新的刚添加的服务,但其要求服务记录内容要有良好的结构性,无法明确获得用户的判断情况。
[0005]基于关联规则的推荐(Association Rules

based Recommendation,简称RB)是根据历史记录数据统计出不同规则出现的关系,类似X事件发生后,关联事件Y也会有一定概率发生,是通过历史记录数据统计出来的这个概率,关联规则的主要作用是在一个较大数据集中寻找出项之间的关联。关联规则可给每一位用户提供良好的搭配和推荐,其中第一步的关联规则发现最为关键且耗时,是该算法的一大瓶颈,但可以通过离线方式完成。
[0006]由于各种推荐算法皆有各自不擅长领域,所以在实际中,组合推荐(Hybrid Recommendation)是一种很好的方式。本专利技术提出的基于用户服务记录的加权混合推荐算法也归类为组合推荐,其将协同过滤、基于内容和关联规则的三种推荐算法进行加权组合,
从而避免或弥补各自推荐技术的弱点,扬长避短。

技术实现思路

[0007]本专利技术的目的在于提供一种基于服务记录的混合型推荐算法系统,通过对服务记录包含的用户信息、服务信息及服务建议信息的分析研究,将协同过滤、基于内容和关联规则的推荐三种算法模型进行加权融合,弥补各自的不足,为用户推荐最优的服务,创造价值。
[0008]为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种基于服务记录的混合型推荐算法系统,包括以下步骤:
[0009]1)服务记录数据预处理:该部分数据直接从数据库读取,包含用户的信息、服务的详细记录、建议和历史推荐服务等,并将其中的语音数据转为文字,图片信息通过Yolo算法进行识别储存,然后依次进行数据的减噪和归一化,得到标准、干净、连续的记录数据;
[0010]2)基于服务记录的协同过滤推荐:主要工作是基于相似度计算,基于记录中相似度,找到评分最高的若干个物品推荐给用户;
[0011]3)基于服务记录内容的推荐:根据用户之前有过的item,为用户推荐相似的item;
[0012]4)基于服务记录内关联规则的推荐:主要工作是找到最大频繁项,然后在频繁项集中通过可信度的筛选获得其关联规则;
[0013]5)基于服务记录的加权混合模型推荐:将上述2)、3)和4)三种算法的推荐结果进行组合,扬长避短,结合多个推荐系统算法的推荐结果,通过加权方式来获得每个推荐候选服务的加权得分,最终进行排序,获得推荐列表。
[0014]进一步的是,所述步骤1)服务记录数据预处理步骤如下:
[0015]14)去除唯一属性:是指服务记录数据信息中的一些id属性,这些属性并不能反映用户的特征信息,所以直接删除即可;
[0016]15)处理缺失值:将数据信息中的缺失值进行补全,采用均值插补法,当一条信息属性的距离作为一种可以度量的值时,使用该信息属性的有效值的平均值来处理和插补缺失的值;当信息属性的距离是一种不可度量的值,使用这个属性的有效值的众数来替代插补缺失的值;
[0017]16)数据标准化、正则化:数据的标准化采用z

score标准化,这种模型主要适用于一些属性的最大值和最小值未知的情况,或有超出范围的分类离群数据,其基于一些原始数据的平均值和标准差。
[0018]进一步的是,所述步骤2)基于服务记录的协同过滤推荐步骤如下:
[0019]24)用户和服务的相似度计算;在二维偏好矩阵中,通过计算用户之间的相似度,将某个用户对所有服务的偏好作为一个向量,或者通过计算服务项目之间的相似度,将所有用户对某个服务的偏好作为一个向量;计算用户之间的相似度使用了Tanimoto系数进行计算结果相似度:
[0020][0021]其中,T表示用户/服务的相似度;x和y表示不同的用户或服务信息;
[0022]25)相似邻居计算:以当前所取的点为中心,距离为K的区域中的所有点作为当前点的邻居,计算得到相邻用户和相邻服务,即通过对相似度的邻居计算来限制邻居的远近;
[0023]26)计算推荐:基于相邻用户和相邻服务信息为用户进行推荐。
[0024]进一步的是,所述步骤23)计算推荐基于相邻用户和相邻服务信息为用户进行推荐,其推荐步骤如下:
[0025]233)基于用户的协同过滤推荐:以每个用户对所有服务项目的偏好为向量,计算各个用户之间的相似度;
[0026]234)基于item的协同过滤推荐:将所有用户对某个item服务的偏好作为一个向量,计算item之间的相似度,从而得到它的相似服务后,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于服务记录的混合型推荐算法系统,其特征在于包括以下步骤:1)服务记录数据预处理:该部分数据直接从数据库读取,包含用户的信息、服务的详细记录、建议和历史推荐服务等,并将其中的语音数据转为文字,图片信息通过Yolo算法进行识别储存,然后依次进行数据的减噪和归一化,得到标准、干净、连续的记录数据;2)基于服务记录的协同过滤推荐:主要工作是基于相似度计算,基于记录中相似度,找到评分最高的若干个物品推荐给用户;3)基于服务记录内容的推荐:根据用户之前有过的item,为用户推荐相似的item;4)基于服务记录内关联规则的推荐:主要工作是找到最大频繁项,然后在频繁项集中通过可信度的筛选获得其关联规则;5)基于服务记录的加权混合模型推荐:将上述2)、3)和4)三种算法的推荐结果进行组合,扬长避短,结合多个推荐系统算法的推荐结果,通过加权方式来获得每个推荐候选服务的加权得分,最终进行排序,获得推荐列表。2.根据权利要求1所述的一种基于服务记录的混合型推荐算法系统,其特征在于:所述步骤1)服务记录数据预处理步骤如下:11)去除唯一属性:是指服务记录数据信息中的一些id属性,这些属性并不能反映用户的特征信息,所以直接删除即可;12)处理缺失值:将数据信息中的缺失值进行补全,采用均值插补法,当一条信息属性的距离作为一种可以度量的值时,使用该信息属性的有效值的平均值来处理和插补缺失的值;当信息属性的距离是一种不可度量的值,使用这个属性的有效值的众数来替代插补缺失的值;13)数据标准化、正则化:数据的标准化采用z

score标准化,这种模型主要适用于一些属性的最大值和最小值未知的情况,或有超出范围的分类离群数据,其基于一些原始数据的平均值和标准差。3.根据权利要求1所述的一种基于服务记录的混合型推荐算法系统,其特征在于:所述步骤2)基于服务记录的协同过滤推荐步骤如下:21)用户和服务的相似度计算;在二维偏好矩阵中,通过计算用户之间的相似度,将某个用户对所有服务的偏好作为一个向量,或者通过计算服务项目之间的相似度,将所有用户对某个服务的偏好作为一个向量;计算用户之间的相似度使用了Tanimoto系数进行计算结果相似度:其中,T表示用户/服务的相似度;x和y表示不同的用户或服务信息;22)相似邻居计算:以当前所取的点为中心,距离为K的区域中的所有点作为当前点的邻居,计算得到相邻用户和相邻服务,即通过对相似度的邻居计算来限制邻居的远近;23)计算推荐:基于相邻用户和相邻服务信息为用户进行推荐。4.根据权利要求3所述的一种基于服务记录的混合型推荐算法系统,其特征在于:所述步骤23)计算推荐基于相邻用户和相邻服务信息为用户进行推荐,其推荐步骤如下:231)基于用户的协同过滤推荐:以每个用户对所有服务项目的偏好为向量,计算各个
用户之间的相似度;232)基于item的协同过滤推荐:将所有用户对某个item服务的偏好作为一个向量,计算item之间的相似度,从而得到它的相似服务后,然后根据用户历史的偏好预测当前用户还没有表示偏好的服务,计算得到一个排序的服务列表作为推荐。5.根据权利要求1所述的一种基于服务记录的混合型推荐算法系统,其特征在于:所述步骤3)基于服务记录内容的推荐步骤如下:31)物品/项目表示:采用基于图排序的关键词提取算法TextRank,先将一些给定的文本T进行分割,然后进行分词和词性的标注处理,接着构建关键词图,随后就可以根据TextRank公式,对各节点的权重进行迭代,迭代公式如下:其中,d表示阻尼系数,用于平滑,通常取值为0.60

0.85;V
i
表示某个网页,V
j
表示链接到V
i
的网页;In(V
i
)表示网页V
i
的所有入链的集合;最后对节点权重进行排序,得到文本关键词,进而抽取代表属性;32)用户偏好学习:对于内容推荐,使用Rocchio算法来获取用户...

【专利技术属性】
技术研发人员:顾守华王飞
申请(专利权)人:寿带鸟信息科技苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1