一种基于变精度容差关系扩展粗糙集的个性化推荐方法技术

技术编号:10425556 阅读:126 留言:0更新日期:2014-09-12 15:54
本发明专利技术提供了一种基于变精度容差关系扩展粗糙集的个性化推荐方法,该方法通过对两个对象不可分辨性的特点分析,提出一种更符合统计意义的变精度容差关系扩展粗糙集,通过分辨矩阵,获取核集,并将包含核属性的分辨矩阵元素置空。初始化约简集为核集,之后将分辨矩阵非空元素出现次数最多的属性分别与约简集中的相应约简做并运算,得到新的约简,同时将分辨矩阵中含有该属性的元素置空,完成约简集的提取。针对每个约简,构建知识树,界定剪枝条件,根据剪枝条件进行特殊情况的剪枝,降低计算复杂度,获取有效规则,形成规则集,从而有效实现数据挖掘。最后根据需推荐结果的条件属性值,在规则集中进行规则匹配,依据匹配结果,完成个性化推荐。

【技术实现步骤摘要】

本专利技术属于决策信息系统大数据处理
,尤其是不完备决策信息系统的处理及个性化推荐,具体设计一种基于变精度容差关系扩展粗糙集(Variable-precis1nTolerance relat1n, VT)的个性化推荐方法。
技术介绍
近年来,随着门户网站、社交网络、电子商务等网络应用的发展,产生并积累了大量数据,这些数据具有Volume (大量)、Velocity (高速)、Variety (多样)、Value (价值)等特点。但同时,这些大数据中往往不具备完备性,即难以达到各相关属性值都是确定的要求。如电子商务方面对用户的了解,单从购物习惯来讲,可以看用户的购物记录、搜索记录、用户在意的是价格、质量、信誉度还是其他?可这些条件,并不都是完整的,用户可能只提供了其中几个方面。对于现有以及未来更多的大数据,获取大数据的价值成为大数据处理的焦点,其中一个典型的应用是发现大数据的潜在规律,提取有效规则,用于个性化推荐。个性化推荐是根据用户特点,向用户推荐符合其要求的结果,是建立在大数据基础上的一种高级商务智能平台,提供个性化的决策支持和信息服务。如在电子商务中,可以根据用户的兴趣特点、购买行为等要素,向用户推荐其可能感兴趣的信息或者商品,以期达到减少用户找寻时间、匹配最佳产品,提高相应商家销量等目标。现有个性化 推荐方法主要是四类:1、协同过滤系统。这是第一代提出并得到广泛应用的推荐系统。第一个投入应用的协同过滤系统是Grundy。其他利用协同过滤方法进行推荐的系统有Amazon ?com的书籍推荐系统,Phoaks的WWW信息推荐系统等。2、基于内容的推荐系统。在大多数的基于内容的推荐系统中,产品的内容常常被描述成关键词,Fab系统就是一个典型的例子3、基于网络结构的推荐算法。周涛和Huang等利用用户一产品,用二部分图建立用户一产品关联关系,并据此提出了基于网络结构的推荐算法。张翼成考虑用户对产品的打分信息,在更复杂的环境下实现了基于热传导和物质扩散的推荐算法,效果好于经典的协同过滤算法。4、混合推荐算法。协同过滤、基于内容以及基于网络结构的推荐算法在投入实际运营的时候都有各自的缺陷,集中体现在数据稀疏性、冷启动、无法适应用户兴趣的变化等问题上,严重影响了推荐算法性能。因此实际的推荐系统大多把不同的推荐算法进行结合,提出了混合推荐算法,目前,最常见的混合推荐系统是基于协同过滤和基于内容的。以上典型方法难以处理不完备信息决策系统问题,亦即大数据环境下不完备决策信息系统的个性化推荐方法尚待研究。由于不完备决策信息系统越来越多,不完备决策信息系统下的个性化推荐问题的解决显得越来越重要。
技术实现思路
本专利技术的目的是针对当今不完备决策信息系统越来越多,个性化推荐应用前景越来越广阔的问题,提出了,充分利用扩展粗糙集对不完备决策信息处理的优势,通过建立一种更符合统计意义的变精度容差关系,界定一种新的扩展粗糙集,并在此基础上构建新的分辨矩阵,从降低计算复杂度的角度出发,获得约简集,挖掘有效决策规则,实现更为合理的个性化推荐。本专利技术的技术方案是:,包括:步骤一:定义变精度容差关系扩展粗糙集VT,包括定义变精度容差关系,给出不可分辨类,并进一步界定上近似集、下近似集;步骤二:根据变精度容差关系扩展粗糙集的不可分辨类,计算属性集下的精确度和属性的重要性,在判断可分辨对象的分辨属性时,除了将明确且不相等的属性作为分辨矩阵元素的因子外,特别考虑存在不确定值的属性的重要性,如果重要性大于等于预设阈值,则也作为分辨矩阵元素的因子;步骤三:提取约简集RED,提取分辨矩阵只有一个属性的元素做并集后形成核集,并将分辨矩阵含核属性的元素全部置空,之后从非空元素包含属性最少的所有属性出发,分别将出现次数最多的属性并入约简集,依次循环,直到每一个约简集中每一个约简包含所有分辨矩阵元素至少一个属性结束;步骤四:挖掘决策规则集,首先将约简集中的每个约简建立一棵知识树,在建树过程中,根据置信度和支持度判定规则有效性,有效且不在规则集中的规则并入,同时根据界定的剪枝条件,进行剪枝;步骤五:个性化推荐,获取用户给出的条件属性值后,利用规则集中的已有规则,与条件属性值进行匹配,从而给出合理决策推荐结果。本专利技术的步骤一具体为:步骤101:定义变精度容差关系;给定决策信息系统(U,C U d,F),对于任何具有遗漏属性值的属性,记遗漏值为 其中U = {x1; X2,…,XnI为包含η个对象的对象集,Xi为第i个对象,i = 1、2、...、n, Xj为第j个对象,j = 1、2、...、n ;C = Ic1, c2,...&}为包含m个条件属性的条件属性集,Ck为第k个属性,k= 1、2.....m,d为决策属性,F为U与C U d之间的关系集,Ck(Xi)为第i个对象在第k个属性下的取值,Vk为第k个属性下的属性值集合,记|Vk|表示Vk中元素即属性值的个数,Cl(Xi)为对象Xi的决策属性值。在两个不同对象Xi, Xj的比较中,记确定且相等、一个确定一个不确定、均不确定、都确定且不相等的条件属性集分别为Sp S2, S3、S4,即:S1 = {ck I ck e C Λ Ck(Xi)古 * Λ Ck(Xj)古 * Λ Ck(Xi) = Ck (Xj)}S2 = {ck|ck e C Λ ((Ck(Xi) = * Λ Ck(Xj)关 *) V (Ck(Xi)关 * Λ Ck(Xj) = *))}S3 = {ck|ck e C Λ Ck(Xi) = * Λ Ck(Xi) = *}S4 = {ck|ck e C Λ Ck(Xi)古 * Λ Ck(Xj)古 * Λ Ck(Xi) Φ Ck (Xj)}同一对象Xi与其自身的比较中,记所有条件属性集为S5,即: = {ck I Vcit e C\则两个对象Xi, Xj在属性Ck下的不可分辨可能性puk为:本文档来自技高网
...

【技术保护点】
一种基于变精度容差关系扩展粗糙集的个性化推荐方法,其特征在于,包括:步骤一:定义变精度容差关系扩展粗糙集VT,包括定义变精度容差关系,给出不可分辨类,并进一步界定上近似集、下近似集;步骤二:根据变精度容差关系扩展粗糙集的不可分辨类,计算属性集下的精确度和属性的重要性,在判断可分辨对象的分辨属性时,除了将明确且不相等的属性作为分辨矩阵元素的因子外,特别考虑存在不确定值的属性的重要性,如果重要性大于等于预设阈值,则也作为分辨矩阵元素的因子;步骤三:提取约简集RED,提取分辨矩阵只有一个属性的元素做并集后形成核集,并将分辨矩阵含核属性的元素全部置空,之后从非空元素包含属性最少的所有属性出发,分别将出现次数最多的属性并入约简集,依次循环,直到每一个约简集中每一个约简包含所有分辨矩阵元素至少一个属性结束;步骤四:挖掘决策规则集,首先将约简集中的每个约简建立一棵知识树,在建树过程中,根据置信度和支持度判定规则有效性,有效且不在规则集中的规则并入,同时根据界定的剪枝条件,进行剪枝;步骤五:个性化推荐,获取用户给出的条件属性值后,利用规则集中的已有规则,与条件属性值进行匹配,从而给出合理决策推荐结果。

【技术特征摘要】
1.一种基于变精度容差关系扩展粗糙集的个性化推荐方法,其特征在于,包括: 步骤一:定义变精度容差关系扩展粗糙集VT,包括定义变精度容差关系,给出不可分辨类,并进一步界定上近似集、下近似集; 步骤二:根据变精度容差关系扩展粗糙集的不可分辨类,计算属性集下的精确度和属性的重要性,在判断可分辨对象的分辨属性时,除了将明确且不相等的属性作为分辨矩阵元素的因子外,特别考虑存在不确定值的属性的重要性,如果重要性大于等于预设阈值,则也作为分辨矩阵元素的因子; 步骤三:提取约简集RED,提取分辨矩阵只有一个属性的元素做并集后形成核集,并将分辨矩阵含核属性的元素全部置空,之后从非空元素包含属性最少的所有属性出发,分别将出现次数最多的属性并入约简集,依次循环,直到每一个约简集中每一个约简包含所有分辨矩阵元素至少一个属性结束; 步骤四:挖掘决策规则集,首先将约简集中的每个约简建立一棵知识树,在建树过程中,根据置信度和支持度判定规则有效性,有效且不在规则集中的规则并入,同时根据界定的剪枝条件,进行剪枝; 步骤五:个性化推荐,获取用户给出的条件属性值后,利用规则集中的已有规则,与条件属性值进行匹配,从而给出合理决策推荐结果。2.如权利要求1所述的基于变精度容差关系扩展粗糙集的个性化推荐方法,其特征在于,步骤一具体为: 步骤101:定义变精度容差关系; 给定决策信息系统(U,C U d, F),对于任何具有遗漏属性值的属性,记遗漏值为其中U = {χ1; X2,..., XnI为包含η个对象的对象集,Xi为第i个对象,i = 1、2、...、η,χ」为第j个对象,j = 1、2、...、n ;C = Ic1, c2,.“cm}为包含m个条件属性的条件属性集,Ck为第k个属性,k= 1、2.....m,d为决策属性,F为U与C U d之间的关系集,Ck(Xi)为第i个对象在第k个属性下的取值,Vk为第k个属性下的属性值集合,记|Vk|表示Vk中元素即属性值的个数,Cl(Xi)为对象Xi的决策属性值。 在两个不同对象Xi, Xj的比较中,记确定且相等、一个确定一个不确定、均不确定、都确定且不相等的条件属性集分别为S1、S2, S3、S4,即:51={ck|ck eC ΛCk(Xi) Φ 夂 ?\ Ck(Xj)关 * Λ Ck(Xi) = Ck (Xj)}52={ck|ck eC ...

【专利技术属性】
技术研发人员:郑桂玲孙亮张利娜张琰孙建伟吉克
申请(专利权)人:东南大学成贤学院无锡云歌电子商务有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1