基于模糊对象语言概念格的个性化推荐方法技术

技术编号:25439079 阅读:42 留言:0更新日期:2020-08-28 22:27
本发明专利技术公开了一种可解决推荐解释模糊及冷启动问题且可避免信息缺失的基于模糊对象语言概念格的个性化推荐方法,按照如下步骤进行:数据处理,将收集到的训练数据集初始化成模糊对象语言形式背景;构造模糊对象语言概念及概念格;计算待推荐用户与其他用户间的评价差异;根据评价差异对训练数据集进行初步处理;构建训练数据集的认知系统;构造训练数据集的充分知识库及模糊对象语言知识拟格;构造训练数据集的必要知识库及模糊对象语言知识拟格;计算频繁模糊对象语言概念或频繁模糊对象语言知识;计算模糊对象语言关联规则;计算推荐规则库并进行推荐。

【技术实现步骤摘要】
基于模糊对象语言概念格的个性化推荐方法
本专利技术属于数据挖掘和智能信息处理技术,尤其是一种可解决推荐解释模糊及冷启动问题且可避免信息缺失的基于模糊对象语言概念格的个性化推荐方法。
技术介绍
形式概念分析(FCA)是Wille于1982年提出的一种基于形式背景分析概念层次结构的方法。概念用满足某种闭包性质的外延和内涵刻画,形式背景中生成的所有概念构成完备的概念格,用于刻画形式概念的层次结构关系并分析概念之间的泛化和特化关系。用语言值表示定性概念,是人类思维的基础,既具有随机性,也具有模糊性。Zadeh引入了语言变量的定义,并将其应用于近似推理;Xu等提出语言真值格蕴涵代数及语言真值命题逻辑系统,体现出了自然语言中可比与不可比的特点;Xu等引入犹豫模糊语言术语集,并提出了不同类型语言术语集的距离和相似性度量,将语言信息应用到多标准决策问题中,使用语言值处理决策问题。在形式背景S=(U,A,I)中,通常用I(x,a)来描述对象x与属性a之间的二元关系,但是这种二元关系只能用1或0来表示,具有一定的局限性。而人们进行数据处理时,往往会用自然语言来描述对象与属性之间的二元关系。Xu等提出了一种基于格值逻辑的语言真值概念格,用于处理不确定语言信息下的决策问题。Pei等针对一类评价语言集,借鉴形式概念分析的学术思想,研究了该评价语言集的层次结构,通过评价语言刻画对象的适合度,研究了评价语言值推理;Zou等基于下标对称的语言术语集,提出了语言概念的形式背景,并设计一种基于语言概念的形式背景的语言概念知识约简算法;邹丽等基于语言值直觉模糊代数和直觉模糊形式背景,提出了语言值直觉模糊概念格的模式识别方法。概念作为形式概念分析的基础,是自然界中事物本质的反应,它对一类事物进行概括的表征。人们往往不能直接看透事物的本质,因此,人们认知的增长得益于概念的学习,形式概念分析作为一种获取概念的方法,同样也被认为是进行认知学习的主要工具。张文修和徐伟华从粒计算的观点对人类认知过程作了详细的研究,给出了认知的粒化描述和新的认知模型;仇国芳等在两个完备格之间引入了外延内涵算子与内涵外延算子,构建了概念粒计算系统;Yao等从认知信息学和粒计算的角度研究了概念学习的概念框架,并解释了基于分层知识发现模型的概念学习;Xu等基于信息粒,在模糊数据集中构建了双向学习系统,用于将模糊信息粒训练为充分、必要和充分必要模糊信息粒;Li等从认知计算的角度讨论了基于粒计算与三支概念的概念学习;为了处理更复杂的数据并提高学习效率,Niu等基于粒计算和信息融合的大数据和多源数据,研究了概念认知学习的并行计算技术。作为一种新的机器学习方法,认知系统的研究已成为了学者们的热点研究问题。随着计算机网络的高速发展,出现了信息爆炸与信息过载的问题。为了给用户提供更多有效的信息,个性化推荐系统(PRS)应运而生。协同过滤算法其基本思想是通过计算物品与物品或用户与用户之间的相似度,总结用户的历史数据,得出推荐结果。随着数据挖掘技术的不断进步,关联规则已经逐步应用于PRS中,在关联规则挖掘算法中,Agrawal等提出的Apriori算法是最有影响力的关联规则挖掘算法,但是,由于Apriori算法采用的是逐层搜索的迭代算法,因而会不断的扫描事务数据库,并且所挖掘出来的规则会出现大量冗余,甚至会出现组合爆炸的可能。由于关联规则可以通过概念格父子概念的内涵关系来描述,另外,概念中外延与内涵的闭合关系非常适合挖掘关联规则,因此,基于概念格的关联规则挖掘算法得到了广泛的应用。谢志鹏和刘宗田分析了概念格与关联规则之间的提取关系,提出了基于概念格的关联规则提取算法;强宇等说明了模糊概念格在知识发现中的应用,提出了一种模糊概念格的构造算法;Wang等提出基于定量概念格的关联规则挖掘算法,有效地避免了粗糙集中存在的组合爆炸的问题;Qian等在总结了几种典型的属性约简算法的基础上,从决策表中提取关联规则,表明了概念格可以更好地实现关联规则挖掘过程中的直观可视化。但是,现有将基于概念格的关联规则提取算法应用于推荐系统还存在推荐解释模糊及冷启动的问题,此外,由于概念格仍然不能处理语言信息,容易造成信息缺失。
技术实现思路
本专利技术是为了解决现有技术所存在的上述技术问题,提供一种可解决推荐解释模糊及冷启动问题且可避免信息缺失的基于模糊对象语言概念格的个性化推荐方法。本专利技术的技术解决方案是:一种基于模糊对象语言概念格的个性化推荐方法,按照如下步骤进行:A数据采集与预处理:A1.设定语言术语集为S={sα|α=-τ,…,-1,0,1,…,τ},物品集为L={l1,l2,…,ln},用户集为U={x1,x2,…,xm},所述n为物品总个数,m为用户总个数;A2.收集用户xr使用语言值sα描述物品li的语言概念xr∈U,li∈L,语言概念集为初始化用户集U与语言概念集的模糊对象语言形式背景作为训练集,λ∈[0,1]为用户与语言概念间的信任度水平,为用户集U到语言概念集的模糊二元关系,即A3.基于用户集U与语言概念的模糊对象语言形式背景,利用用户集和语言概念集上定义运算:构造用户集U与语言概念集的模糊对象语言概念及概念格;B.计算待推荐用户与其他用户间的评价差异:λ∈[0,1],xj,xr,xo∈U,和分别表示模糊对象语言形式背景上对象xj,xr在同一个语言概念上的λ取值,和距离如下:其中,用户xj和xr之间的距离如下:其中,2τ+1是同类属性下的语言概念的项数,同类属性下的语言概念的集合分别为O、P和Q,wai是每类属性所占的权重,且C.根据待推荐用户与其他用户间的评价差异对训练数据集进行初步处理:找到与目标用户最相似的前K个用户,使Uk={x1,x2,…,xk},在模糊对象语言形式背景的基础上构造训练数据集D.认知阶段:D1.基于训练数据集利用G算子和H模糊算子上定义运算构造训练数据集的认知系统;D2.基于训练数据集利用模糊对象集和语言概念B∈L2上定义运算构造训练数据集的充分知识库K1及K1构成的模糊对象语言知识拟格;D3.基于训练数据集利用模糊对象集和语言概念B∈L2上定义运算:构造训练数据集的必要知识库K2及K2构成的模糊对象语言知识拟格;E.个性化推荐阶段:E1.令为中的模糊对象语言概念,则内涵B的支持度按下式计算:通过Supp(B)≥minSupp(B),计算频繁模糊对象语言概念和频繁模糊对象语言知识所述minSupp(B)为最小支持度阈值;E2.通过满足泛化与特化关系的频繁模糊对象语言概念和计算模糊对象语言关联规则E3.令和为中的两个模糊对象语言概念,计算模糊对象语言关联规则的支持度、置信度和提升度通过计算满足阈值条件的模糊对象语言关联规则所述为模糊对象语言关联规则的最小支持度阈值,为模糊对象语言关联规则的最小置信度阈值;E4.将满足阈值条件的模糊对象语言关联规则加入推荐规则本文档来自技高网
...

【技术保护点】
1.一种基于模糊对象语言概念格的个性化推荐方法,其特征在于按照如下步骤进行:/nA数据采集与预处理:/nA1.设定语言术语集为S={s

【技术特征摘要】
1.一种基于模糊对象语言概念格的个性化推荐方法,其特征在于按照如下步骤进行:
A数据采集与预处理:
A1.设定语言术语集为S={sα|α=-τ,…,-1,0,1,…,τ},物品集为L={l1,l2,…,ln},用户集为U={x1,x2,…,xm},所述n为物品总个数,m为用户总个数;
A2.收集用户xr使用语言值sα描述物品li的语言概念xr∈U,li∈L,语言概念集为初始化用户集U与语言概念集的模糊对象语言形式背景作为训练集,λ∈[0,1]为用户与语言概念间的信任度水平,为用户集U到语言概念集的模糊二元关系,即
A3.基于用户集U与语言概念的模糊对象语言形式背景,利用用户集和语言概念集上定义运算:构造用户集U与语言概念集的模糊对象语言概念及概念格;
B.计算待推荐用户与其他用户间的评价差异:λ∈[0,1],xj,xr,xo∈U,和分别表示模糊对象语言形式背景上对象xj,xr在同一个语言概念上的λ取值,和距离如下:



其中,
用户xj和xr之间的距离如下:



其中,2τ+1是同类属性下的语言概念的项数,同类属性下的语言概念的集合分别为O、P和Q,是每类属性所占的权重,且
C.根据待推荐用户与其他用户间的评价差异对训练数据集进行初步处理:找到与目标用户最相似的前K个用户,使Uk={x1,x2,…,xk},在模...

【专利技术属性】
技术研发人员:刘新庞阔邹丽
申请(专利权)人:辽宁师范大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1