一种电网用户评价稀疏矩阵评分预测方法技术

技术编号:30443023 阅读:33 留言:0更新日期:2021-10-24 18:32
本发明专利技术公开了一种电网用户评价稀疏矩阵评分预测方法,它包括:通过构建本体概念的层次结构树计算用户评价之间的语义相似度,对稀疏矩阵中相似度大于相似度阈值的用户评价进行部分评分预测填充;以预测后评分矩阵为基础,基于矩阵分解理论进行降维与分解,进一步对小于等于相似度阈值的用户评价进行评分预测,从而实现对稀疏矩阵中评分缺失值的预测填充;改善了矩阵极度稀疏的情况下矩阵分解算法产生的过拟合现象,提高了协同过滤推荐算法质量。量。量。

【技术实现步骤摘要】
一种电网用户评价稀疏矩阵评分预测方法


[0001]本专利技术属于软件
,尤其涉及一种电网用户评价稀疏矩阵评分预测方法。

技术介绍

[0002]智能问答系统是将积累的无序语料信息,进行有序和科学的整理,并建立基于知识的分类模型;这些分类模型可以指导新增加的语料咨询和服务信息,节约人力资源,提高信息处理的自动性。智能问答系统根据用户提问,将从知识库或者互联网中搜索相应的答案,然后把答案直接返回给用户,这当中协同过滤推荐机制是目前研究最多、效果最好的个性化推荐技术,它根据用户的历史选择信息和相似性关系,通过收集与用户兴趣爱好相同或者相似的其他用户的评价信息来产生推荐,在理论研究和工程实践中都取得了重要的进展。
[0003]在大数据环境下,电网用户行为所产生的历史数据增长迅速,和用户总体数目及用户评价的信息数据相比,单个用户

用户评价所产生的数据微乎其微,且新用户和用户评价不断加入系统不断产生新的关联,导致数据集具有很高的稀疏性。
[0004]有研究表明:用户评分数据比较稀疏时,推荐系统性能会急剧下降。针对电网本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种电网用户评价稀疏矩阵评分预测方法,其特征在于:它包括:通过构建本体概念的层次结构树计算用户评价之间的语义相似度,对稀疏矩阵中相似度大于相似度阈值的用户评价进行部分评分预测填充;以预测后评分矩阵为基础,基于矩阵分解理论进行降维与分解,进一步对小于等于相似度阈值的用户评价进行评分预测,从而实现对稀疏矩阵中评分缺失值的预测填充。2.根据权利要求1所述的一种一种电网用户评价稀疏矩阵评分预测方法,其特征在于,具体包括下述步骤:步骤1、根据用户评分对用户评价分类为已评分概念实例集合V
m
和待预测评分概念实例集合W
m
;步骤2、遍历本体层次树,获取概念实例深度depth(I
i
),I
i
∈V
m
,depth(I
j
),I
j
∈W
m
和其最小公共祖先节点lso(I
i
,I
j
),计算用户评价相似度;步骤3、获取V
m
中用户评价相似度大于相似度阈值ε的子集V
m
',对待预测用户评价I
j
∈W
m
进行评分预测;步骤4、V
m
中没有任何元素与I
j
相似度大于阈值ε,访问W
m
中下一个元素,跳转到步骤2;步骤5、以语义相似度方法预测后的评分矩阵为输入矩阵,按照矩阵分解方法对评分矩阵进行降维,分解成与原矩阵最佳逼近的低阶近似矩阵,计算损失函数,进行迭代计算得到评分矩阵分解后两个矩阵的各元素值,最后得到评分矩阵中待预测用户评价评分值。3.根据权利要求2所述的一种电网用户评价稀疏矩阵评分预测方法,其特征在于:步骤2所述计算用户评价相似度的方法为:两个概念实例之间的距离越短,这两个概念之间的相似度就越高,反之亦然,则相似度公式为:式中:depth表示节点到根节点的最短路径,lso表示两个实例的最小公共祖先节点,len表示两节点之间的最短路径;由公式(1)可知,概念间的相似度随着最小共同祖先节点深度的增加而增加,且,当I
i
=I
j
时,sim(I
i
,I
j
)=1。4.根据权利要求2所述的一种电网用户评价稀疏矩阵评分预测方法,其特征在于:步骤3所述获取V
m
中用户评价相似度大于相似度阈值ε的子集V
m
',对待预测用户评价I
j
∈W
m
进行评分预测的公式为:5.根据权利要求4所述的一种电网用户评价稀疏矩阵评分预测方法,其特征在于:所述评分预测的具体方法为:
设用户评价集合为I=(I1,...,I
i
,I
j
,...,I
n
),ε为一阈值常数,若I
i
与I
j
的语义相似度大于阈值,则I
i
与I
j
之间是相似的;否则I
i
与I
j
之间是不相似的;设用户集合为U=(U1,...,U
m
,U
n
,...,U
k
),用户U
m
已评分用户评价集合为V
m
,未评分的用户评价集合为W
m
,I
i
、I
j
分别为集合V
m
、W
m
的任一元素,R
mi
是用户U
m
已评分用户评价I
i
的评分,ε为阈值常数;用户U
m
对用户评价I
j
的评分预测R
mj
为。证明:假设已评分集合V
m
中包含t个用户评价,与待评分用户评价I
j
相似度大于阈值ε的两个分别为I
p
,I
q
,则依据用户评价I
p
,I
q
的预测评分公式:综合考虑相似用户评价I
p
,I
q
与相似性用户评价I
j
的相似性权重得:依据已知评分R
mp
,R
mq
与相似度权重可得公式:进一步推广到U
m
已评分集合V
...

【专利技术属性】
技术研发人员:杨强张云菊郭明史虎军张玉罗司胜文杜秀举
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1