一种基于智能图书推荐系统数据采集的方法技术方案

技术编号:39416246 阅读:9 留言:0更新日期:2023-11-19 16:07
本申请适用于图书推荐技术领域,提供了一种基于智能图书推荐系统数据采集的方法,包括:获取目标用户的用户特征数据;将用户特征数据输入至预设多项式朴素贝叶斯分类器,预测出目标用户的用户阅读需求,根据用户阅读需求和待推荐图书对应的热度评分生成第一图书推荐列表;将用户特征数据输入至预设语义神经网络模型,得到第二图书推荐列表;将用户特征数据输入至预设知识图谱,得到第三图书推荐列表;根据第一图书推荐列表、第二图书推荐列表以及第三图书推荐列表,确定出目标图书推荐列表。可见,本申请实施例可以采集多维度数据,通过对多维度数据进行综合处理,从而准确生成目标图书推荐列表,为用户进行个性化推荐。为用户进行个性化推荐。为用户进行个性化推荐。

【技术实现步骤摘要】
一种基于智能图书推荐系统数据采集的方法


[0001]本申请属于图书推荐
,尤其涉及一种基于智能图书推荐系统数据采集的方法


技术介绍

[0002]图书推荐系统是一种利用计算机给用户主动推荐图书的技术,为用户提供更好的阅读体验,帮助用户发现他们可能感兴趣的图书,增加他们的阅读选择

传统的图书推荐系统往往只考虑用户基本信息,采集的数据维度比较单一,并且对数据的处理方式较为简单,导致推荐结果不够准确


技术实现思路

[0003]本申请实施例提供了一种基于智能图书推荐系统数据采集的方法,可以解决现有技术中推荐系统采集的数据维度比较单一,并且对数据的处理方式较为简单,导致推荐结果不够准确的问题

[0004]第一方面,本申请实施例提供了一种基于智能图书推荐系统数据采集的方法,包括:获取目标用户的用户特征数据,所述用户特征数据包括用户基础数据

用户阅读历史数据以及用户历史评价数据;将所述用户特征数据输入至预设多项式朴素贝叶斯分类器,预测出目标用户的用户阅读需求,根据所述用户阅读需求和待推荐图书对应的热度评分生成第一图书推荐列表;其中,所述待推荐图书预先存储在本地数据库;将所述用户特征数据输入至预设语义神经网络模型,得到第二图书推荐列表;将所述用户特征数据输入至预设知识图谱,得到第三图书推荐列表;根据所述第一图书推荐列表

所述第二图书推荐列表以及所述第三图书推荐列表,确定出目标图书推荐列表;所述用户阅读需求是指包含阅读目的以及阅读主题的需求;将所述用户特征数据输入至预设多项式朴素贝叶斯分类器,预测出目标用户的用户阅读需求,包括
:
对所述用户特征数据进行向量化处理,得到第一特征向量;对预先存储在本地数据库的候选阅读需求进行向量化处理,得到第二特征向量;计算每个候选阅读需求对应的后验概率;将最高后验概率对应的候选阅读需求作为用户阅读需求

[0005]在第一方面的一种可能的实现方式中,计算每个候选阅读需求对应的后验概率,包括
:
根据下式计算每个候选阅读需求对应的后验概率:
,其中,
X
为第一特征向量,
C
为第二特征向量,
P(C|X)
为在用户特征数据发生的条件下候选阅读需求发生的后验概率,
P(X)
为用户特征数据独立发生的先验概率,
P(C)
为候选阅读需求独立发生的先验概率,
P(X|C) 为候选阅读需求发生的条件下用户特征数据发生的先验概率

[0006]在第一方面的一种可能的实现方式中,根据所述用户阅读需求和待推荐图书对应的热度评分生成第一图书推荐列表,包括
:
提取所述待推荐图书对应的图书特征数据;其中,所述图书特征数据包括图书名称以及图书主题;提取所述用户阅读需求对应的阅读需求特征数据,其中,所述阅读需求特征数据包括阅读目的以及阅读主题;对用户阅读需求与待推荐图书之间进行相似度计算:,其中,
Cosine_Similarity
为用户阅读需求与所述待推荐图书之间的相似度,
A
为阅读需求特征数据的向量化表示,
B
为图书特征数据的向量化表示,
dot(A,B)
为向量内积,
norm(A)
为阅读需求特征数据的
L2
范数,
norm(B)
为图书特征数据的
L2 范数;根据下式计算待推荐图书对应的热度评分:,其中,
Popularity_rating
为待推荐图书对应的图书热度,
f(a)
为图书书龄对应的第一映射值,
W1
为图书书龄对应的第一权重值,
f(b)
为图书历史借阅次数对应的第二映射值,
W2
为图书历史借阅次数对应的第二权重值,
f(c)
为最近图书借阅间隔对应的第三映射值,
W3
为图书历史借阅次数对应的第三权重值;根据用户阅读需求与待推荐图书之间的相似度,以及待推荐图书对应的热度评分计算待推荐图书对应的第一推荐分数:,其中,
P1
为待推荐图书对应的第一推荐分数,
Cosine
Similarity
为用户阅读需求与所述待推荐图书之间的相似度,
Popularity_rating
为待推荐图书对应的图书热度,
W4
为第一推荐分数对应设置的第四权重值;根据第一推荐分数对所述待推荐图书进行排序,得到第一图书推荐列表

[0007]在第一方面的一种可能的实现方式中,将所述用户特征数据输入至预设语义神经网络模型,得到第二图书推荐列表,包括
:
通过预设输入层提取出所述用户特征数据中的用户阅读历史数据;通过预设语义特征层提取出所述用户阅读历史数据的第一语义特征向量以及待推荐图书对应的第二语义特征向量;通过预设全连接层对所述第一语义特征向量和所述第二语义特征向量进行拼接,得到全局特征向量;
通过预设分类层对所述全局特征向量进行分类预测,得到待推荐图书对应的第二推荐分数;根据第二推荐分数对所述待推荐图书进行排序,得到第二图书推荐列表

[0008]在第一方面的一种可能的实现方式中,所述预设分类层的表达式为:,其中,
P2
为待推荐图书对应的第二推荐分数,
Sigmoid
为二分类函数,为分类层的权重矩阵,
b
为偏置向量,
f1
为第一语义特征向量,
f2
为第二语义特征向量,
concat
为拼接操作

[0009]在第一方面的一种可能的实现方式中,预设知识图谱包括历史用户

待推荐图书以及所述历史用户与所述待推荐图书之间的关联关系;所述历史用户标记有历史用户特征数据;待推荐图书对应有图书特征数据;所述图书特征数据包括图书名称以及图书主题;将所述用户特征数据输入至预设知识图谱,得到第三图书推荐列表,包括:根据下式计算待推荐图书的第三推荐分数:;;;其中,
P3
为待推荐图书的第三推荐分数,
h_u
为目标用户的向量表示,
h_v
为待推荐图书的向量表示, f
为用户特征数据的向量表示和待推荐图书的向量表示之间关联程度的函数,
W
T
为可学习的参数向量,
W
T
用于表征目标用户的向量表示和待推荐图书的向量表示之间关联程度,
X
u
为用户特征数据对应的向量值,
a
u
为与目标用户相邻的历史用户标记的历史用户特征数据对应的向量值,
g
为前向传播过程函数,
X_v
为图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于智能图书推荐系统数据采集的方法,其特征在于,包括:获取目标用户的用户特征数据,所述用户特征数据包括用户基础数据

用户阅读历史数据以及用户历史评价数据;将所述用户特征数据输入至预设多项式朴素贝叶斯分类器,预测出目标用户的用户阅读需求,根据所述用户阅读需求和待推荐图书对应的热度评分生成第一图书推荐列表;其中,所述待推荐图书预先存储在本地数据库;将所述用户特征数据输入至预设语义神经网络模型,得到第二图书推荐列表;将所述用户特征数据输入至预设知识图谱,得到第三图书推荐列表;根据所述第一图书推荐列表

所述第二图书推荐列表以及所述第三图书推荐列表,确定出目标图书推荐列表
;
所述用户阅读需求是指包含阅读目的以及阅读主题的需求;将所述用户特征数据输入至预设多项式朴素贝叶斯分类器,预测出目标用户的用户阅读需求,包括
:
对所述用户特征数据进行向量化处理,得到第一特征向量;对预先存储在本地数据库的候选阅读需求进行向量化处理,得到第二特征向量;计算每个候选阅读需求对应的后验概率;将最高后验概率对应的候选阅读需求作为用户阅读需求
。2.
如权利要求1所述的基于智能图书推荐系统数据采集的方法,其特征在于,计算每个候选阅读需求对应的后验概率,包括
:
根据下式计算每个候选阅读需求对应的后验概率:,其中,
X
为第一特征向量,
C
为第二特征向量,
P(C|X)
为在用户特征数据发生的条件下候选阅读需求发生的后验概率,
P(X)
为用户特征数据独立发生的先验概率,
P(C)
为候选阅读需求独立发生的先验概率,
P(X|C) 为候选阅读需求发生的条件下用户特征数据发生的先验概率
。3.
如权利要求1所述的基于智能图书推荐系统数据采集的方法,其特征在于,根据所述用户阅读需求和待推荐图书对应的热度评分生成第一图书推荐列表,包括
:
提取所述待推荐图书对应的图书特征数据;其中,所述图书特征数据包括图书名称以及图书主题;提取所述用户阅读需求对应的阅读需求特征数据,其中,所述阅读需求特征数据包括阅读目的以及阅读主题;对用户阅读需求与待推荐图书之间进行相似度计算:,其中,
Cosine_Similarity
为用户阅读需求与所述待推荐图书之间的相似度,
A
为阅读需求特征数据的向量化表示,
B
为图书特征数据的向量化表示,
dot(A,B)
为向量内积,
norm(A)
为阅读需求特征数据的
L2
范数,
norm(B)
为图书特征数据的
L2 范数;根据下式计算待推荐图书对应的热度评分:
,其中,
Popularity_rating
为待推荐图书对应的图书热度,
f(a)
为图书书龄对应的第一映射值,
W1
为图书书龄对应的第一权重值,
f(b)
为图书历史借阅次数对应的第二映射值,
W2
为图书历史借阅次数对应的第二权重值,
f(c)
为最近图书借阅间隔对应的第三映射值,
W3
为图书历史借阅次数对应的第三权重值;根据用户阅读需求与待推荐图书之间的相似度,以及待推荐图书对应的热度评分计算待推荐图书对应的第一推荐分数:,其中,
P1
为待推荐图书对应的第一推荐分数,
Cosine
Similarity
为用户阅读需求与所述待推荐图书之间的相似度,
Popularity_rating
为待推荐图书对应的图书热度,
W4
第一推荐分数对应设置的第四权重值;根据第一推荐分数对所述待推荐图书进行排序,得到第一图书推荐列表
。4.
如权利要求1所述的基于智能图书推荐系统数据采集的方法,其特征在于,将所述用户特征数据输入至预设语义神经网络模型,得到第二图书推荐列表,包括
:
通过预设输入层提取出所述用户特征数据中的用户阅读历史数据;通过预设语义特征层提取出所述用户阅读历史数据的第一语义特征向量以及待推荐图书对应的第二语义特征向量;通过预设全连接层对所述第一语义特征向量和...

【专利技术属性】
技术研发人员:吴旭镇林颖张立雄苏嘉儿陈玉奇
申请(专利权)人:深圳市华图测控系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1