一种知识资源库的智能推送系统技术方案

技术编号:19822150 阅读:45 留言:0更新日期:2018-12-19 14:50
本发明专利技术公开了一种知识资源库的智能推送系统,包括安装于系统侧的知识资源库服务器、采集服务器、数据库服务器、预处理服务器、处理服务器和推送服务器,知识资源库服务器、采集服务器、数据库服务器、预处理服务器、处理服务器和推送服务器依次通信连接。该系统通过跟踪、分析用户系统操作行为,结合用户注册基本信息,分析用户偏好,形成用户模型,预测用户关注内容,并将用户匹配度高的内容推送到用户端。使用了用户行为分析算法,精确的判断了用户兴趣点及其权重,实现了区分用户的个性化智能推送。并且该系统具有自成长性,根据用户操作行为的变动,自动更新用户兴趣权重值,保证推送资源的高度匹配性。

【技术实现步骤摘要】
一种知识资源库的智能推送系统
本专利技术涉及培训教学领域,尤其涉及一种知识资源库的智能推送系统。
技术介绍
目前,知识管理系统已在中国普及,但随着时间的增长,组织的发展,知识资源库愈发庞大,目前此类系统普遍使用的推送方法为不区分用户需求统一推送,维度单一,经常推送一些用户不关注的内容,造成用户对推送内容失去兴趣,推送功能效益低下。在论文《基于工作流和知识点驱动的知识推送研究》(《计算机工程与应用》,GB/T7714-2015中,文章给出了一种通过工作流及点击触发的知识推送,通过系统预设触发点,推送给用户与该触发点相关内容,并以此作为用户兴趣点,推送类似的知识资源。该方法以单一的用户业务点作为用户需求点进行推送,过于主观,不能够精确把握用户兴趣。在论文《用户偏好管理及其在网站开发中的应用》(《中国知网》,TP311.13,2005中,提供了居于用户行为的用户行文分析方法,通过挖掘用户上网数据,计算出用户兴趣爱好,向用户提供感兴趣的资源,一定程度上提高了数据推送的精准度,但是人们的兴趣是随着时间而改变的,对于人们新的兴趣点,应为缺乏时间积累,用户行为数据少,系统判定权重必然过小,需要用户长时间点击后系统才能实现推送,效率过低。因此,如何快速、准确的提供用户关注的知识资源,成为提高知识资源价值必需解决的问题。
技术实现思路
为解决上述技术问题,本专利技术提出了一种知识资源库的智能推送系统,以解决知识资源系统推送内容与用户匹配度低的问题。本专利技术采用以下技术方案:一种知识资源库的智能推送系统,包括通过网络通信连接的用户端和系统端,所述系统端包括依次通信连接的知识资源库服务器、采集服务器、数据库服务器、预处理服务器、处理服务器和推送服务器,所述知识资源库服务器,用于存储知识资源数据;所述采集服务器,利用用户端和知识资源库服务器之间的网络通路,采集用户行为信息,所述用户行为信息包括用户注册时维护的个人基本信息以及用户使用过程中产生的日志文件信息;所述数据库服务器,用于储存所述用户行为信息;所述预处理服务器,用于对所述用户行为信息进行预处理形成规则有序的用户行为数据;所述处理服务器,用于对用户行为数据进行计算分析,得到带有价值权重的用户兴趣点;所述推送服务器,根据用户兴趣点的价值权重高低,与知识资源库服务器中的知识资源进行匹配,向用户端推送可聚类的信息。所述对所述用户行为信息进行预处理形成用户行为数据的过程包括,通过截取所述用户行为信息的关键字段和识别独立用户,将所述用户行为信息转化为由若干关键字段组成的用户行为数据,所述用户行为数据按照时间的先后顺序排列。每条所述用户行为数据包括以下关键字段:用户识别标识及个人基本信息集、访问模块及资源、网页时间戳。所述处理服务器包括通过网络依次通信连接的读取模块、计算模块和分析模块,所述读取模块,用于读取所述用户行为数据中的所述访问模块及资源信息和网页时间戳信息;所述计算模块,利用中文分词和TF.IDF算法,根据所述访问模块及资源信息,计算出代表访问模块及资源信息主题的特征词及所述特征词的权重;通过向量空间模型计算多个访问模块及资源信息之间的相似度,根据所述相似度认定是否为同类资源;通过聚类将同类资源聚合到一起,形成多个不同类型的知识资源信息集合;所述分析模块,用于对所述网页时间戳信息进行计算,通过计算所述知识资源信息集合中资源访问时间的期望和方差,得到知识资源的特征新鲜度和特征离散度,得到带有价值权重的用户兴趣点。所述数据库处理器为实时数据库处理器和/或关系数据库处理器。所述的用户端包括:计算机或手机。本专利技术的有益效果如下:本专利技术所提供的一种知识资源库的智能推送系统,通过跟踪、分析用户系统操作行为,结合用户注册基本信息,分析用户偏好,形成用户模型,预测用户关注内容,并将用户匹配度高的内容推送到用户端。使用了用户行为分析算法,精确的判断了用户兴趣点及其权重,实现了区分用户的个性化智能推送。并且该系统具有自成长性,根据用户操作行为的变动,自动更新用户兴趣权重值,保证推送资源的高度匹配性。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为本专利技术提供的一种知识资源库的智能推送系统的结构示意图。具体实施方式应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。正如
技术介绍
所介绍的,现有技术中存在知识资源系统推送内容与用户匹配度低的不足,为了解决如上的技术问题,本申请提出了一种知识资源库的智能推送系统。本申请的一种典型的实施方式中,如图1所示,为本专利技术提供的知识资源库的智能推送系统,包括安装于系统侧的知识资源库服务器、采集服务器、数据库服务器、预处理服务器、处理服务器和推送服务器,知识资源库服务器、采集服务器、数据库服务器、预处理服务器、处理服务器和推送服务器依次通信连接,处理服务器为实时数据库处理器和/或关系数据库处理器。具体地,各个服务器的特点及功能如下:所述知识资源库服务器,用于存储知识资源数据;采集服务器,利用用户端和知识资源库服务器之间的网络通路,采集用户行为信息,用户行为信息包括用户注册时维护的个人基本信息以及用户使用过程中产生的日志文件信息。数据库服务器,用以储存用户行为信息。预处理服务器,可对用户行为信息进行预处理形成规则有序的用户行为数据,具体地,用户行为信息相对混乱无序,需要进行预处理形成有序数据便于后续分析。为处理海量用户行为信息,本专利技术采用基于Hadoop集群的HDFS+Hive模式大数据仓库,预处理服务器的工作主要包括两个部分,即关键字段截取和独立用户识别。经过预处理后用户行为数据由杂乱无章的用户行为信息数据转变成由几个规定关键字段组成的规范化数据即用户行为数据。所述用户行为数据包括很多条规范化后的用户行为日志组成的文档,并且按照时间的先后顺序排列,其中每条数据包括用户识别标识及个人基本信息集、访问模块及资源、网页时间戳等几个字段,以方便处理服务器在用户行为特征分析时,对这几个关键字段的利用。处理服务器,可对上述用户行为数据进行计算分析,得到带有价值权重的用户兴趣点,具体地,处理服务器包括读取模块、计算模块和分析模块,所述读取模块、计算模块和分析模块依次通过网络通信连接。其中,读取模块,该模块的数据源是预处理服务器的输出结果,即用户行为数据,该模块用以读取用户行为数据中的访问模块及资源信息和时间戳信息。计算模块,利用中文分词和TF.IDF算法,根据访问模块及资源信息,计算出代表访问资源信息主题的特征词及其权重。通过向量空间模型计算多个访问模块及资源信息之间的相似度,根据相似度认定是否为同类资源;通过聚类将同类资源聚合到一起,形成多个不同类型的知识资源信息集合。其中,T本文档来自技高网
...

【技术保护点】
1.一种知识资源库的智能推送系统,其特征在于,包括通过网络通信连接的用户端和系统端,所述系统端包括依次通信连接的知识资源库服务器、采集服务器、数据库服务器、预处理服务器、处理服务器和推送服务器,所述知识资源库服务器,用于存储知识资源数据;所述采集服务器,利用用户端和知识资源库服务器之间的网络通路,采集用户行为信息,所述用户行为信息包括用户注册时维护的个人基本信息以及用户使用过程中产生的日志文件信息;所述数据库服务器,用于储存所述用户行为信息;所述预处理服务器,用于对所述用户行为信息进行预处理形成规则有序的用户行为数据;所述处理服务器,用于对用户行为数据进行计算分析,得到带有价值权重的用户兴趣点;所述推送服务器,根据用户兴趣点的价值权重高低,与知识资源库服务器中的知识资源进行匹配,向用户端推送可聚类的信息。

【技术特征摘要】
1.一种知识资源库的智能推送系统,其特征在于,包括通过网络通信连接的用户端和系统端,所述系统端包括依次通信连接的知识资源库服务器、采集服务器、数据库服务器、预处理服务器、处理服务器和推送服务器,所述知识资源库服务器,用于存储知识资源数据;所述采集服务器,利用用户端和知识资源库服务器之间的网络通路,采集用户行为信息,所述用户行为信息包括用户注册时维护的个人基本信息以及用户使用过程中产生的日志文件信息;所述数据库服务器,用于储存所述用户行为信息;所述预处理服务器,用于对所述用户行为信息进行预处理形成规则有序的用户行为数据;所述处理服务器,用于对用户行为数据进行计算分析,得到带有价值权重的用户兴趣点;所述推送服务器,根据用户兴趣点的价值权重高低,与知识资源库服务器中的知识资源进行匹配,向用户端推送可聚类的信息。2.如权利要求1所述的知识资源库的智能推送系统,其特征在于,所述对所述用户行为信息进行预处理形成用户行为数据的过程包括,通过截取所述用户行为信息的关键字段和识别独立用户,将所述用户行为信息转化为由若干关键字段组成的用户行为数据,所述用户行为数据按照时间的先后顺序排列。3.如权利要求2所述的知识资源库的智能推...

【专利技术属性】
技术研发人员:李振凯王焕金杨祥来曹建梅
申请(专利权)人:国网技术学院国家电网有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1