一种基于图书馆数据的智慧大脑服务系统技术方案

技术编号:22641961 阅读:131 留言:0更新日期:2019-11-26 16:14
本发明专利技术公开一种基于图书馆数据的智慧大脑服务系统,用于解决不能对已借读者和无任何借阅进行图书资源推荐的问题;以及现有图书需要到图书馆进行归还后才能借阅以及相互转借时图书破损的赔付问题;包括数据识别模块、分类采集模块、数据处理模块、服务器、数据查询模块、用户数据采集模块、浏览器推送模块、统计存储模块、用户建模模块、资源推荐模块和借书管理模块;通过对用户的偏好值计算并结合偏好图书类别的借阅量进行个性化推荐;读者无任何借阅、浏览行为的情况下也能根据读者的年龄、性别、地域与图书借阅热度进行资源推荐;通过图书中转点进行检查,合格后,通知预约人进行借阅;减少了图书馆借书还书的工作量。

An intelligent brain service platform based on Library Data

The invention discloses an intelligent brain service platform based on library data, which is used to solve the problem of not recommending the book resources to the borrowed readers and no borrowing; as well as the compensation problem that the existing books can not be borrowed until they are returned to the library and the books are damaged when they are transferred to each other; including data identification module, classification collection module, data processing module and service The system is composed of three modules: data query module, user data collection module, browser push module, statistics storage module, user modeling module, resource recommendation module and loan management module. It can make personalized recommendation by calculating user's preference value and combining with the loan amount of preferred book category. The reader can also make personalized recommendation according to the age, gender and place of the reader without any borrowing and browsing behaviors Domain and book borrowing popularity recommend resources; through the book transfer point for inspection, after qualified, notify the appointment person to borrow; reduce the workload of library borrowing and returning books.

【技术实现步骤摘要】
一种基于图书馆数据的智慧大脑服务平台
本专利技术涉及图书馆数据管理
,尤其涉及一种基于图书馆数据的智慧大脑服务平台。
技术介绍
在传统图书馆信息化系统的建设中,各系统之间数据不进行交互、数据存在孤岛问题;决策者查看无法通过一个平台进行实时的检索、浏览、提取到整合后的一致的数据。对于读者,则无法享受图书馆海量数据带来的智慧服务;在专利为“CN107819886A一种智能云平台图书馆”虽然采用大数据技术管理图书馆的图书资源,进行资源发现、资源存储、资源组织、资源检索;但存在的不足是:不能对无任何借阅、浏览行为的情况下的读者进行图书推荐以及无法通过手机终端归还图书的问题。
技术实现思路
本专利技术的目的在于提供一种基于图书馆数据的智慧大脑服务平台;本专利技术资源推荐模块用于根据读者偏好图书类别及对应的偏好值对用户进行图书推荐;通过对用户的偏好值计算并结合偏好图书类别的借阅量进行个性化推荐;在读者无任何借阅、浏览行为的情况下也能根据读者的年龄、性别、地域与图书借阅热度进行资源推荐;借书管理模块用于用户进行借书管理,当用户借书有预约者预约时,通过计算最短距离选取图书中转点,然后通过图书中转点进行检查,合格后,通知预约人进行借阅;减少了图书馆借书还书的工作量;当图书没有预约者,则借阅人直接将图书归还至对应的图书馆。本专利技术所要解决的技术问题为:(1)如何通过采集读者历史借阅图书数据,并对读者建立读者偏好模型,获得读者的偏好值以及对应的图书类别,然后根据获得的图书类别选中热度大的图书推荐给读者;对无任何借阅、浏览行为的读者,根据其年龄、性别和地域进行筛选;选中热度大的图书推荐给读者;解决了不能对已借读者和无任何借阅进行图书资源推荐的问题;(2)如何根据已借图书和预约图书选取图书中转点;通过图书中转点进行图书检查和转借,解决了现有图书需要到图书馆进行归还后才能借阅以及相互转借时图书破损的赔付问题;本专利技术的目的可以通过以下技术方案实现:一种基于图书馆数据的智慧大脑服务平台,包括数据识别模块、分类采集模块、数据处理模块、服务器、数据查询模块、用户数据采集模块、浏览器推送模块、统计存储模块、用户建模模块、资源推荐模块和借书管理模块;所述数据识别模块用于采集并识别存储图书数据的数据库类型和网页数据;数据库类型包括Oracle数据库和MySQL数据库;网页数据为通过网页检索或点击的图书数据;图书数据包括图书的书名、作者、印刷厂家、图书内容、图书存储对应的图书馆、图书馆位置及图书在图书馆内的存放类别和图书电子标签ID;所述数据识别模块将采集并识别存储图书数据的数据库类型和网页数据发送至分类采集模块;所述分类采集模块用于对图书数据进行分类采集,具体分类采集步骤如下:步骤一:当接收的图书数据的数据库类型为Oracle数据库,则通过CDC采集方式对Oracle数据库内有DML操作的图书数据进行增量采集;其中CDC为变动数据捕获;步骤二:当接收到图书数据的据库类型为MySQL数据库,则通过解析Binlog方式对MySQL数据库内有DML操作的图书数据进行增量采集;其中Binlog为二进制日志;步骤三:当接收的图书数据为网页数据,则通过嵌入JS进行埋点采集;其中JS为脚本语言JavaScript的缩写;所述分离采集模块将分离采集的图书数据发送至数据处理模块;数据处理模块对接收的图书数据进行数据清洗、转换、规约和降维整理并将整理后的图书数据发送至服务器;服务器依据图书在图书在图书馆内的存放类别进行分类存储;所述数据查询模块用于用户输入待查看图书数据的查询文字并对查询文字通过词性标注、句法分析和信息抽取手段识别并产生查询关键词和查询动作;查询动作用于根据查询关键词对服务器内图书数据进行检索并将检索的图书数据发送至用户查询终端进行显示;所述用户数据采集模块用于采集读者信息;读者信息包括读者通过用户查询终端检索的图书数据的历史记录、借阅图书书名、对应的借还次数及借还间隔时间和读者基础数据;历史记录为用户查询的图书数据的记录;读者基础数据包括读者的姓名、年龄、性别、地域、办证日期、开户馆和开户工作人员编码;用户采集模块将采集的读者信息发送至服务器内存储;所述统计存储模块用于统计服务器内存储图书数据访问次数、图书的借阅次数和对应访问借阅的读者基础数据;所述用户建模信息用于获取服务器内存储的读者信息并对用户建立读者偏好模型,具体步骤为:步骤一:将图书标记为BKi,i=1、……、n;图书对应的类别标记为LjBKi;j=1、……、n;图书对应的借还次数标记为PBKi;借还间隔时间标记为TBKi;步骤二:将读者数据检索的图书数据的历史记录和借阅图书书名与图书对应的图书类别进行匹配,获取图书类别并标记为读者偏好图书类别并标记为HjBKi;步骤三:统计读者偏好图书类别内的对应的图书数量记为MHj;步骤四:利用公式获取得到用户对应的读者偏好图书类别的偏好值XHj;其中,v1、v2为预设比例系数,ρ为修正系数,取值为0.43198237;所述用户建模模块将用户的读者偏好图书类别及对应的偏好值发送至资源推荐模块;所述资源推荐模块用于根据读者偏好图书类别及对应的偏好值对用户进行图书推荐。优选的,所述资源推荐模块的图书推荐具体步骤为:S1:对有偏好值的用户进行图书推荐,推荐过程如下:a:依据读者偏好图书类别和偏好值选取偏好值最大的读者偏好图书类别;并将其与图书类别进行匹配,得到对应的图书类别;b:对所有的图书名称筛选,去除与读者数据检索的图书数据的历史记录相同的图书名称;并将筛选后的推书名称标记为待推荐图书名称;c:获取待推荐图书名称对应的图书数据访问次数和图书的借阅次数;设定待推荐图书标记为Wk;k=1、……、n;对应的访问次数记为PWk;图书的借阅次数JYWk;d:利用公式TJWk=PWk*h1+PWk*h2获取得到待推荐图书的推荐值TJWk;其中,h1、h2为预设比例系数;e:将待推荐图书依据推荐值由大到小进行排序;筛选出推荐值在前五的图书名称并将其标记为选中推荐图书;将选中推荐图书发送至用户的终端;S2:对无偏好值的用户进行图书推荐,推荐过程如下:a1:获取统计模块统计服务器内存储图书数据访问次数、图书的借阅次数和对应访问借阅的读者基础数据以及无偏好值用户的读者基础数据;a2:将无偏好值用户的读者基础数据与服务器内图书对应访问借阅的读者基础数据进行筛选;a3:依照无偏好值用户的年龄进行筛选,当图书对应访问借阅的读者基础数据内包含无偏好值用户的年龄,则将该图书标记为初选推荐图书;a4:依照无偏好值用户的地域对初选推荐图书进行筛选;当初选推荐图书对应的读者基础数据内包含无偏好值用户的地域,则将该初选推荐图书标记为次选推荐图书;a5:依照无偏好值用户的性别对次选推荐图书进行筛选;当次选推荐图书对应访问借阅的读者基础数据内包含无偏好值用户的性别,则将该图书标记为优选推荐图本文档来自技高网...

【技术保护点】
1.一种基于图书馆数据的智慧大脑服务平台,其特征在于,包括数据识别模块、分类采集模块、数据处理模块、服务器、数据查询模块、用户数据采集模块、浏览器推送模块、统计存储模块、用户建模模块、资源推荐模块和借书管理模块;/n所述数据识别模块用于采集并识别存储图书数据的数据库类型和网页数据;数据库类型包括Oracle数据库和MySQL数据库;网页数据为通过网页检索或点击的图书数据;图书数据包括图书的书名、作者、印刷厂家、图书内容、图书存储对应的图书馆、图书馆位置及图书在图书馆内的存放类别和图书电子标签ID;所述数据识别模块将采集并识别存储图书数据的数据库类型和网页数据发送至分类采集模块;所述分类采集模块用于对图书数据进行分类采集,具体分类采集步骤如下:/n步骤一:当接收的图书数据的数据库类型为Oracle数据库,则通过CDC采集方式对Oracle数据库内有DML操作的图书数据进行增量采集;其中CDC为变动数据捕获;/n步骤二:当接收到图书数据的据库类型为MySQL数据库,则通过解析Binlog方式对MySQL数据库内有DML操作的图书数据进行增量采集;其中Binlog为二进制日志;/n步骤三:当接收的图书数据为网页数据,则通过嵌入JS进行埋点采集;其中JS为脚本语言JavaScript的缩写;/n所述分离采集模块将分离采集的图书数据发送至数据处理模块;数据处理模块对接收的图书数据进行数据清洗、转换、规约和降维整理并将整理后的图书数据发送至服务器;服务器依据图书在图书在图书馆内的存放类别进行分类存储;/n所述数据查询模块用于用户输入待查看图书数据的查询文字并对查询文字通过词性标注、句法分析和信息抽取手段识别并产生查询关键词和查询动作;查询动作用于根据查询关键词对服务器内图书数据进行检索并将检索的图书数据发送至用户查询终端进行显示;/n所述用户数据采集模块用于采集读者信息;读者信息包括读者通过用户查询终端检索的图书数据的历史记录、借阅图书书名、对应的借还次数及借还间隔时间和读者基础数据;历史记录为用户查询的图书数据的记录;读者基础数据包括读者的姓名、年龄、性别、地域、办证日期、开户馆和开户工作人员编码;用户采集模块将采集的读者信息发送至服务器内存储;所述统计存储模块用于统计服务器内存储图书数据访问次数、图书的借阅次数和对应访问借阅的读者基础数据;所述用户建模信息用于获取服务器内存储的读者信息并对用户建立读者偏好模型,具体步骤为:/n步骤一:将图书标记为BKi,i=1、……、n;将图书BKi对应的类别标记为Lj...

【技术特征摘要】
1.一种基于图书馆数据的智慧大脑服务平台,其特征在于,包括数据识别模块、分类采集模块、数据处理模块、服务器、数据查询模块、用户数据采集模块、浏览器推送模块、统计存储模块、用户建模模块、资源推荐模块和借书管理模块;
所述数据识别模块用于采集并识别存储图书数据的数据库类型和网页数据;数据库类型包括Oracle数据库和MySQL数据库;网页数据为通过网页检索或点击的图书数据;图书数据包括图书的书名、作者、印刷厂家、图书内容、图书存储对应的图书馆、图书馆位置及图书在图书馆内的存放类别和图书电子标签ID;所述数据识别模块将采集并识别存储图书数据的数据库类型和网页数据发送至分类采集模块;所述分类采集模块用于对图书数据进行分类采集,具体分类采集步骤如下:
步骤一:当接收的图书数据的数据库类型为Oracle数据库,则通过CDC采集方式对Oracle数据库内有DML操作的图书数据进行增量采集;其中CDC为变动数据捕获;
步骤二:当接收到图书数据的据库类型为MySQL数据库,则通过解析Binlog方式对MySQL数据库内有DML操作的图书数据进行增量采集;其中Binlog为二进制日志;
步骤三:当接收的图书数据为网页数据,则通过嵌入JS进行埋点采集;其中JS为脚本语言JavaScript的缩写;
所述分离采集模块将分离采集的图书数据发送至数据处理模块;数据处理模块对接收的图书数据进行数据清洗、转换、规约和降维整理并将整理后的图书数据发送至服务器;服务器依据图书在图书在图书馆内的存放类别进行分类存储;
所述数据查询模块用于用户输入待查看图书数据的查询文字并对查询文字通过词性标注、句法分析和信息抽取手段识别并产生查询关键词和查询动作;查询动作用于根据查询关键词对服务器内图书数据进行检索并将检索的图书数据发送至用户查询终端进行显示;
所述用户数据采集模块用于采集读者信息;读者信息包括读者通过用户查询终端检索的图书数据的历史记录、借阅图书书名、对应的借还次数及借还间隔时间和读者基础数据;历史记录为用户查询的图书数据的记录;读者基础数据包括读者的姓名、年龄、性别、地域、办证日期、开户馆和开户工作人员编码;用户采集模块将采集的读者信息发送至服务器内存储;所述统计存储模块用于统计服务器内存储图书数据访问次数、图书的借阅次数和对应访问借阅的读者基础数据;所述用户建模信息用于获取服务器内存储的读者信息并对用户建立读者偏好模型,具体步骤为:
步骤一:将图书标记为BKi,i=1、……、n;将图书BKi对应的类别标记为LjBKi;j=1、……、n;图书对应的借还次数标记为PBKi;借还间隔时间标记为TBKi;
步骤二:将读者数据检索的图书数据的历史记录和借阅图书书名与图书对应的图书类别进行匹配,获取图书类别并标记为读者偏好图书类别并标记为HjBKi;
步骤三:统计读者偏好图书类别内的对应的图书数量记为MHj;
步骤四:利用公式获取得到用户对应的读者偏好图书类别的偏好值XHj;其中,v1、v2为预设比例系数,ρ为修正系数,取值为0.43198237;
所述用户建模模块将用户的读者偏好图书类别及对应的偏好值发送至资源推荐模块;所述资源推荐模块用于根据读者偏好图书类别及对应的偏好值对用户进行图书推荐。


2.根据权利要求1所述的一种基于图书馆数据的智慧大脑服务平台,其特征在于,所述资源推荐模块的图书推荐具体步骤为:
S1:对有偏好值的用户进行图书推荐,推荐过程如下:
a:依据读者偏好图书类别和偏好值选取偏好值最大的读者偏好图书类别;并将其与图书类别进行匹配,得到对应的图书类别;
b:对所有的图书名称筛选,去除与读者数据检索的图书数据的历史记录相同的图书名称;并将筛选后的推书名称标记为待推荐图书名称;
c:获取待推荐图书名称对应的图书数据访问次数和图书的借阅次数;设定待推荐图书标记为Wk;...

【专利技术属性】
技术研发人员:张劲松刘海生王骢雷超林吴健飞王浩
申请(专利权)人:广州图创计算机软件开发有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1