一种高校数字图书馆数据挖掘的方法技术

技术编号:17363761 阅读:66 留言:0更新日期:2018-02-28 13:53
本发明专利技术实施例提供的一种高校数字图书馆数据挖的方法,针对高校学生数量多,学校系统繁多且复杂,每个单独的子系统都有自己的数据储存数据库这些信息被封闭在各自的子系统中,子系统数据库之间不能交互,信息不能共享,只能提供简单的查询、添加、修改、删除和统计功能,成为了名副其实的信息孤岛、应用孤岛,导致学校的资源严重浪费,得不到有效的合理运用等问题。本发明专利技术的一个目的是要提供一种高校数字图书馆数据挖的方法,避免了上述问题,利用数字图书馆中产生的大量借阅相关数据,从中挖掘出我们感兴趣的有用信息,为教学管理和优化资源配置提供决策依据。

A method of data mining in the digital library of colleges and Universities

A method of digital library data provided by the embodiment of the invention for digging, the number of college students, the school system is various and complicated, each subsystem has its own data storage database this information is enclosed in the respective subsystem, subsystem data not interaction between libraries, information can not be shared. Can only provide simple query, add, modify, delete and statistics function, become worthy of the name information island, application Island, the school caused a serious waste of resources, lack of effective and reasonable use of such problems. An object of the present invention is to provide a method of data digging of University Digital Library, to avoid the above problem, the use of a large number of related lending data generated in the digital library, dig out the useful information we are interested in, offer the decision basis for teaching management and optimize the allocation of resources.

【技术实现步骤摘要】
一种高校数字图书馆数据挖掘的方法
本专利技术涉及图书馆数据搜索领域,特别是涉及一种高校数字图书馆数据挖掘的方法。
技术介绍
计算机科学的飞速发展,特别是数据库技术和网络技术的长足进步,使得人们获取信息和传播信息的途径越来越广泛、速度越来越快、方式越来越多样化,条形码技术和信用卡的大量使用,导致商业、保险、金融等相关领域的信息化进程加速,整个世界仿佛一夜之间进入一个完全不同的新鲜信息时代。随着信息技术的发展,需要存储和传播的信息量越来越大,信息的形式和种类越来越丰富,传统图书馆的机制显然不能满足这些需要。因此,人们提出了数字图书馆的设想。数字图书馆是一个电子化信息的仓储,能够存储大量各种形式的信息,用户可以通过网络方便地访问它,以获得这些信息,并且其信息存储和用户访问不受地域限制。数据挖掘技术在盈利性的各种商业中应用相对广泛,但在非盈利性质的教育领域应用却极为贫乏。教育信息化是我国信息化工程的不可或缺重要一环,也是现代化教育的必经之路。目前我国已经建成并投入使用的教育与科研网、国家卫星宽带远程教育网络、高校“数字化校园”建设工程以及普通初级学校的“校校通”信息工程都是我国教育信息化的重要内容。高校是教育领域的重中之重,数字化校园的建设作用可见一斑。数字化校园的发展,不可避免的也带来了“信息海量,知识寥寥”的困境,如何好好利用这些信息成为必须面对的现实问题。数据挖掘技术能够方便快捷且有效率的从浩瀚的数字化校园信息中提取出隐含的有用信息,提供给决策者作为决策依据,不单单具有理论意义,更对教育领域的信息化建设具有重要现实作用。因此需要一种高校数字图书馆数据挖的方法,可以利用数字图书馆中产生的大量借阅相关数据获得感兴趣的信息,为教学学管理和优化资源配置提供决策依据。
技术实现思路
本专利技术的一个目的是要提供一种高校数字图书馆数据挖的方法,利用数字图书馆中产生的大量借阅相关数据,从中挖掘出我们感兴趣的有用信息,为教学管理和优化资源配置提供决策依据。一种高校数字图书馆数据挖的方法,所述方法包括:步骤S101:获得图书馆借阅历史的信息库数据;步骤S102:预处理数据;步骤S103:挖掘数据;步骤S104:存入关联数据库;步骤S105:输出图书推荐信息。具体地,步骤S101:获得图书馆借阅历史的信息库数据;其中所述信息库包括读者信息库和图书信息库。具体地,所述读者信息库数据包括:读者的类别、读者的年龄、读者的专业以及读者的爱好兴趣。具体地,所述图书信息库数据包括:图书的索书号、图书的条形码、图书的书名、图书的出版社、图书的出版日期、以及图书的作者。具体地,步骤S102:预处理数据;包括将具有不同格式、不同来源、不同的地理位置、特性不同的数据在物理上或者逻辑上整合到一起,形成一个统一规范化的数据集合。具体地,步骤S102:预处理数据;包括将错误和纰漏的数据进行清楚。具体地,步骤S102:预处理数据;还包括统一规格化处理所有数据,发现数据的共同特征,然后找到一个合适的描述方法对数据进行规约转化。具体地,步骤S103:挖掘数据;包括采用分组Apriori算法进行挖掘。通过以上技术方案可知:本专利技术实施例提供的一种高校数字图书馆数据挖的方法,针对高校学生数量多,学校系统繁多且复杂,每个单独的子系统都有自己的数据储存数据库这些信息被封闭在各自的子系统中,子系统数据库之间不能交互,信息不能共享,只能提供简单的查询、添加、修改、删除和统计功能,成为了名副其实的信息孤岛、应用孤岛,导致学校的资源严重浪费,得不到有效的合理运用等问题。本专利技术的一个目的是要提供一种高校数字图书馆数据挖的方法,避免了上述问题,利用数字图书馆中产生的大量借阅相关数据,从中挖掘出我们感兴趣的有用信息,为教学管理和优化资源配置提供决策依据。附图说明后文将参照附图以示例性而非限制性的方式详细描述本专利技术的一些具体实施例。附图中相同的附图标记标示了相同或类似的部件或部分。本领域技术人员应该理解,这些附图未必是按比例绘制的。附图中:图1为本专利技术实施例的一种高校数字图书馆数据挖的方法流程图。具体实施方式传统的读者借阅书刊的过程大体如下:读者登陆图书借阅系统,在不知道具体的借阅书目的情况下(这种情况大多是指,虽然心里已经有借阅方向,但对具体的借阅书目并没有确定下来),通过浏览图书馆主页,可能查找最近一段的借阅书目排行榜,或者浏览图书馆最新上架的新书等等途径来确定最终要借阅的书目,然后登陆图书馆的图书检索系统,填写借书单,完成图书借阅;另外一种情况是已经有很明确的借阅图书,直接登陆图书馆的图书检索系统,然后填写借书单,就可以完成借阅图书。仔细分析图书借阅过程,很容易就可以发现读者大多时候在其中大多环节都具有不确定性,如果在此时及时的给读者合适的推荐,这样不但能够快速的辅助确定读者的需求,减少了无谓的漫无目的的查询过程所浪费的时间,而且整个过程仿佛有专人陪同,给读者更好的互动体验。本下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1,为本申请实施例一种高校数字图书馆数据挖的方法流程图;步骤S101:获得图书馆借阅历史的信息库数据;步骤S102:预处理数据;将各种格式、各种来源、各种地理位置、各种特性的数据在物理上或者逻辑上整合到一起,形成一个统一规范化的数据集合。步骤S103:挖掘数据;需要说明的是,数据挖掘具有以下特征:一、数据源必须是海量的真实的原始应用数据;这些真实的应用数据数量级别相当大,并且有很多是不完整的模糊的数据项,甚至同样也有错误的项(有噪声),这就需要在数据挖掘的过程中,进行数据预处理;二、数据挖掘的目的是为了发现潜在的有实际利用价值的知识。数据挖掘的目的是为了方便人们发现隐藏的知识,所挖掘出来的知识应该容易被人们理解并被应用。三、数据挖掘具有针对性。尽管数据挖掘的方法是多种多样的,数据挖掘往往是针对某一特定问题进行分析研究,所挖掘出来的知识是特定具体的。步骤S104:存入关联数据库;步骤S105:输出图书推荐信息。获得读者感兴趣的图书。进一步地,步骤S101:获得图书馆借阅历史的信息库数据;其中所述信息库包括读者信息库和图书信息库。进一步地,所述读者信息库数据包括:读者的类别、读者的年龄、读者的专业以及读者的爱好兴趣。每一个到图书馆发生借阅行为的读者或者是借助公共检索系统查询浏览的读者,都是潜在的服务对象,可以对他们进行个性化推荐服务。这些潜在的服务对象,有不同的专属类别(本科生、硕士研究生、博士研究生、教师、科研人员、管理人员、普通教职工等),他们具有不同的类别属性。进一步地,所述图书信息库数据包括:图书的索书号、图书的条形码、图书的书名、图书的出版社、图书的出版日期、以及图书的作者。进一步地,步骤S102:预处理数据;包括将具有不同格式、不同来源、不同的地理位置、特性不同的数据在物理上或者逻辑上整合到一起,形成一个统一规范化的数据集合。进一步地,步骤S102:预处理数据;包括将错误和纰漏的数据进行清楚。从数据源中得到的原始数据难免会存在这本文档来自技高网
...
一种高校数字图书馆数据挖掘的方法

【技术保护点】
一种高校数字图书馆数据挖倔的方法,其特征在于,所述方法包括:步骤S101:获得图书馆借阅历史的信息库数据;步骤S102:预处理数据;步骤S103:挖掘数据;步骤S104:存入关联数据库;步骤S105:输出图书推荐信息。

【技术特征摘要】
1.一种高校数字图书馆数据挖倔的方法,其特征在于,所述方法包括:步骤S101:获得图书馆借阅历史的信息库数据;步骤S102:预处理数据;步骤S103:挖掘数据;步骤S104:存入关联数据库;步骤S105:输出图书推荐信息。2.根据权利要求1所述的方法,其特征在于,步骤S101:获得图书馆借阅历史的信息库数据;其中所述信息库包括读者信息库和图书信息库。3.根据权利要求2所述的方法,其特征在于,所述读者信息库数据包括:读者的类别、读者的年龄、读者的专业以及读者的爱好兴趣。4.根据权利要求2所述的方法,其特征在于,所述图书信息库数据包括:图书的索书号、图书的条形码、图书的书名、图书的出版社...

【专利技术属性】
技术研发人员:崔垒
申请(专利权)人:佛山市章扬科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1