中医药古文献数据库制造技术

技术编号:2855886 阅读:771 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种中医药古文献数据库。它通过计算机存储有专题数据库、原籍文献数据库、标引数据库和原籍图像数据库;原籍文献数据库、标引数据库均依据目录学原理进行分级,不同级别的目录内容存放在相应级别的字段中,内容用分段形式存放在最末级。本发明专利技术将不同文体、不同结构的文献都能被容纳在一个数据库中,同库存储同库检索,便于文献的管理和利用,为数据库的设计提供了一个崭新的思路,极大的方便设计者和用户。所建立的中医药古文献数据库具有编辑、分类和储存功能;具备分类和全文查询检索、后控检索、语义检索等功能。

【技术实现步骤摘要】

本专利技术涉及一种中医药古文献数据库,特别涉及一种将不同文体、不同结构的文献都能被容纳在一起的中医药古文献数据库。
技术介绍
在我国丰富的古典文献宝库中,中医药古文献是一朵奇葩,是中华民族的骄傲,其价值越来越受到世界各国的重视。近年来,文献工作者做了大量的工作,将部分中医药古文献进行了整理、分类、翻译、录入等大量数字化工作,制作了众多的专题数据库。但由于古典文献浩若云烟,不可能将所有的古典文献都进行人工整理。因此,如何利用一种简便易行的方法,将古典文献转化成成可以进行科学化管理的检索数据库,是近年来文献工作者的重大课题。
技术实现思路
本专利技术为了克服以上技术的不足,提供一种检索方便、内容齐全、可以将不同文体、不同结构的文献都能被容纳在一起的中医药古文献数据库。本专利技术是通过以下措施来实现的本专利技术的中医药古文献数据库,通过计算机存储有整理得非常完整的专题数据库、未加工整理的原籍文献数据库、对古文献进行了标引的标引数据库和以图片形式存在的原籍图像数据库;上述四种数据库除专题、原籍图像数据库外,原籍文献数据库、标引数据库均依据目录学原理进行分级,不同级别的目录内容存放在相应级别的字段中,内容用分段形式存放在最末级。本专利技术的中医药古文献数据库,一般分为九级,内容存放在第九级中。本专利技术的中医药古文献数据库,专题数据库、原籍文献数据库、标引数据库的内容采用文本形式进行存放,原籍图像数据库的内容采用图像形式进行存放。中医药古文献数据库是中医药文献之集大成者,其设计必须充分考虑中医药文献的研究现状,以便有效利用现有成果。从20世纪80年代开始,文献工作者已经作了大量的数字化整理工作,所以在中医古文献检索系统的研究时,还要考虑如何利用已经整理好的古文献。因此,本专利技术的建库方法根据古文献整理的情况来划分数据类型,对不同的数据采取不同的建库方法。目前,中医古文献一般分为以下四大类未加工整理的为原籍文献数据,整理得非常完整的为专题数据,对古文献进行了标引的为标引数据,还有部分数据是以图片形式存在的称为原籍图像数据。中医古文献数据库的研究主要是从古文献的存储及检索两方面进行研究。存储方面,主要如何设计数据库才能满足古文献的特点。在四类数据中原籍文献数据库结构的设计成为一个难点,因为原籍文献的体裁是多种多样的,如何将不同体裁的文献以相同数据库结构存储并实现统一检索是比较困难的。经过研究发现,原籍文献虽然体裁是多样的,但从目录学角度来看,无论什么样的体裁都有清晰明确的目录级别,所以数据库设计时,打破常规的以文献内容划分字段的数据库设计模式,而改为以目录级别来划分数据库结构,这种数据库结构能把古文献中所有文体的文献都能存储在一个数据库中。因此,本专利技术的中医古文献数据库是以专题数据库、原籍文献数据库、标引数据库、原籍图像数据库四种类型的数据库为基础,又在各类数据库中按照数据的内容进行了详细的划分。在数据库分类形式确定下来以后,就要考虑详细的数据库结构设计了。数据库结构设计时既要考虑数据库系统自身的一些要求,又要考虑中医古文献的特点,还要考虑如何能使数据库具有一定的开放性。专题数据库结构在设计起来相对来说还是比较简单一些的,因为仅有的一些中医古文献检索系统都是建立在专题数据库基础上的。这样在设计专题数据库结构时就有了一些可参考的对象。可以用方剂这个专题数据库举例说明,方剂专题中共14个字段,分别是方名、来源、异名、组成、用法、功用、主治、宜忌、加减、方论、临症举例、现代研究、备考,选择这些内容作为数据库中的字段的原因有两个,其一因为现在的一些整理好的方剂专题数据库基本上就是以这些内容作为字段名的,为了与这些数据库保持一定的兼容性,所以采用了这样的数据库结构。另外一个原因就是,通过这样的数据库结构已经完全能够将方剂这类资源所具有的特性全部包含进来,能够满足数据的需要。在专题数据库中其它内容的数据库表结构也是根据上面两个原则建立的。原籍文献数据库在设计起来有些困难,这些文献除了内容可以进行分类外,每一部文献与其它文献基本上共同点很少了。这是因为,古文献文体的多样性造成的。如何将这些文献用一个比较统一的数据库结构来表示呢?成为中医古文献数据库设计的一个难点。这些文献文体多样,内容丰富。从文献本身的机构上看,有些是以卷、分卷划分文献结构,有些是以部、分部,或者章节来进行划分。根据文体不同,有些在文章的开篇会有一个跋或序,有些直接进入正文。虽然这些古籍文献文体结构多种多样,但还是有一点是共通性的,就是文章的目录结构。无论什么结构的文体,从目录角度上来分析,都会有一级标题,二级标题,……,一直到内容。即便是诗歌,也会有这样的特点,只是诗歌只有一个一级标题——题目。所以原籍文献数据库就可以根据古籍文献的目录结构来设计数据库结构了。因此,在原籍文献数据库中的目录结构是这样的一级、二级、三级、四级、五级、六级、七级、八级、九级。根据古籍文献专家的分析,这九个目录级别已经满足了古籍文献目录结构的需要了。有了这样的数据库结构,在存放数据时,不同级别的目录内容会存放在相应级别的字段中,内容则存放在“九级”这个字段中了。原籍文献数据库的这一设计思想,打破了常规的依照内容分类为标准的数据库设计思想,使得不同文体、不同结构的文献都能被容纳在一个数据库中,便于文献的管理和利用,为数据库的设计(特别是资料性数据库)提供了一个崭新的思路,极大的方便设计者和用户。标引数据库和原籍图像数据库的建库方法与原籍文献数据库的建库方法基本相同。本专利技术的中医药古文献数据库具有以下优点1.具有中医药古文献的编辑、分类和储存功能采用C/B和B/S方式建立动态的分类文献输入模式。2.实现了不同文体、不同结构的文献的同库存储与检索。3.具备分类和全文查询检索功能。4.采用先进技术实现语义检索,提高查准和查全率。5.实现了后控检索,提供了扩检和缩检功能。6.实现了自然段显示、摘要显示两种显示方式。7.实现了原始文档的自动入库,去除了繁重的人工标引。附图说明附图为本专利技术的中医药古文献数据库的关系结构图具体实施方式下面对本专利技术的中医药古文献数据库作具体的说明。本专利技术的数据库按专题数据库、原籍文献数据库、标引数据库、原籍图像数据库四种类型的数据库,采用C/B和B/S方式建立动态的分类文献输入模式,分别进行建库。使用PHP语言编写Mysql数据库以存放文献数据,使用cbs语言编写ODI数据库,并在二者之间建立ODBC映射,将Mysql数据库与ODI数据库链接起来。通过检索ODI数据库,实现对中医药古文献的检索功能。另外,入库程序将未加工整理的原藉文献数据库按目录进行分级,不同级别的目录内容存放在相应级别的字段中。如图所示。专题数据库以期刊数据库为例建库,分为期刊名称、总期刊号、年期号、作者、标题、正文等分段名,利用计算机程序进行分级建库。如表1所示。表1 原籍图像数据库的建库方法为分为题名及说明、成书年代、异名、主要责任者、起始页、终止页、版本信息、附录、位置级别等分段名,利用计算机程序进行分级建库。如表2所示。表2 原籍文献数据库的建库方法为将原藉文献数据库按目录分为九级,不同级别的目录内容存放在相应级别的字段中,内容分段存放在第九级,按利用计算机程序进行分级建库。如表3所示。表3 标引数据库本文档来自技高网...

【技术保护点】
一种中医药古文献数据库,其特征在于:通过计算机存储有整理得非常完整的专题数据库、未加工整理的原籍文献数据库、对古文献进行了标引的标引数据库和以图片形式存在的原籍图像数据库;原籍文献数据库、标引数据库均依据目录学原理进行分级,不同级别的目录内容存放在相应级别的字段中,内容用分段形式存放在最末级。

【技术特征摘要】

【专利技术属性】
技术研发人员:王振国刘耀
申请(专利权)人:山东中医药大学
类型:发明
国别省市:88[中国|济南]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1