一种面向文献类数字资源元数据的质量评价方法及系统技术方案

技术编号:20272338 阅读:33 留言:0更新日期:2019-02-02 03:35
本发明专利技术提供一种面向文献类数字资源元数据的质量评价方法及系统,所述方法包括:S1,根据目标文献类数字资源的自身属性,构建所述目标文献类数字资源中元数据的质量评价指标体系;S2,根据所述质量评价指标体系中的各评价指标,对各所述元数据进行各项核查;S3,根据各项核查结果对应的分数和各所述评价指标的权重,计算所述元数据的总得分。本发明专利技术实现了对面向文献类数字资源元数据的质量评价,且质量评价精度高。

【技术实现步骤摘要】
一种面向文献类数字资源元数据的质量评价方法及系统
本专利技术属于图书馆学
,更具体地,涉及一种面向文献类数字资源元数据的质量评价方法及系统。
技术介绍
随着科学技术的不断进步发展、全球信息化进程持续推进,文献类数据资源的数量和体量以前所未有的速度增长。元数据作为描述这些数据资源的重要数据,如何全面系统的检查和评价资源元数据的质量直接关乎数据后续的使用。目前对于文献类数字资源元数据的质量评价缺乏一套相对完整的、全面的、灵活的、可落地的质量评价方法,大多数现存的相关评价方法只是在理论层面进行了阐述,仅仅从分析评价的维度进行介绍,并没有给出针对文件、记录和字段属性的具体评价规则,对文献类数字资源元数据的质量评价方法的落地实施缺乏实质性的指导意义。
技术实现思路
为克服上述现有面向文献类数字资源元数据的质量评价方法只是在理论上进行阐述,无法落地实施的问题或者至少部分地解决上述问题,本专利技术提供一种面向文献类数字资源元数据的质量评价方法及系统。根据本专利技术的第一方面,提供一种面向文献类数字资源元数据的质量评价方法,包括:S1,根据目标文献类数字资源的自身属性,构建所述目标文献类数字资源中元数据的质量评价指标体系;S2,根据所述质量评价指标体系中的各评价指标,对各所述元数据进行各项核查;S3,根据各项核查结果对应的分数和各所述评价指标的权重,计算所述元数据的总得分。具体地,所述质量评价指标体系包括完整性、正确性、一致性、唯一性和时效性中的一种或多种评价指标;相应地,所述步骤S2具体包括:根据所述完整性评价指标,核查所述元数据中的数据实体是否缺失、数据文件是否缺失、数据记录是否缺失、数据结构是否缺失和记录中字段内容是否缺失中的一种或多种;根据所述正确性评价指标,核查所述元数据的合法性、有效性、是否存在乱码和是否存在统一值替代中的一种或多种;根据所述一致性评价指标,核查所述元数据的数据逻辑一致性和/或内容格式一致性;根据所述唯一性评价指标,核查所述元数据的数据记录唯一性和/或关键属性值唯一性;根据所述时效性指标,核查所述元数据的数据内容新颖性和/或链接地址有效性。具体地,所述步骤S1和S3之间还包括:根据所述自身属性所属的级别,对所述自身属性对应的元数据进行分类;相应地,所述步骤S2还包括:根据每一类所述元数据对应的评价指标,对每一类所述元数据进行核查;其中,每一类所述元数据与所述评价指标预先关联存储。具体地,根据所述自身属性所属的级别,对所述自身属性对应的元数据进行分类的步骤具体包括:根据所述自身属性所属的级别,将所述自身属性对应的元数据分为文件级元数据、记录级元数据和字段级元数据中的一种或多种。具体地,根据每一类所述元数据对应的评价指标,对每一类所述元数据进行核查的步骤具体包括:根据所述正确性、完整性和时效性评价指标,核查所述文件级元数据的文件目录合法性、文件命名合法性、文件数量完整性和文件到达及时性中的一种或多种;根据所述正确性、完整性和时效性评价指标,核查所述记录级元数据的文件分类合法性、文件位置合法性、文件命名合法性、文件数量完整性和文件生成及时性中的一种或多种;根据所述完整性、正确性、一致性、唯一性和时效性评价指标,核查所述字段级元数据的记录完整性、字段完整性、字段类型合法性、字段长度合法性、字段格式合法性、字段业务合法性、字段时效性、字段精确性、字段是否有乱码、字段是否出现统一值替代、数据逻辑一致性、内容格式一致性、记录唯一性、关键属性值唯一性、数据内容新颖性和连接地址有效性中的一种或多种。具体地,所述步骤S3还包括:根据核查结果对应的分数和各所述评价指标对应的权重,计算每一类所述元数据的得分。具体地,所述步骤S3具体包括:对于任一核查结果,该核查结果对应的分数和该核查结果对应的评价指标的权重进行相乘;将所有所述核查结果对应的相乘结果进行相加,获取所述元数据的总得分。根据本专利技术第二方面提供一种面向文献类数字资源元数据的质量评价系统,包括:构建模块,用于根据目标文献类数字资源的自身属性,构建所述目标文献类数字资源中元数据的质量评价指标体系;核查模块,用于根据所述质量评价指标体系中的各评价指标,对各所述元数据进行核查;计算模块,用于根据核查结果对应的分数和各所述评价指标的权重,计算所述元数据的总得分。根据本专利技术的第三方面,提供一种面向文献类数字资源元数据的质量评价设备,包括:至少一个处理器、至少一个存储器和总线;其中,所述处理器和存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如前所述的方法。根据本专利技术的第四方面,提供一种非暂态计算机可读存储介质,用于存储如前所述方法的计算机程序。本专利技术提供一种面向文献类数字资源元数据的质量评价方法及系统,该方法通过根据目标文献类数字资源的自身属性构建质量评价指标体系,根据所述质量评价指标体系中的各评价指标,对各元数据进行各项核查,根据核查结果计算元数据的总得分,从而实现对面向文献类数字资源元数据的质量评价,且质量评价精度高。附图说明图1为本专利技术实施例提供的面向文献类数字资源元数据的质量评价方法整体流程示意图;图2为本专利技术实施例提供的面向文献类数字资源元数据的质量评价系统整体结构示意图;图3为本专利技术实施例提供的面向文献类数字资源元数据的质量评价设备整体结构示意图。具体实施方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。在本专利技术的一个实施例中提供一种面向文献类数字资源元数据的质量评价方法,图1为本专利技术实施例提供的面向文献类数字资源元数据的质量评价方法整体流程示意图,该方法包括:S1,根据目标文献类数字资源的自身属性,构建目标文献类数字资源中元数据的质量评价指标体系;其中,目标文献类数字资源为需要进行质量评价的文献类数字资源。目标文献类数字资源的自身属性包括目标文献类数字资源的目录、命名、数量、分类和位置等。元数据又称中介数据或中继数据,为描述数据的数据,主要为描述数据属性的信息,用于支持如指示存储位置、历史数据、资料查找和文件记录等功能。质量评价指标体系包括多个用于进行质量评价的评价指标。S2,根据质量评价指标体系中的各评价指标,对各元数据进行各项核查;其中,核查是指判断目标文献类数字资源中各元数据是否达到各评价指标。核查以计算机校验核查为主,人工校验核查为辅,从而得出检验结果,输出检验报告。即通过计算机程序对根据评价指标对大部分元数据进行核查则得到初始结果,人工执行少量的检查并汇总校验结果。根据质量评价指标体系中的各评价指标,对各元数据进行各项核查。检验结果可以为目标文献类数字资源质量的改进和提升提供参考,例如在检验结果的基础上回溯目标文献类数字资源中元数据存在的问题,从而更快发现元数据的各种问题。S3,根据各项核查结果对应的分数和评价指标的权重,计算元数据的总得分。其中,每项核查结果与其对应的分数预先关联存储,每项核查结果与其对应的评价指标的权重预先关联存储,根据各项核查结果对应的分数和各评价指标的权重,计算元数据的总得分。用户根据元数据的总得分能快速区分出元数据质量的好坏。本实施例通过根据目标文献类数字资源的自身属性构建质量评本文档来自技高网...

【技术保护点】
1.一种面向文献类数字资源元数据的质量评价方法,其特征在于,包括:S1,根据目标文献类数字资源的自身属性,构建所述目标文献类数字资源中元数据的质量评价指标体系;S2,根据所述质量评价指标体系中的各评价指标,对各所述元数据进行各项核查;S3,根据各项核查结果对应的分数和各所述评价指标的权重,计算所述元数据的总得分。

【技术特征摘要】
1.一种面向文献类数字资源元数据的质量评价方法,其特征在于,包括:S1,根据目标文献类数字资源的自身属性,构建所述目标文献类数字资源中元数据的质量评价指标体系;S2,根据所述质量评价指标体系中的各评价指标,对各所述元数据进行各项核查;S3,根据各项核查结果对应的分数和各所述评价指标的权重,计算所述元数据的总得分。2.根据权利要求1所述的方法,其特征在于,所述质量评价指标体系包括完整性、正确性、一致性、唯一性和时效性中的一种或多种评价指标;相应地,所述步骤S2具体包括:根据所述完整性评价指标,核查所述元数据中的数据实体是否缺失、数据文件是否缺失、数据记录是否缺失、数据结构是否缺失和记录中字段内容是否缺失中的一种或多种;根据所述正确性评价指标,核查所述元数据的合法性、有效性、是否存在乱码和是否存在统一值替代中的一种或多种;根据所述一致性评价指标,核查所述元数据的数据逻辑一致性和/或内容格式一致性;根据所述唯一性评价指标,核查所述元数据的数据记录唯一性和/或关键属性值唯一性;根据所述时效性指标,核查所述元数据的数据内容新颖性和/或链接地址有效性。3.根据权利要求2所述的方法,其特征在于,所述步骤S1和S3之间还包括:根据所述自身属性所属的级别,对所述自身属性对应的元数据进行分类;相应地,所述步骤S2还包括:根据每一类所述元数据对应的评价指标,对每一类所述元数据进行核查;其中,每一类所述元数据与所述评价指标预先关联存储。4.根据权利要求3所述的方法,其特征在于,根据所述自身属性所属的级别,对所述自身属性对应的元数据进行分类的步骤具体包括:根据所述自身属性所属的级别,将所述自身属性对应的元数据分为文件级元数据、记录级元数据和字段级元数据中的一种或多种。5.根据权利要求4所述的方法,其特征在于,根据每一类所述元数据对应的评价指标,对每一类所述元数据进行核查的步骤具体包括:根据所述正确性、完整性和时效性评价指标,核查所述文件级元数据的文件目录合法性、...

【专利技术属性】
技术研发人员:胡中贵刘海日
申请(专利权)人:北京市天元网络技术股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1