The invention provides a cataloguing method, device, electronic equipment and storage medium of information resources, which includes acquiring information of resources to be catalogued and acquiring information of multiple sample resources, in which each sample resource information is pre-stored in the form of a vector, which is used to describe the elements contained in the corresponding sample resource information, and the information of resources to be catalogued is trusted with each sample resource information separately. The corresponding vectors of information are matched, and the catalog information corresponding to the resource information to be catalogued is generated according to the matched results. The invention can automatically generate catalogue information needed for cataloguing resource information, improve the accuracy of catalogue information generation and improve the cataloguing effect.
【技术实现步骤摘要】
信息资源的编目方法、装置、电子设备及存储介质
本专利技术涉及编目
,尤其涉及一种信息资源的编目方法、编目装置、电子设备及非临时性计算机可读存储介质。
技术介绍
信息资源目录是通过对信息资源依据规范的元数据描述,按照一定的分类方法进行排序和编码的一组信息,用于描述各个信息资源的特征,以便于对信息资源的检索、定位与获取。信息资源目录是实现信息资源共享、业务协同和数据开放的基础,是各行业用户之间信息共享及部门数据向社会开放的依据。信息资源目录编制工作包括对行业信息资源的分类、元数据描述、代码规划和目录编制,以及相关工作的组织、流程、要求等方面的内容。相关技术中的目录编制方式包括目录的在线注册及目录导入两种:在线注册:部门编目人员登录到目录管理系统,根据编目要求,在线手工录入信息资源的描述信息,并提交审核。目录导入:部门编目人员线下根据模板,填入对应的信息资源描述信息,模板一般支持填多个信息资源目录,然后登录到目录管理系统,手工导入根据模板填写的编目文档。上述方式下,均需要目录编制人员逐条录入编制信息,而目录编制是个长期持续的任务,无疑添加了不少人力成本,信息资源的编目不够精准,编目效果不佳。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的目的在于提出一种信息资源的编目方法、装置、存储介质及电子设备,能够实现自动化地生成对待编目资源信息编目所需要的目录信息,提升目录信息生成的精准度,提升编目效果。为达到上述目的,本专利技术第一方面实施例提出的信息资源的编目方法,包括:获取待编目资源信息,并获取多个样本资源信息,其中, ...
【技术保护点】
1.一种信息资源的编目方法,其特征在于,包括以下步骤:获取待编目资源信息,并获取多个样本资源信息,其中,各所述样本资源信息以向量形式预先被存储,所述向量用于描述对应样本资源信息所包含的元素;将所述待编目资源信息分别与各所述样本资源信息对应的向量进行匹配;根据匹配得到的结果生成所述待编目资源信息对应的目录信息。
【技术特征摘要】
1.一种信息资源的编目方法,其特征在于,包括以下步骤:获取待编目资源信息,并获取多个样本资源信息,其中,各所述样本资源信息以向量形式预先被存储,所述向量用于描述对应样本资源信息所包含的元素;将所述待编目资源信息分别与各所述样本资源信息对应的向量进行匹配;根据匹配得到的结果生成所述待编目资源信息对应的目录信息。2.如权利要求1所述的信息资源的编目方法,其特征在于,所述待编目资源信息包括:数据表信息、文件信息,以及调研表信息,其中,所述调研表信息用于描述各用户共享的资源信息以及生成所述编目需要获取的资源信息,所述样本资源信息包括:样本库信息、词库信息、标准数据元信息、标准表信息,以及标签信息,所述获取多个样本资源信息,包括:根据所述需要获取的资源信息,从样本库中获取所述样本资源信息。3.如权利要求2所述的信息资源的编目方法,其特征在于,在所述获取待编目资源信息之后,还包括:调用外部服务接口分别分解所述数据表信息、文件信息,以及调研表信息得到资源名称和字段。4.如权利要求3所述的信息资源的编目方法,其特征在于,所述将所述待编目资源信息分别与各所述样本资源信息对应的向量进行匹配,包括:将分解得到的所述资源名称,与所述词库信息对应的向量进行匹配,并根据匹配得到的结果生成标准化资源名称;根据所述标准化资源名称和标准化字段,从所述样本库信息和所述标签信息对应的向量中匹配出生成所述目录信息所需要的样本目录信息;根据所述样本目录信息,结合分解得到的所述字段和所述标准数据元信息对应的向量中匹配出标准化数据元;根据所述标准化数据元,从所述标准表信息对应的向量中匹配出标准数据表,并将所述标准化数据元与所述标准数据表进行关联。5.如权利要求4所述的信息资源的编目方法,其特征在于,所述根据匹配得到的结果生成所述待编目资源信息对应的目录信息,包括:根据所述标准化资源名称和标准化字段、所需要的样本目录信息,以及所述标准化数据元,与所述标准化数据元...
【专利技术属性】
技术研发人员:谢东,
申请(专利权)人:杭州数梦工场科技有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。