基于对象要素分解的结构化标签文件管理系统的文件混合检索方法技术方案

技术编号:37562724 阅读:28 留言:0更新日期:2023-05-15 07:44
本发明专利技术提供基于对象要素分解的结构化标签文件管理系统的文件混合检索方法,包括如下步骤:步骤S1、建立站点,并建立站点分类标签树,并建立站点之间的关系;步骤S2、确定检索空间,即确定检索站点范围;步骤S3、搜索空间范围内,利用关键词,同时寻找:站点要素节点、文件标签配置名,利用节点的组合和文件标签配置名的有无,来得到一组文件的集合;步骤S4、对于检索指定的文件,通过文件名和/或文件标签配置的标签值进行搜索定位,指定文件的检索定位基于步骤S2所确定的检索空间或者基于步骤S2、步骤S3锁定的文件集合范围或者基于系统全站点空间进行。本发明专利技术用于解决一个维度无法将对象进行完全表达的问题,适用于对象的分类。适用于对象的分类。适用于对象的分类。

【技术实现步骤摘要】
基于对象要素分解的结构化标签文件管理系统的文件混合检索方法


[0001]本专利技术涉及电子文档管理领域,具体涉及基于对象要素分解的结构化标签文件管理系统的文件混合检索方法,适用于将对象进行结构化分解成树形结构标签组,并以此树形结构标签组的节点和对象相关的文件进行关联进而实现文件管理的方法下的多维度检索方式。

技术介绍

[0002]在文件管理领域,或者任何资源管理领域,在将各类文件或资源进行管理后,如何有效地定位,并获取所需的文件,是搜索的重要任务,尤其是在文件量级达到一定程度,检索策略的好坏尤其重要。传统模式下,主要通过资源管理器式的文件目录和文件名的方式进行管理,进而对文件的检索,也主要是基于文件名进行,配合文件所在的目录名,文件格式、文件保存时间综合进行查找,往往体现出效率不高、文件搜索不全、文件搜索不到的情况。其原因是传统模式下文件的管理,对文件的本身描述只有文件名和文件目录,文件目录只能表达一个层级方向的信息,文件名只是短字符串,记载的信息有限,且限于文件命名时的规则缺乏性,往往造成文件难以搜索定位。专利CN112488642A公开了一种基于结构化标签并以对象为核心的云端文件管理方法,将对象和文件分别进行结构化分解,并将文件的部分结构化分解内容关联到对象的结构化分解节点上,对象以外的文件结构化内容通过文件结构化标签配置的方式和文件一并存储。通过此方法,文件本身的很多知识特征通过文件结构化标签配置和对象的结构化进行了表达和管理,因此,文件大量的知识是有规则地存储起来的,理论上来说是可以十分精准地定位到想要的文件,而随着较多的文件自身信息被管理和存储,依据文件的结构化内容存储的方式和内容,有必要进行检索方式的设计,以期提高文件检索定位的效率。

技术实现思路

[0003]本专利技术的目的在于,针对现有技术中存在的不足,提供一种基于对象要素分解的结构化标签文件管理系统的文件混合检索方法,通过将基于要素分解的结构化标签文件管理系统内管理的文件内的文件,以合理高效的方式进行文件的提取和归集。
[0004]首先,需要对一些《一种基于结构化标签并以对象为核心的云端文件管理方法(公开号为:CN112488642A,公开日为:2020

11

20》所述的概念进一步进行细化。
[0005]基于对象要素分解的结构化标签文件管理系统,可以实现现有文件管理系统不能实现的功能,主要包括有:通过多个标签关键词组合搜索功能实现基于对象语义的文件搜索与管理,通过对文件名、文件标签配置中具体标签值的搜索精准定位文件。通过对象标签组合,形成多个文件目录,从而实现一个对象一套文件自动生成多种文件目录进行文件整理。文件通过文件+元数据的方式进行存储和管理,对于已经在本系统内管理好的文件,若没有一个较好的检索路径和方式,原本功能就难以体现,效率不易提高。
[0006]基于对象要素分解的结构化标签文件管理系统,以对象为核心进行要素分解,所谓要素分解就是将对象通过多个维度进行分解,形成树形结构标签树组,这样的树形结构标签树组相互正交,为对象的多个维度知识表达。以对象要素分解后的树形结构标签树组,用以关联文件,关联的原则为:根据文件在对象上的关系进行逐个节点关联,关联时子节点和父节点互斥,以后选的为准,兄弟节点不互斥,子节点带有其根节点信息,无其他更多约束。这样,以此系统管理的文件,通过对象的要素分解得到的树形结构标签树组,与文件管理的方式,文件就带有了一组树形结构标签,这一组树形结构标签来自于对象的要素分解,为对象的要素分解的树形结构标签树组的一部分表达。要素分解可以在过程中不断进行,即随着对对象理解的深入或所需纳入管理的内容的维度的增加,可随时在要素分解中增加,并不影响文件的关联,文件可增配要素关联,但当需要删除要素节点时,需要先将所有与要素节点关联的文件与之解除关联。
[0007]进行要素分解的对象,其分类也用一组树形结构标签树组进行标签关联管理,管理对象用的标签主要用于所管理对象的分类,对象分类是从多个维度,因此,也用多个维度的树形结构标签与对象进行关联的方式管理。因此,对于多维度分类问题,都可以用《一种基于结构化标签并以对象为核心的云端文件管理方法(公开号为:CN112488642A,公开日为:2020

11

20》所述的基于对象的要素分解管理方法。要素分解的核心是多个维度的分类管理问题。对于对象的分类管理和要素分解用同样的方法实现,不同的是,对象的分类是从更宏观的层面进行,要素分解可视为以对象为根节点的树形结构,而对象的分类标签树组,则可视作是以另一个更高维度的对象作为根节点,实现对对象的管理,此时对象的要素分解,就可以视为更高维度对象的树形结构的延伸。可见,对于文件关联的要素的搜索,其实是对树形结构节点的搜索的定位,但为了实现文件检索的高效性,需要对搜索空间进行先行处理。
[0008]通过基于对象要素分解的结构化标签文件管理系统管理的文件,必须要关联对象的要素,和关联一个文件标签配置,关联站点要素形成的文件要素标签树和文件标签配置为文件的元数据,也是用以管理和表达文件自身知识。并可知,文件关联的对象要素形成的树形结构是被包含于对象的要素分解树组的。
[0009]文件标签配置为文件自身的信息的表达,其内容可以与对象的要素分解内容有交叉,文件标签配置为可自行配置的文件表单,配置以对象为单元进行设置,即一个对象内,配置的一个文件标签配置带有对象这一标签信息。文件标签配置以不同类型的标签组进行组合,标签组合包括有:标签分为普通标签,单值标签,多值标签,枚举标签四种。文件标签配置分为通用部分和自定义部分,通用部分为:主题、关键词。即所有上传管理文件,默认有一个通用标签配置,可切换文件标签配置。
[0010]文件属性指文件自身的信息,如文件创建时间、上传时间,又如照片带有的GIS信息。文件属性在系统中只作保存,不能修改。
[0011]文件管理以对象为核心,也就是对于一个对象,对其要素分解后形成一组树形结构标签树组,与对象关联的文件,用对象要素分解后形成的标签树组进行关联的方式,完成文件的管理。这样管理的文件,带有一组基于对象要素分解的部分树形结构标签,并组成一组新的树形结构标签,文件标签配置为文件自身信息的表达,为一组结构化标签,这一个标签组的命名为一个标签配置名,这其中的标签有标签类、标签名、标签值。针对一个对象,现
在规定对象相关要素的集合为站点,包括有:对象要素分解的树形结构标签树组、利用这些标签进行关联的文件的集合、以对象进行管理的文件标签配置集合、与文件关联的文件标签配置集合及其文件标签值、对象关联的分类标签形成的标签树。多个对象的此类集合,即为多个站点,站点为相互独立的空间,不同站点之间的要素分解也就是树形结构标签树组的节点名可以重复,文件标签配置名可以重复,文件标签名和值更加可以重复。因此,简单的搜索,其结果是十分庞杂,并不高效,也不能体现出基于要素分解的结构化标签文件管理系统的优点。区分站点对于搜索空间的定义、权限管本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于对象要素分解的结构化标签文件管理系统的文件混合检索方法,其特征在于,所述方法包括如下步骤:步骤S1、建立站点,并建立站点分类标签树,并建立站点之间的关系;进行要素分解的对象,其分类也用一组树形结构标签树组进行标签关联管理,管理对象用的标签主要用于所管理对象的分类,对象分类是从多个维度,也用多个维度的树形结构标签与对象进行关联的方式管理;步骤S2、确定检索空间,即确定检索站点范围;确定检索空间,即确定检索站点范围,用于表达站点特征的为站点分类树形结构标签树和站点的对象要素分解树形结构标签树组,对于检索空间的确定,需要以站点分类标签和站点要素分解内容进行辅助,利用站点分类标签的选择,可以得到一组站点的集合,利用站点分类标签得到站点集合,其逻辑为所选分类标签组成的目标树形结构标签

站点的分类标签,则站点加入到这个所选集合,不同的分类标签选择下会有不同的站点集合;步骤S3、搜索空间范围内,利用关键词,同时寻找:站点要素节点、文件标签配置名,利用节点的组合和文件标签配置名的有无,来得到一组文件的集合;这其中,对于文件标签配置的搜索,文件标签配置名只是一个方式,可以结合文件标签配置的内容,也就是设置的文件标签名,来确认所检索的文件标签配置,文件标签配置就是一个表单。2.对于文件集合来说,可以通过是否关联这个表单进行筛选;步骤S4、对于检索指定的文件,通过文件名和/或文件标签配置的标签值进行搜索定位,指定文件的检索定位基于步骤S2所确定的检索空间或者基于步骤S2、步骤S3锁定的文件集合范围或者基于系统全站点空间进行。3.根据权利要求1所述的基于对象要素分解的结构化标签文件管理系统的文件混合检索方法,其特征在于:步骤S2中,确定检索空间,通过站点要素分解内容确定具体站点,通过关键词搜索定位站点要素分解的节点,通过节点所在的树形结构标签确认其所在站点。4.根据权利要求1所述的基于对象要素分解的结构化标签文件管理系统的文件混合检索方法,其特征在于:所述步骤S2中,确定检索空间,检索空间可以是单个站点或多个站点,确定站点后,就确定了站点空间,确定站点空间用于缩小检索范围;确定检索空间,即确定检索站点范围,确定的检索站点范围,即可得到相应站点的要素分解,要素分解用于检索空间内的文件。5.根据权利要求1所述的基于对象要素分解...

【专利技术属性】
技术研发人员:叶磊姚实黄可江亚丽
申请(专利权)人:中国电建集团华东勘测设计研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1