System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种面向数据空间的数字对象元注册表系统及搜索方法技术方案_技高网

一种面向数据空间的数字对象元注册表系统及搜索方法技术方案

技术编号:41132371 阅读:8 留言:0更新日期:2024-04-30 18:02
本申请涉及一种面向数据空间的数字对象元注册表系统及搜索方法。该系统将多个数字对象子注册表作为子搜索引擎,通过数字对象元注册表将用户的搜索请求转发到所述数字对象子注册表中进行搜索;数字对象子注册表配置模块用于添加和删除数字对象子注册表;搜索请求分发模块用于解析用户发送的搜索请求进行解析,生成搜索请求数据包,根据搜索请求筛选出本次使用的数字对象子注册表,并向其发送搜索请求数据包;搜索结果回收和汇总模块用于将返回的搜索结果实体进行整合并重排序返回给用户。本系统在一定程度上实现了不汇聚元数据情况下的全局数据搜索,将搜索结果重排序并以相对合理的顺序呈现给用户,使用户获得相对准确、全面的搜索结果。

【技术实现步骤摘要】

本申请涉及数据搜索领域,特别是涉及一种面向数据空间的数字对象元注册表系统及搜索方法


技术介绍

1、在数字对象架构(digital object architecture,doa)中,数字对象分为三个部分:标识、元数据以及数据实体。其中,标识用于确定数字对象身份,其应为全局唯一且能够对数字对象持久标记;元数据含有描述数字对象特征的信息,可用于数字对象的搜索和发现;而数据实体即为数字对象存储的实际数据部分,其格式可以是结构化或非结构化的多种形式。数字对象具有元数据与数据实体主动分离的特点,数据实体通常存储在数字对象仓库中,而元数据则存储于数字对象注册表中,在一般搜索场景中,可利用此特点在不侵犯数据持有者权益的前提下对数据进行全局搜索,获得包含部分隐私信息的数据。例如,在社交场景、电子商务场景中利用昵称、模糊位置等元数据搜索包含用户部分隐私(例如:真实手机号、精确地理位置等)的数据。数字对象注册表直接面向用户提供搜索服务,其汇聚包含数字对象描述信息的元数据,并以对元数据建立倒排索引等形式实现对元数据的搜索。通常情况下,数字对象注册表只汇聚可公开的、用于帮助搜索的元数据部分,而包含了隐私信息或有价值的数据实体不会被非法存储和使用。

2、但是,在某些元数据也携带了敏感信息的特定场景中,例如在医药信息管理的场景中,由于其身所固有的私密或价值属性,对于信息的权益要求更高,数据本身也会携带大量的隐私信息或其他有价值的信息。在这种特定搜索场景中,使用一般搜索场景中对元数据汇聚后进行搜索的方式会导致注册表中包含隐私信息或其他有价值的信息,从而造成数据隐私权益问题。由于数字对象所有者通常是开放环境下的不同主体,在特定搜索场景中难以保证所有数字对象所有者均完全信任搜索模块(即所有的数字对象所有者均提供全部元数据)。如何在不汇聚元数据的前提下实现全局的数据搜索,并保证搜索结果的相对准确、全面是一个亟待解决的问题。


技术实现思路

1、为了解决上述问题,本申请提出一种面向数据空间的数字对象元注册表系统及搜索方法,旨在实现数字对象在不汇聚元数据的前提下的全局数据搜索,并保证搜索结果的相对准确、全面。

2、为达到上述目的,本申请的技术方案如下:

3、本申请实施例第一方面提供一种面向数据空间的数字对象元注册表系统,所述系统将多个数字对象子注册表作为子搜索引擎,通过数字对象元注册表将用户的搜索请求转发到所述数字对象子注册表中进行搜索;所述数字对象子注册表用于管理其下属的元数据,任一元数据仅被一个数字对象子注册表管理;

4、所述数字对象元注册表包括以下模块:

5、数字对象子注册表配置模块,包括加入功能子模块与退出功能子模块;所述加入功能子模块被配置为根据所述数字对象子注册表发送的加入请求,获取所述数字对象子注册表的信息并记录在本地;所述信息包括所述数字对象子注册表的地址和标识;所述退出功能子模块被配置为根据收到的所述数字对象子注册表发送的退出请求,从本地记录中删除所述数字对象子注册表的地址和标识信息;

6、搜索请求分发模块,被配置为对用户发送的搜索请求进行解析,提取查询字符串和查询参数并封装为搜索请求数据包;根据所述搜索请求,从本地记录的数字对象子注册表中筛选出本次使用的数字对象子注册表,并向其发送所述搜索请求数据包;

7、搜索结果回收和汇总模块,被配置为将所述本次使用的数字对象子注册表返回的源搜索结果列表中所有搜索结果实体进行整合并重排序,生成搜索结果列表返回给用户;所述搜索结果实体包含以下至少一种数据:数字对象的元数据、数字对象的标识;所述搜索结果列表仅包含所述数字对象的标识。

8、可选地,所述系统还包括搜索能力模型搭建模块;

9、所述搜索能力模型搭建模块,被配置为根据所述数字对象子注册表的搜索能力信息,搭建并配置搜索能力模型;

10、所述加入功能子模块,还被配置为将所述搜索能力模型搭建模块搭建的所述搜索能力模型记录在本地;所述搜索能力模型用于描述所述数字对象子注册表擅长的搜索领域;

11、所述退出功能子模块,还被配置为根据所述退出请求,删除本地记录的所述数字对象子注册表的搜索能力模型。

12、可选地,所述搜索请求分发模块被配置为遍历本地记录的数字对象子注册表的搜索能力模型,按照与所述搜索请求的匹配度从高到低进行排序;

13、按照自定义的筛选数量选出排序靠前的数字对象子注册表,作为所述本次使用的数字对象子注册表。

14、可选地,所述搜索请求分发模块,被配置为在发送所述搜索请求数据包之前,建立与所述本次使用的数字对象子注册表之间的数据传输信道;

15、当所述本次使用的数字对象子注册表返回所述源搜索结果列表后,关闭所述数据传输信道。

16、可选地,所述搜索结果回收和汇总模块包括:

17、搜索结果打分模块,被配置为对收到的所述源搜索结果列表中每一个搜索结果实体进行打分;

18、搜索结果重排序模块,被配置为根据所述打分对所有搜索结果实体进行排序,生成所述搜索结果列表。

19、可选地,所述搜索结果打分模块,被配置为根据所述搜索结果实体在所述源搜索结果列表中的排序,计算所述搜索结果实体的分数;

20、或所述搜索结果打分模块,被配置为基于所述查询字符串计算与所述数字对象子注册表的查询特征的相似度,作为所述搜索结果实体的分数;

21、或所述搜索结果打分模块,被配置为当所述数字对象子注册表允许对其搜索结果的元数据进行解析时,计算所述查询字符串与所述搜索结果的元数据的相似度,作为所述搜索结果实体的分数。

22、根据本申请实施例的第二方面,提供一种面向数据空间的数字对象元注册表搜索方法,应用于本申请实施例的第一方面所提供的面向数据空间的数字对象元注册表系统,所述方法将多个数字对象子注册表作为子搜索引擎,通过数字对象元注册表将用户的搜索请求转发到所述数字对象子注册表中进行搜索;所述数字对象子注册表用于管理其下属的元数据,任一元数据仅被一个数字对象子注册表管理;

23、包括以下步骤:

24、根据所述数字对象子注册表发送的加入请求,获取所述数字对象子注册表的信息并记录在本地;所述信息包括所述数字对象子注册表的地址和标识;

25、根据收到的所述数字对象子注册表发送的退出请求,从本地记录中删除所述数字对象子注册表的地址和标识信息;

26、对用户发送的搜索请求进行解析,提取查询字符串和查询参数并封装为搜索请求数据包;根据所述搜索请求,从本地记录的数字对象子注册表中筛选出本次使用的数字对象子注册表,并向其发送所述搜索请求数据包;

27、将所述本次使用的数字对象子注册表返回的源搜索结果列表中所有搜索结果实体进行整合并重排序,生成搜索结果列表返回给用户;所述搜索结果实体包含以下至少一种数据:数字对象的元数据、数字对象的标识;所述搜索结果列表仅包含所述数字对象的标识本文档来自技高网...

【技术保护点】

1.一种面向数据空间的数字对象元注册表系统,其特征在于,所述系统将多个数字对象子注册表作为子搜索引擎,通过数字对象元注册表将用户的搜索请求转发到所述数字对象子注册表中进行搜索;所述数字对象子注册表用于管理其下属的元数据,任一元数据仅被一个数字对象子注册表管理;

2.根据权利要求1所述的面向数据空间的数字对象元注册表系统,其特征在于,还包括搜索能力模型搭建模块;

3.根据权利要求2所述的面向数据空间的数字对象元注册表系统,其特征在于,所述搜索请求分发模块被配置为遍历本地记录的数字对象子注册表的搜索能力模型,按照与所述搜索请求的匹配度从高到低进行排序;

4.根据权利要求1所述的面向数据空间的数字对象元注册表系统,其特征在于,所述搜索请求分发模块,被配置为在发送所述搜索请求数据包之前,建立与所述本次使用的数字对象子注册表之间的数据传输信道;

5.根据权利要求1所述的面向数据空间的数字对象元注册表系统,其特征在于,所述搜索结果回收和汇总模块包括:

6.根据权利要求5所述的面向数据空间的数字对象元注册表系统,其特征在于,所述搜索结果打分模块,被配置为根据所述搜索结果实体在所述源搜索结果列表中的排序,计算所述搜索结果实体的分数;

7.一种面向数据空间的数字对象元注册表搜索方法,应用于权利要求1-6中任一所述的系统,其特征在于,将多个数字对象子注册表作为子搜索引擎,通过数字对象元注册表将用户的搜索请求转发到所述数字对象子注册表中进行搜索;所述数字对象子注册表用于管理其下属的元数据,任一元数据仅被一个数字对象子注册表管理;

8.根据权利要求7所述的面向数据空间的数字对象元注册表搜索方法,其特征在于,还包括:

9.根据权利要求8所述的面向数据空间的数字对象元注册表搜索方法,其特征在于,根据所述搜索请求,从本地记录的数字对象子注册表中筛选出本次使用的数字对象子注册表,包括:

10.根据权利要求7所述的面向数据空间的数字对象元注册表搜索方法,其特征在于,还包括:

...

【技术特征摘要】

1.一种面向数据空间的数字对象元注册表系统,其特征在于,所述系统将多个数字对象子注册表作为子搜索引擎,通过数字对象元注册表将用户的搜索请求转发到所述数字对象子注册表中进行搜索;所述数字对象子注册表用于管理其下属的元数据,任一元数据仅被一个数字对象子注册表管理;

2.根据权利要求1所述的面向数据空间的数字对象元注册表系统,其特征在于,还包括搜索能力模型搭建模块;

3.根据权利要求2所述的面向数据空间的数字对象元注册表系统,其特征在于,所述搜索请求分发模块被配置为遍历本地记录的数字对象子注册表的搜索能力模型,按照与所述搜索请求的匹配度从高到低进行排序;

4.根据权利要求1所述的面向数据空间的数字对象元注册表系统,其特征在于,所述搜索请求分发模块,被配置为在发送所述搜索请求数据包之前,建立与所述本次使用的数字对象子注册表之间的数据传输信道;

5.根据权利要求1所述的面向数据空间的数字对象元注册表系统,其特征在于,所述搜索结果回收和汇总...

【专利技术属性】
技术研发人员:罗超然黄罡姜海鸥杨婧如
申请(专利权)人:北京大数据先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1