当前位置: 首页 > 专利查询>微软公司专利>正文

用于促成数据发现的伪文档制造技术

技术编号:10808218 阅读:68 留言:0更新日期:2014-12-24 14:18
各个实施例提升了可被包含在数据库内的数据的可发现性。在一个或多个实施例中,数据库内的数据以具有一模式的结构来组织。该结构和数据能够以呈现一个或多个伪文档的方式来处理,每个伪文档构成一个可被索引的子结构。在被生成和索引之后,伪文档构成一个可搜索对象集,每个可搜索对象关系性地回指向其在数据库内的相关联结构。现在可针对伪文档执行搜索,进而返回搜索结果集。搜索结果集可包括多个伪文档子集,每个伪文档子集与一不同结构相关联。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】各个实施例提升了可被包含在数据库内的数据的可发现性。在一个或多个实施例中,数据库内的数据以具有一模式的结构来组织。该结构和数据能够以呈现一个或多个伪文档的方式来处理,每个伪文档构成一个可被索引的子结构。在被生成和索引之后,伪文档构成一个可搜索对象集,每个可搜索对象关系性地回指向其在数据库内的相关联结构。现在可针对伪文档执行搜索,进而返回搜索结果集。搜索结果集可包括多个伪文档子集,每个伪文档子集与一不同结构相关联。【专利说明】用于促成数据发现的伪文档背景数据库开始被视为要被搜索的对象,然而搜索者可能还不理解数据库内的模式或数据。考虑到巨大数量的数据库以及这些数目增加的速度以及包含在这些数据库中的数据发展的速度,发现相关数据可能不仅对于那些熟悉数据库及其模式的人来说是一项艰巨的任务,对于那些不熟悉数据库及其模式的人来说更是如此。概述提供本概述是为了以简化的形式介绍将在以下【具体实施方式】中进一步描述的概念选择。本概述并非旨在标识出所要求保护的主题的关键特征或必要特征。各个实施例提升了可被包含在数据库内的数据的可发现性。在一个或多个实施例中,数据库内的数据以具有一模式的结构来组织。该结构和数据能够以呈现一个或多个伪文档的方式来处理,每个伪文档构成一个可被索引的子结构。任何适当的准则可被用于处理数据库的结构和数据以创建伪文档。在一些实施例中,处理可包括对数据库或其它函数调用运行查询(诸如SQL查询)以生成伪文档。在被生成和索引之后,伪文档构成一个可搜索对象集,每个可搜索对象关系性地回指向其在数据库内的相关联结构。现在可针对伪文档执行搜索,进而返回搜索结果集。搜索结果集定义了伪文档集合,并且每个伪文档关系性地回指向其相关联结构。伪文档集合的属性和特性可被用于确定它们相关联的结构相对于被执行以生成该集合的搜索的相关性。在确定了相关联结构的相关性之后,数据库或多个数据库内的一个或多个相关联结构可被标识为更可能对特定的搜索用户有用。伪文档可用于抽象出数据库内各个结构的模式并且可促进更容易、更简化的搜索范例来促成数据库内数据的发现。附图简述在全部附图中,使用相同的附图标记来指示相同的特征。图1示出了根据一个或多个实施例的示例操作环境。图2示出了根据一个或多个实施例的示例操作环境。图3示出了根据一个或多个实施例的示例操作环境。图4示出了根据一个或多个实施例的示例数据结构和伪文档。图5示出根据一个或多个实施例的可在其中搜索伪文档的环境。图6是描述根据一个或多个实施例的方法中的各步骤的流程图。图7是描述根据一个或多个实施例的方法中的各步骤的流程图。图8示出了根据一个或多个实施例的示例系统。图9示出了根据一个或多个实施例的示例设备。详细描述概览各个实施例提升了可被包含在数据库内的数据的可发现性。在一个或多个实施例中,数据库内的数据以具有一模式的结构来组织。该结构和数据可能够呈现一个或多个伪文档的方式来处理,每个伪文档构成一个可被索引的子结构。任何适当的准则可被用于处理数据库的结构和数据以创建伪文档。在一些实施例中,处理可包括对数据库或其它函数调用运行查询(诸如SQL查询)以生成伪文档。在被生成和索引之后,伪文档构成一个可搜索对象集,每个可搜索对象关系性地回指向其在数据库内的相关联结构。现在可针对伪文档执行搜索,进而返回搜索结果集。搜索结果集定义了伪文档集合,并且每个伪文档关系性地回指向其相关联结构。伪文档集合的属性和特性可被用于确定它们相关联的结构相对于被执行以生成该集合的搜索的相关性。在确定了相关联结构的相关性之后,数据库或多个数据库内的一个或多个相关联结构可被标识为更可能对特定的搜索用户有用。伪文档可用于抽象出数据库内各个结构的模式并且可促进更容易、更简化的搜索范例来方便数据库内数据的发现。在以下讨论中,首先描述可采用本文描述的技术的示例环境。随后描述可在该示例环境以及其他环境中执行的示例过程。因此,各示例过程的执行不限于该示例环境,并且该示例环境不限于执行各示例过程。示例环境图1概括地在100处示出根据一个或多个实施例的操作环境。环境100包括本地客户机形式的计算设备102,计算设备102具有一个或多个处理器104、一个或多个计算机可读存储介质106和驻留在计算机可读存储介质上并可由处理器104执行的一个或多个应用程序108。计算设备102还包括web浏览器110和查询模块111。模块111可作为由应用程序108和web浏览器使用的单独组件驻留。替代的,模块111可与应用程序108和/或web浏览器110集成以允许如以下所描述的执行对伪文档的搜索。计算设备102可被具体化为任何合适的计算设备,诸如作为示例而非限制,台式计算机,便携式计算机,诸如个人数字助理(PDA)之类的手持式计算机、移动电话、电视机、平板计算机,等等。计算设备102的多个不同示例之一在以下图8和9中示出并描述。应用程序108可包括任何合适类型的应用程序。Web浏览器110被配置成经由网络112导航。虽然网络112被示为因特网,但是该网络可以采用各种各样的配置。例如,网络112可以包括广域网(WAN)、局域网(LAN)、无线网络、公共电话网和内联网等等。此外,虽然只示出了单一网络112,但是,网络112可以被配置成包括多个网络。浏览器可被配置成经由网络112导航以与来自一个或多个服务器114(诸如web服务器)的可用内容交互,以及将数据传送给一个或多个服务器114,例如执行下载和上传。服务器114可被配置成提供可经由网络112访问的一个或多个服务并且可包括维护可由计算设备102访问的数据(诸如结构数据以及相关联的元数据)的一个或多个数据库。数据库内的结构化数据可以任何适当方式来结构化,包括作为示例而非限制的关系结构,诸如表格或类似的。表格包括可以任何适当方式指定的行和列。行和列的交点定义了单元格,而单元格进而可包括可搜索数据。服务器114可包括数据分析器以及索引模块,索引模块用于提供可搜索伪文档,如以下更详细描述的。如以上提到的,服务器可提供各自服务,包括作为示例而非限制的地图服务、电子邮件、网页、照片分享站点、社交网络、内容分享服务、媒体流服务、数据检索和/或显示服务等等。与这些服务相关联的数据可被组织并且维护在相关联的数据库内作为结构化数据和相关联的元数据。元数据可由数据库的创建者或维护者来提供以促成搜索。替换地或另外地,元数据可包括由第三方而不是数据库的创建者或维护者开发的并且随后添加到数据库的隐含元数据,以将一收集窗口添加到数据库的内容中。例如,当终端用户与特定数据库的数据交互时,该终端用户可使描述该数据的一些特性或属性的所谓隐含元数据被添加到数据库中。可搜索的伪文档提升了可被包含在数据库内的数据的可发现性,并且同时还抽象出了出现在数据库中的数据的结构和/或模式。在一个或多个实施例中,数据库内的数据以具有一模式的结构来组织。可使用任何合适的结构和模式。例如,诸如表格等之类的任何适当的关系结构可被用于组织和维护出现在数据库内的数据。该结构和数据能够以呈现一个或多个伪文档的方式来处理,每个伪文档构成一个可被索引的子结构。任何适当的准则可被用于处理数据库的结构和数据以创建伪文档。在一些实施例中,处理可包括对数据库或其它函数调本文档来自技高网...

【技术保护点】
一种计算机实现的方法,包括:接收与存储在数据库中的数据相关联的数据结构;处理所述数据结构以生成与相应数据结构相关联的伪文档,各个伪文档包括回指向至少一个相关联数据结构的指针,所述伪文档表示可被搜索的可搜索对象以标识相关联的数据结构;以及允许伪文档能够被搜索。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:S·乔德里L·诺维克J·C·普拉特
申请(专利权)人:微软公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1