多个连续top-k关键词查询结果更新方法、系统、存储介质及终端技术方案

技术编号：20797016 阅读：61 留言：0更新日期：2019-04-06 10:37

本发明专利技术提供一种多个连续top‑k关键词查询结果更新方法、系统、存储介质及终端，包括以下步骤：将每个关键词基于关系数据库在先元组查询的备选网络表示为一个以新元组为根节点的网络树；通过自上向下合并近似边的方式将所有的网络树合并为一个以新元组为根节点的根树；自上向下逐层计算所述根树中的连接，并根据连接之间的相似性进行合并查询，以获取多个连续top‑k关键词基于新元组的查询结果。本发明专利技术的多个连续top‑k关键词查询结果更新方法、系统、存储介质及终端有效地提高了关系数据库中多个连续top‑k关键词搜索的效率；降低了搜索处理过程中对关系数据库的频繁访问；降低了搜索处理过程中的服务器内存消耗。

Updating Method, System, Storage Media and Terminal of Multiple Continuous Top-k Keyword Query Results

The invention provides a method, a system, a storage medium and a terminal for updating the results of multiple continuous top_k keyword queries, including the following steps: representing an alternative network for each keyword queries based on relational databases in a primitive group as a network tree with a new tuple as its root node; and merging all network trees into a new tuple by merging approximate edges from top to bottom. The root tree of the root node calculates the connections in the root tree layer by layer from top to bottom, and merges the queries according to the similarities between the connections to obtain the query results based on new tuples for multiple consecutive top_k keywords. The multi-continuous top_k keyword query result updating method, system, storage medium and terminal of the invention effectively improve the efficiency of multi-continuous top_k keyword search in relational database, reduce frequent access to relational database in search processing, and reduce the memory consumption of server in search processing.

全部详细技术资料下载

【技术实现步骤摘要】
多个连续top-k关键词查询结果更新方法、系统、存储介质及终端
本专利技术涉及信息处理的
，特别是涉及一种多个连续top-k关键词查询结果更新方法、系统、存储介质及终端。
技术介绍
关系数据库是建立在关系模型基础上的数据库，借助于集合代数等数学概念和方法来处理数据库中的数据。现实世界中的各种实体以及实体之间的各种联系均用关系模型来表示。标准数据查询语言SQL就是一种基于关系数据库的语言，这种语言执行对关系数据库中数据的检索和操作。关系模型由关系数据结构、关系操作集合、关系完整性约束三部分组成。随着关系数据库中存储的文本数据的增加，简单高效地从数据库中查询文本数据变得越来越重要。但是，传统的结构化查询方法要求用户掌握一定的结构化查询语言和数据库模式的知识，从而极大地限制了其使用范围。随着互联网的发展，越来越多的普通用户需要访问在线数据库，这些用户通常不具备结构化查询语言和数据库模式的知识。随着网络搜索引擎的兴起，关键词查询(KeywordSearch)因为其简单方便的特点得到了广泛的使用。因此，在关系型数据库中进行关键词搜索就成为一个很自然的需求。通过在关系数...

【技术保护点】
1.一种关系数据库中多个连续top‑k关键词查询结果更新方法，其特征在于，包括以下步骤：将每个关键词基于关系数据库在先元组查询的备选网络表示为一个以新元组为根节点的网络树；通过自上向下合并近似边的方式将所有的网络树合并为一个以新元组为根节点的根树；自上向下逐层计算所述根树中的连接，并根据连接之间的相似性进行合并查询，以获取多个连续top‑k关键词基于新元组的查询结果。

【技术特征摘要】
1.一种关系数据库中多个连续top-k关键词查询结果更新方法，其特征在于，包括以下步骤：将每个关键词基于关系数据库在先元组查询的备选网络表示为一个以新元组为根节点的网络树；通过自上向下合并近似边的方式将所有的网络树合并为一个以新元组为根节点的根树；自上向下逐层计算所述根树中的连接，并根据连接之间的相似性进行合并查询，以获取多个连续top-k关键词基于新元组的查询结果。2.根据权利要求1所述的关系数据库中多个连续top-k关键词查询结果更新方法，其特征在于，所述近似边是指父节点和子节点的关系表相同的两个边。3.根据权利要求1所述的关系数据库中多个连续top-k关键词查询结果更新方法，其特征在于，自上向下逐层计算所述根树中的连接，并根据连接之间的相似性进行合并查询，以获取多个连续top-k关键词基于新元组的查询结果包括以下步骤：对于根树的每一层的每一类相似连接合并查询能够与所有父节点中的元组相连接的元组集合；计算每一类相似连接中每一个连接的子节点的已处理元组集合与所述元组集合的交集；计算交集中每个元组与新元组可共同构成的查询结果的关联度上限，并删除关联度上限小于预设查询阈值的元组；所述预设查询阈值为对应top-k关键词查询的当前查询结果的最小关联度；若每一个连接的子节点中的元组集合变为空集，则从根树中删除该连接所属的备选网络的所有节点。4.根据权利要求3所述的关系数据库中多个连续top-k关键词查询结果更新方法，其特征在于，对于交集中的每一个元组t，t和新元组可共同构成的查询结果的关联度的上限为其中表示t所在的备选网络CN(t)中不同于t所在的元组集合R(t)的其他元组集合中的元组的最大关联度，t.tscore表示单个元组t的关联度，size(CN(t))表示t所在的元组CN(t)的大小，即其含有的元组的个数。5.一种关系数据库中多个连续top-k关键词查询结果更新系统，其特征在于，包括表示模块、合并模块和查询模块；所述表示模块用于将每个关键词基于关系数据库在先元组查询的备选网络表示为一个以新元组为根节点的网络树；所述合并模块用于通过自...

【专利技术属性】
技术研发人员：许延伟，
申请(专利权)人：上海宽带技术及应用工程研究中心，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人