表格查询方法和装置制造方法及图纸

技术编号:41921708 阅读:23 留言:0更新日期:2024-07-05 14:21
本发明专利技术实施例公开了一种表格查询方法和装置,将获取到的表格查询语句输入预先训练的大规模文本嵌入模型以确定对应的表格查询向量,根据表格查询向量,从表格查询参考向量数据库中召回满足预设召回条件的表格查询参考向量,然后根据预设投票策略从表格查询参考向量对应的多个表格中确定目标表格,最后基于目标表格确定反馈信息。上述方法综合考虑了多个表格查询参考向量的匹配结果,结合投票策略选取了最有可能的表格,提高了表格查询准确性。此外,还通过要求大语言模型对现有表格进行提问,生成表格查询参考语句,进而基于表格查询参考语句对应向量构建表格查询参考向量数据库,克服了表格元数据和自然语言之间的语义鸿沟。

【技术实现步骤摘要】

本专利技术涉及数据处理,具体而言,涉及一种表格查询方法和装置


技术介绍

1、近年来,随着数据处理技术的快速发展和数据量的急剧增长,表格数据的重要性日益凸显。然而,对于海量表格数据的有效检索仍然是一个具有挑战性的任务。由于用户输入的自然语言和表格元数据之间的语义鸿沟,传统的文本检索方法难以直接应用于表格数据,而手动查找和筛选表格对用户来说是一项繁琐和耗时的工作。

2、目前,常见的表格检索方法包括基于关键词检索、基于语义检索和基于表格特征检索等。基于关键词或语义检索的方法通常存在歧义性和精确度不高的问题,基于表格特征检索需要构建特征排序模型,而训练该特征排序模型的样本数据很难获取,尤其是在冷启动阶段。


技术实现思路

1、有鉴于此,本专利技术实施例提供了一种表格查询方法和装置,以克服表格元数据和自然语言之间的语义鸿沟,克服在冷启动阶段获取样本数据的困难,并提高表格查询的准确性。

2、第一方面,提供了一种表格查询方法,所述方法包括:

3、获取表格查询语句,所述表格查询语句为用于描本文档来自技高网...

【技术保护点】

1.一种表格查询方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述表格查询参考向量数据库的构建方法包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述表格查询参考向量,构建所述表格查询参考向量数据库,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据多个所述表格查询参考向量之间的相似度,构建多级树状索引结构,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述表格查询向量,从预设的表格查询参考向量数据库中召回预定数量个满足预设召回条件的表格查询参考向量,包括:p>

6.一种表...

【技术特征摘要】

1.一种表格查询方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述表格查询参考向量数据库的构建方法包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述表格查询参考向量,构建所述表格查询参考向量数据库,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据多个所述表格查询参考向量之间的相似度,构建多级树状索引结构,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述表格查询向量,从预设的表格查询参考向量数据库中召回预定数量个满足预设召回条件的表格查询参考向...

【专利技术属性】
技术研发人员:王君吉李哲
申请(专利权)人:拉扎斯网络科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1