一种数据表召回方法、装置、设备及存储介质制造方法及图纸

技术编号:42467497 阅读:26 留言:0更新日期:2024-08-21 12:53
本申请提供了一种数据表召回方法、装置、设备及存储介质,涉及计算机技术领域,该方法先通过大模型对数据表进行语义分析并生成介绍,使得能够准确捕捉数据表之间的语义相似度,在预处理阶段,通过比较语义相似度值与预设阈值,能够快速排除语义相似度过高的数据表,仅保存具有独特性的表信息。然后基于用户指令进行表信息筛选,能够为用户提供更加个性化的服务。在最终选取目标数据表时,通过判断数据表与用户指令的相关度,并设置相关度阈值,能够确保所选数据表与用户需求的高度契合,提升数据检索的准确性。综上所述,该方法能够实现对数据表的智能化处理、高效检索,为数据库管理和用户查询提供了更为便捷和智能的途径。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种数据表召回方法、装置、设备及存储介质


技术介绍

1、随着大模型技术的迅速发展,其应用领域得到了极大的扩展。特别是在自动化代码生成领域,大模型技术展现出了巨大的潜力。具体来说,通过大模型技术,用户可以将自己的需求或指令转化为精确的sql脚本,从而实现从数据库中实时获取所需数据,极大地提升了业务在报告汇报和数据分析等工作中的效率。

2、然而,在实际应用中面临着一个显著的挑战,即数据库中往往存在大量的数据表,这使得现有的代码大模型技术在试图筛选并确定正确的数据表时显得力不从心。由于数据表数量庞大,直接应用大模型技术对所有数据表进行筛选和匹配不仅效率低下,而且准确率也难以保证。

3、因此需要一种数据表召回方法来克服现有技术中在大规模数据库环境下筛选数据表的局限性,且进一步提升自动化代码生成的效率和准确性。


技术实现思路

1、针对上述问题,本申请提供了一种数据表召回方法,包括以下内容:

2、第一方面,本申请提供了一种数据表召回方法,该方法包括:

本文档来自技高网...

【技术保护点】

1.一种数据表召回方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述语义相似度值与预设语义相似度阈值进行比较之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述表信息中的列名可以为一个或多个;

4.根据权利要求1所述的方法,其特征在于,所述选出与所述用户指令相似度高的前n个数据表包括:

5.根据权利要求1所述的方法,其特征在于,所述判断所述前n个数据表和所述用户指令的相关度,选取相关度大于预设相关度阈值的n个数据表,作为目标数据表包括:

6.一种数据表召回装置,其特征在于,所...

【技术特征摘要】

1.一种数据表召回方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述语义相似度值与预设语义相似度阈值进行比较之后,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述表信息中的列名可以为一个或多个;

4.根据权利要求1所述的方法,其特征在于,所述选出与所述用户指令相似度高的前n个数据表包括:

5.根据权利要求1所述的方法,其特征在于,所述判断所述前n个数据表和所述用户指令的相关度,选取相关度大于预设相关度阈...

【专利技术属性】
技术研发人员:宋瑞林
申请(专利权)人:太保科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1