一种基于语义匹配提示的大模型数据库查询生成方法、系统、设备和介质技术方案

技术编号:46552451 阅读:2 留言:0更新日期:2025-10-10 21:11
本发明专利技术涉及一种基于语义匹配提示的大模型数据库查询生成方法、系统、设备和介质,包括以下步骤:构建面向数据库查询的自然语言语义表示模型,以用户输入数据库的自然语言查询文本为输入,生成语义向量;基于语义向量相似度匹配机制,从预存训练集中检索与语义向量最相似的历史查询文本;提取历史查询文本对应的数据库查询语句作为语义引导提示,与用户输入数据库的自然语言查询文本构成结构化的提示词指令;将提示词指令输入预训练的大语言模型,调用大语言模型的上下文推理能力,生成与用户意图一致的目标数据库查询语句,从而完成自然语言到SQL的转换,获得用户查询结果。本发明专利技术可以广泛应用于人工智能与数据库技术交叉领域。

【技术实现步骤摘要】

本专利技术属于人工智能与数据库技术交叉领域,具体涉及自然语言处理、深度学习、大语言模型及数据库查询生成领域,尤其是涉及一种基于语义匹配提示的大模型数据库查询生成方法、系统、设备和介质,基于语义匹配提示机制,结合大语言模型实现自然语言到数据库查询语句(如sql)的转换。


技术介绍

1、随着自然语言接口在数据库系统中的广泛应用,自然语言查询自动转换为结构化数据库查询(如sql)的需求日益增长。此类技术作为人机交互的核心纽带,直接影响着数据库系统的智能化水平与用户体验。高质量的转换不仅需精准捕捉用户查询意图,还需确保生成的sql语句与数据库模式严格适配,其准确性直接关系数据检索效率及业务决策可靠性。

2、传统技术路径主要沿三个方向演进,但均存在显著局限:其一,基于规则的转换方法依赖人工预定义语法模板,虽能能保证基础语法正确性,却难以应对复杂语义表达或多样化的自然语言句式,灵活性严重不足;其二,基于神经网络的端到端模型(如seq2seq、transformer)通过大量标注数据直接生成sql,虽部分缓解了规则方法的僵化问题,但对训练数据规模和质量依赖极本文档来自技高网...

【技术保护点】

1.一种基于语义匹配提示的大模型数据库查询生成方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于语义匹配提示的大模型数据库查询生成方法,其特征在于,所述构建面向数据库查询的自然语言语义表示模型,以用户输入数据库的自然语言查询文本为输入,生成深层语义向量,包括:

3.如权利要求2所述的一种基于语义匹配提示的大模型数据库查询生成方法,其特征在于,所述对用户输入数据库的自然语言查询文本进行预处理,将自然语言查询文本表示为一个整数序列,包括:

4.如权利要求2所述的一种基于语义匹配提示的大模型数据库查询生成方法,其特征在于,所述将整数序列输入预先...

【技术特征摘要】

1.一种基于语义匹配提示的大模型数据库查询生成方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于语义匹配提示的大模型数据库查询生成方法,其特征在于,所述构建面向数据库查询的自然语言语义表示模型,以用户输入数据库的自然语言查询文本为输入,生成深层语义向量,包括:

3.如权利要求2所述的一种基于语义匹配提示的大模型数据库查询生成方法,其特征在于,所述对用户输入数据库的自然语言查询文本进行预处理,将自然语言查询文本表示为一个整数序列,包括:

4.如权利要求2所述的一种基于语义匹配提示的大模型数据库查询生成方法,其特征在于,所述将整数序列输入预先构建的面向数据库查询的自然语言语义表示模型,生成语义向量,包括:

5.如权利要求1所述的一种基于语义匹配提示的大模型数据库查询生成方法,其特征在于,所述基于语义向量相似度匹配机制,从预存训练集中检索与语义向量最相似的历史查询文本,包括...

【专利技术属性】
技术研发人员:曹倩雯张艺腾张鑫齐
申请(专利权)人:中国石油大学北京
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1