一种上下文感知的多轮对话文本到SQL自动转换方法技术

技术编号:43961950 阅读:13 留言:0更新日期:2025-01-07 21:46
本发明专利技术涉及一种上下文感知的多轮对话文本到SQL自动转换方法,包括:获取用户的待检索多轮对话文本,从CoSQL数据集中随机采样对话示例,生成示例集合;将待检索多轮对话文本和示例集合均输入大型语言模型分析用户意图,获取相应的SQL语句;其中,大型语言模型利用训练集进行低秩适配微调,并结合上下文感知动态损失函数优化模型参数;训练集包括:历史用户意图和历史SQL语句;对SQL语句进行验证,验证通过后,查询SQL语句对应的信息,生成用户所需信息。本发明专利技术利用大语言模型进行意图解析和SQL建议生成,提高了多轮文本到SQL任务训练数据的质量和多样性。

【技术实现步骤摘要】

本专利技术涉及文本查询,特别是涉及一种上下文感知的多轮对话文本到sql自动转换方法。


技术介绍

1、组织中数据驱动决策的普及导致了对高效且直观的数据库交互方式的需求增加。自然语言数据库接口,特别是文本到sql系统,已成为一种有前途的解决方案,以实现数据访问的民主化,并使非技术用户能够从复杂的数据集中获取洞察力。虽然在单轮文本到sql任务方面取得了显著进展,其中单个用户话语被转换为sql查询,但处理多轮交互的挑战仍然是研究的一个关键领域。

2、多轮文本到sql任务呈现出独特的挑战,这些挑战超越了单轮交互的范畴。其中包括在多轮对话中维护和更新上下文、处理模糊引用以及生成准确反映用户在整个对话过程中不断变化意图的sql查询。复杂性源于需要理解和整合会话上下文、处理各种语言现象(如回指和省略),并在对话进展中生成越来越复杂的sql查询。为了说明这一过程,图1展示了一个流程图,描绘了典型的多轮文本到sql交互中的步骤。该图演示了系统如何从数据库中识别唯一的模板id、确定哪些模板被多次使用,并检索与这些模板相关的文档id。这种视觉表示强调了多轮文本到sql本文档来自技高网...

【技术保护点】

1.一种上下文感知的多轮对话文本到SQL自动转换方法,其特征在于,包括:

2.根据权利要求1所述的上下文感知的多轮对话文本到SQL自动转换方法,其特征在于,生成示例集合的方法为:

3.根据权利要求1所述的上下文感知的多轮对话文本到SQL自动转换方法,其特征在于,获取所述SQL语句包括:

4.根据权利要求1所述的上下文感知的多轮对话文本到SQL自动转换方法,其特征在于,所述上下文感知动态损失函数包括:交叉熵损失函数、分段累积损失、批次损失。

5.根据权利要求4所述的上下文感知的多轮对话文本到SQL自动转换方法,其特征在于,获取所述交叉熵损失函...

【技术特征摘要】

1.一种上下文感知的多轮对话文本到sql自动转换方法,其特征在于,包括:

2.根据权利要求1所述的上下文感知的多轮对话文本到sql自动转换方法,其特征在于,生成示例集合的方法为:

3.根据权利要求1所述的上下文感知的多轮对话文本到sql自动转换方法,其特征在于,获取所述sql语句包括:

4.根据权利要求1所述的上下文感知的多轮对话文本到sql自动转换方法,其特征在于,所述上下文感知动态损失函数包括:交叉熵损失函数、分段累积损失、批次损失。

5.根据权利要求4所述的上下文感知的多轮对话文本到sql自动转换方法,其特征在于,获取所述交叉熵损失函数包括:

...

【专利技术属性】
技术研发人员:林煜明朱春临李优张敬伟张会兵首照宇
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1