查询语句生成方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:43053722 阅读:16 留言:0更新日期:2024-10-22 14:35
本发明专利技术提供一种查询语句生成方法、装置、设备、存储介质及程序产品,该方法包括:响应于用户提交的第一问题文本,通过LLM对第一问题文本进行编码,得到第一句向量;基于第一句向量以及数据表的表注释,从预设元数据库中选取与第一问题文本的相似度排名靠前的N个数据表;基于各数据表的第一表相关信息,构建各数据表的第一提示信息,其中,第一表相关信息包括表注释、字段名、字段注释、相关问题和思维链;将第一提示信息输入至LLM中,得到LLM输出的第一问题文本对应的第一结构化查询语言。本发明专利技术通过利用相关问题、思维链使得构建的提示信息更加丰富高效,通过提示学习对LLM进行微调实现了LLM生成的结构化查询语言的准确性。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种查询语句生成方法、装置、设备、存储介质及程序产品


技术介绍

1、随着互联网和物联网技术的飞速发展,以及各种传感器、智能设备的普及,数据的产生和存储呈指数级增长。尤其是近年企业数字化的口号的提出,大数据的应用场景不断拓展,包括金融、医疗、教育、零售、制造等各个领域,涉及数据管理、数据分析、决策支持等多个方面。

2、目前,企业的数据表通用开发流程为:用户先通过需要单描述需求分析内容,接着需求人员分析需求—sql(structured query language,结构化查询语言)开发人员根据需求描述开发sql—测试应用—上线—用户消费需求。然而此种应用开发完成后只能应对固有sql的查询。

3、相关技术中,主要采用nlp(natural language processing,自然语言处理)中的nl2sql技术将自然语言直接转化成为可直接执行的sql,实现数据查询和统计。这些技术通常以调整深度神经网络结构来提高测试指标为主,在通用的测试集上表现不佳,也没有能够在企业落地实施的可行性方案。

4本文档来自技高网...

【技术保护点】

1.一种查询语句生成方法,其特征在于,包括:

2.根据权利要求1所述的查询语句生成方法,其特征在于,所述预设元数据库中各个数据库表的所述相关问题和所述思维链是通过以下方式得到的:

3.根据权利要求2所述的查询语句生成方法,其特征在于,所述通过所述LLM得到所述第二问题文本匹配的第二结构化查询语言,包括:

4.根据权利要求2所述的查询语句生成方法,其特征在于,所述通过所述LLM对所述第二问题文本与所述第二结构化查询语言进行编码,得到第三句向量,还包括:

5.根据权利要求2所述的查询语句生成方法,其特征在于,所述方法还包括:

6.根...

【技术特征摘要】

1.一种查询语句生成方法,其特征在于,包括:

2.根据权利要求1所述的查询语句生成方法,其特征在于,所述预设元数据库中各个数据库表的所述相关问题和所述思维链是通过以下方式得到的:

3.根据权利要求2所述的查询语句生成方法,其特征在于,所述通过所述llm得到所述第二问题文本匹配的第二结构化查询语言,包括:

4.根据权利要求2所述的查询语句生成方法,其特征在于,所述通过所述llm对所述第二问题文本与所述第二结构化查询语言进行编码,得到第三句向量,还包括:

5.根据权利要求2所述的查询语句生成方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的查询语句生成方法,其特征在于,所述将所述...

【专利技术属性】
技术研发人员:田江涛温立志刘永胜张茜陈伟
申请(专利权)人:中国移动通信集团河北有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1