一种基于自然语言的数据分析方法、系统、电子设备及存储介质技术方案

技术编号:41564802 阅读:26 留言:0更新日期:2024-06-06 23:47
本发明专利技术公开了一种基于自然语言的数据分析方法、系统、电子设备及存储介质,包括自然语言输入大型语言模型;大型语言模型对自然语言进行处理,生成与自然语言语义一致的多个版本查询语句;将多个版本查询语句转换为向量数据,采用相似度匹配算法从数据库中获取对应的数据资源;利用数据库管理系统获取数据资源对应的数据表结构;基于数据表结构,将多个版本查询语句转换成SQL查询语句;执行SQL查询语句,获取样例数据;基于样例数据、数据表结构和数据资源获得综合SQL查询语句;执行综合SQL查询语句,获取查询返回的数据;本发明专利技术实现了从用户自然语言查询到数据库查询结果的自动化处理流程。

【技术实现步骤摘要】

本专利技术涉及语言处理,尤其涉及一种基于自然语言的数据分析方法、系统、电子设备及存储介质


技术介绍

1、随着信息技术的迅猛发展和大数据时代的到来,数据库系统已经成为各种应用领域中不可或缺的数据存储和管理工具。传统的数据库查询主要依赖于结构化查询语言,这对于非技术背景的用户来说,增加了学习和使用的难度,限制了他们对数据库中数据价值的挖掘和利用。实现自然语言驱动的数据库查询与分析技术仍然面临诸多挑战。自然语言本身的复杂性和多样性使得准确理解用户查询意图成为一项艰巨的任务。不同的用户可能使用不同的词汇和表达方式描述相同的查询需求,这就要求系统具备强大的语义理解和歧义消解能力。将自然语言请求转换为数据库可执行的查询语言(如sql)也是一个技术难点,需要确保转换的准确性和有效性。

2、此外,还需要考虑查询效率、系统稳定性以及安全性等因素。在实际应用中,数据库可能包含大量的数据,如何快速响应用户的自然语言查询请求并返回准确的结果是一个重要的性能指标。同时,系统还需要具备处理并发请求、防止恶意攻击的能力。


术实现思路<本文档来自技高网...

【技术保护点】

1.一种基于自然语言的数据分析方法,其特征在于,包括:

2.根据权利要求1所述的基于自然语言的数据分析方法,其特征在于,将自然语言输入至大型语言模型包括对所述自然语言进行预处理,预处理包括基于空值、文本长度的检测以及基于停用词表和正则的合规检测。

3.根据权利要求2所述的基于自然语言的数据分析方法,其特征在于,所述大型语言模型对所述自然语言进行处理,生成与所述自然语言语义一致的多个版本查询语句包括:

4.根据权利要求3所述的基于自然语言的数据分析方法,其特征在于,将所述关键信息组织成标准语法结构包括将非正式或口语化的词语替换为标准化词语以及将口语化风格...

【技术特征摘要】

1.一种基于自然语言的数据分析方法,其特征在于,包括:

2.根据权利要求1所述的基于自然语言的数据分析方法,其特征在于,将自然语言输入至大型语言模型包括对所述自然语言进行预处理,预处理包括基于空值、文本长度的检测以及基于停用词表和正则的合规检测。

3.根据权利要求2所述的基于自然语言的数据分析方法,其特征在于,所述大型语言模型对所述自然语言进行处理,生成与所述自然语言语义一致的多个版本查询语句包括:

4.根据权利要求3所述的基于自然语言的数据分析方法,其特征在于,将所述关键信息组织成标准语法结构包括将非正式或口语化的词语替换为标准化词语以及将口语化风格转换为正式风格。

5.根据权利要求3所述的基于自然语言的数据分析方法,其特征在于,将所述多个版本查询语句转换为向量数据,并采用相似度匹配算法从数据库中获取对应的数据资源包...

【专利技术属性】
技术研发人员:陈泽锋杜文
申请(专利权)人:移通科技杭州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1