一种基于大语言模型和自然语言处理的表格问答方法技术

技术编号：40753300 阅读：27 留言：0更新日期：2024-03-25 20:08

本发明专利技术公开了一种基于大语言模型和自然语言处理的表格问答方法。方法包括基于规则提取原始表格数据的显式信息；根据transformer模型提取表格的隐式信息；将完整的表格信息以及用户的自然语言输入到大语言模型中，调试大语言模型的prompt，然后生成python代码；执行python代码处理表格任务，生成符合用户查询要求的新表格并返回结果。发明专利技术由于大语言模型看到了表格的整体、完整的信息，大语言模型具有更好的模糊匹配能力，同时，大大提高了通过自然语言处理表格任务的准确率，更加智能，更接近实际的使用场景。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于表格处理，尤其是涉及了一种基于大语言模型和自然语言处理的表格内容提取方法。

技术介绍

1、世界上许多信息都是以表格形式存储的，这些表格见诸于网络、数据库或文件中。它们包括消费产品的技术规格、金融和国家发展统计数据、体育赛事结果等等。目前，要想找到问题的答案，人们仍需以人工方式查找这些表格，或使用能提供特定问题(比如关于体育赛事结果的问题)的答案的服务。如果可通过自然语言来查询这些信息，那么取用这些信息会容易很多。

2、表格问答具有广泛的应用场景，最早的方法有数据库自然语言接口nlidb，nlidb是一种允许用户通过输入某种自然语言表示的请求来访问存储在数据库中的信息的系统。它们完全依赖于规则与模板，对自然语言的约束较多，语言理解能力差，不具备较强的泛化能力。最近比较流行方法有nl2sql，基于深度学习的方法实现相较于nlidb有明显的进步。但是目前nl2sql的方法只是把表头信息输入给模型，模型只了解表格的局部信息，很难对用户的问题做出精准的回答，在实际的使用场景准确率不高。

3、以往的方法在理解表...

【技术保护点】

1.一种基于大语言模型和自然语言处理的表格问答方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于大语言模型和自然语言处理的表格问答方法，其特征在于：所述的步骤S01具体为：

3.根据权利要求1所述的一种基于大语言模型和自然语言处理的表格问答方法，其特征在于：所述的步骤S02具体为：将原始表格输入到transformer模型中，transformer模型输出包含所有原始表格数据信息的特征向量。

4.根据权利要求1所述的一种基于大语言模型和自然语言处理的表格问答方法，其特征在于：所述的步骤S03具体为：

5.根据权利要求1所述的...

【技术特征摘要】

1.一种基于大语言模型和自然语言处理的表格问答方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于大语言模型和自然语言处理的表格问答方法，其特征在于：所述的步骤s01具体为：

3.根据权利要求1所述的一种基于大语言模型和自然语言处理的表格问答方法，其特征在于：所述的步骤s02具体为：将原始表格输入到transformer模型中，transformer模型输出包含所有原始表格数据信息的特征向量。

4.根据权利要求1所述的一种基于大语言模型和自然语言处理的表格问答方法，其特征在于：所述的步骤s03具体为：

5.根据权利要求1...

【专利技术属性】
技术研发人员：黄清仪，杨赛赛，查良瑜，张嘎，苏常保，
申请(专利权)人：浙江大学计算机创新技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人