【技术实现步骤摘要】
本专利技术属于表格处理,尤其是涉及了一种基于大语言模型和自然语言处理的表格内容提取方法。
技术介绍
1、世界上许多信息都是以表格形式存储的,这些表格见诸于网络、数据库或文件中。它们包括消费产品的技术规格、金融和国家发展统计数据、体育赛事结果等等。目前,要想找到问题的答案,人们仍需以人工方式查找这些表格,或使用能提供特定问题(比如关于体育赛事结果的问题)的答案的服务。如果可通过自然语言来查询这些信息,那么取用这些信息会容易很多。
2、表格问答具有广泛的应用场景,最早的方法有数据库自然语言接口nlidb,nlidb是一种允许用户通过输入某种自然语言表示的请求来访问存储在数据库中的信息的系统。它们完全依赖于规则与模板,对自然语言的约束较多,语言理解能力差,不具备较强的泛化能力。最近比较流行方法有nl2sql,基于深度学习的方法实现相较于nlidb有明显的进步。但是目前nl2sql的方法只是把表头信息输入给模型,模型只了解表格的局部信息,很难对用户的问题做出精准的回答,在实际的使用场景准确率不高。
3、以往的方法在理解表
...【技术保护点】
1.一种基于大语言模型和自然语言处理的表格问答方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于大语言模型和自然语言处理的表格问答方法,其特征在于:所述的步骤S01具体为:
3.根据权利要求1所述的一种基于大语言模型和自然语言处理的表格问答方法,其特征在于:所述的步骤S02具体为:将原始表格输入到transformer模型中,transformer模型输出包含所有原始表格数据信息的特征向量。
4.根据权利要求1所述的一种基于大语言模型和自然语言处理的表格问答方法,其特征在于:所述的步骤S03具体为:
5.
...【技术特征摘要】
1.一种基于大语言模型和自然语言处理的表格问答方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于大语言模型和自然语言处理的表格问答方法,其特征在于:所述的步骤s01具体为:
3.根据权利要求1所述的一种基于大语言模型和自然语言处理的表格问答方法,其特征在于:所述的步骤s02具体为:将原始表格输入到transformer模型中,transformer模型输出包含所有原始表格数据信息的特征向量。
4.根据权利要求1所述的一种基于大语言模型和自然语言处理的表格问答方法,其特征在于:所述的步骤s03具体为:
5.根据权利要求1...
【专利技术属性】
技术研发人员:黄清仪,杨赛赛,查良瑜,张嘎,苏常保,
申请(专利权)人:浙江大学计算机创新技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。