【技术实现步骤摘要】
本说明书涉及人工智能,尤其涉及一种提取表格中上下位关系的方法及装置。
技术介绍
1、在大语言模型等生成模型应用越来越广泛的今天,检索增强生成(rag,retrievalaugmented generation)技术已经成为提升生成模型性能的一个重要技术手段。在一些利用表格进行数据查询的场景中,可以基于该rag技术,利用表格进行数据查询,该数据查询过程一般包括:将表格进行文本化,得到表格的文本格式数据,接着在得到用户输入的查询文本之后,利用该表格的文本格式数据与该查询文本,通过大语言模型,确定查询文本对应的回答文本。
2、在一些场景中,用户输入的查询文本可能会涉及需要基于表格中存在上下位关系的行中的数据单元格内容进行回答的问题,基于上述查询过程,大语言模型还无法很准确的为该类查询文本提供回答,那么,为了向用户提供更优质的内容生成服务,如何提供一种提取表格中上下位关系的方法至关重要。
技术实现思路
1、本说明书一个或多个实施例提供了一种提取表格中上下位关系的方法及装置,以实现对表格
...【技术保护点】
1.一种提取表格中上下位关系的方法,包括:
2.如权利要求1所述的方法,还包括:
3.如权利要求2所述的方法,其中,所述第一知识图谱还包括:所述第一表格中各行对应的行节点和/或各列对应的列节点,及对应于所述第一表格的表格节点、所述第一表格中各数据单元格对应的单元格节点、表征各行节点和/或列节点与表格节点之间的包含关系的第二边,和表征各单元格节点与各行节点和/或各列节点之间的包含关系的第三边,所述第一单元格和所述多个第二单元格为所述第一表格中各第一行中处于同一列的数据单元格或为各第一列中处于同一行的数据单元格。
4.如权利要求3所述的
...【技术特征摘要】
1.一种提取表格中上下位关系的方法,包括:
2.如权利要求1所述的方法,还包括:
3.如权利要求2所述的方法,其中,所述第一知识图谱还包括:所述第一表格中各行对应的行节点和/或各列对应的列节点,及对应于所述第一表格的表格节点、所述第一表格中各数据单元格对应的单元格节点、表征各行节点和/或列节点与表格节点之间的包含关系的第二边,和表征各单元格节点与各行节点和/或各列节点之间的包含关系的第三边,所述第一单元格和所述多个第二单元格为所述第一表格中各第一行中处于同一列的数据单元格或为各第一列中处于同一行的数据单元格。
4.如权利要求3所述的方法,其中,所述第一知识图谱还包括:各行节点对应的行属性信息和/或各列节点对应的列属性信息,以及表格节点对应的表格关键词集和各单元格节点对应的格子属性信息,其中,所述表格关键词集基于所述第一表格文本确定,各行属性信息至少基于所述第一表格文本所包括的所述第一表格中所有列的表头数据、所对应行的索引列数据和数据单元格的值确定,各列属性信息至少基于所述第一表格文本所包括的所述第一表格中所对应列的表头数据和数据单元格的值及所有行的索引列数据确定;各格子属性信息至少基于所对应数据单元格的值及其所在行的...
【专利技术属性】
技术研发人员:游东海,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。