【技术实现步骤摘要】
问答模型训练方法、问答方法、装置、设备、存储介质
[0001]本公开涉及数据处理
,尤其涉及表格问答
技术介绍
[0002]表格承载了大量有价值的数据,表格问答技术旨在从表格中查找给出待处理问题的答案。目前,表格问答技术大多依托于数据库,需要人工标注表格的表头的位置,将表格存储于预先定义了表头的数据库中,在数据库中查询与待处理问题相匹配的答案,操作繁琐,效率较低。
技术实现思路
[0003]本公开提供了一种问答模型训练方法、问答方法、装置、设备、存储介质。
[0004]根据本公开的第一方面,提供了一种问答方法,包括:
[0005]获取待处理问题;
[0006]根据表格的单元格之间的邻接关系,从所述表格中确定与所述待处理问题相匹配的答案。
[0007]根据本公开的第二方面,提供了一种问答模型训练方法,包括:
[0008]获取多组训练样本,每组训练样本包括待处理问题、表格的单元格之间的邻接关系以及从所述表格确定的与所述待处理问题相匹配的标注答案;
[0009]将所述训练样本输入问答模型,根据所述问答模型从所述表格中确定与所述待处理问题相匹配的预测答案;
[0010]根据所述标注答案和所述预测答案计算损失误差,并根据所述损失误差对所述问答模型的模型参数进行调节。
[0011]本公开的第三方面,提供了一种问答装置,包括:
[0012]获取模块,用于获取待处理问题;
[0013]确定模块,用于根据表格的单元格之间的邻 ...
【技术保护点】
【技术特征摘要】
1.一种问答方法,包括:获取待处理问题;根据表格的单元格之间的邻接关系,从所述表格中确定与所述待处理问题相匹配的答案。2.根据权利要求1所述的问答方法,其中,根据表格的单元格之间的邻接关系,从所述表格中确定与所述待处理问题相匹配的答案,包括:根据所述邻接关系,确定所述表格中与所述待处理问题相匹配的目标单元格;根据所述目标单元格的内容确定所述答案。3.根据权利要求1所述的问答方法,其中,所述根据表格的单元格之间的邻接关系,从所述表格中确定与所述待处理问题相匹配的答案,包括:将所述邻接关系和所述待处理问题输入问答模型,根据所述问答模型确定所述待处理问题与各个单元格的匹配度;其中,所述问答模型由训练样本对图神经网络训练得到;根据所述匹配度确定所述答案。4.根据权利要求3所述的问答方法,其中,所述问答模型包括序列生成神经网络层和输出层;将所述邻接关系和所述待处理问题输入问答模型,根据所述问答模型确定所述待处理问题与各个单元格的匹配度,包括:将所述邻接关系和所述待处理问题输入所述序列生成神经网络层,根据所述序列生成神经网络层得到各个单元格的第一特征编码以及所述待处理问题的第二特征编码;所述第一特征编码通过对所述待处理问题进行联合理解得到,所述第二特征编码通过对单元格的内容进行联合理解得到;将所述第一特征编码和所述第二特征编码输入所述输出层,根据所述输出层确定所述匹配度。5.根据权利要求3所述的问答方法,其中,所述邻接关系通过邻接矩阵和内容序列表征,所述内容序列根据各个单元格的内容确定;所述将所述邻接关系和所述待处理问题输入问答模型,包括:将所述内容序列与所述待处理问题进行拼接;将拼接结果和所述邻接矩阵输入问答模型。6.根据权利要求1所述的问答方法,其中,所述邻接关系由所述表格的拓扑图确定;一个单元格对应所述拓扑图的一个节点;所述拓扑图的边表征单元格之间的位置关系。7.根据权利要求6所述的问答方法,其中,所述拓扑图采用广度优先遍历算法对所述表格的单元格建立得到。8.根据权利要求1
‑
7中任一项所述的问答方法,其中,所述表格为富文档中的表格;和/或,单元格的内容包括文字和/或图片。9.一种问答模型训练方法,包括:获取多组训练样本,每组训练样本包括待处理问题、表格的单元格之间的邻接关系以及从所述表格确定的与所述待处理问题相匹配的标注答案;将所述训练样本输入问答模型,根据所述问答模型从所述表格中确定与所述待处理问题相匹配的预测答案;
根据所述标注答案和所述预测答案计算损失误差,并根据所述损失误差对所述问答模型的模型参数进行调节。10.根据权利要求9所述的问答模型训练方法,将所述训练样本输入问答模型,根据所述问答模型从所述表格中确定与所述待处理问题相匹配的预测答案,包括:将所述邻接关系和所述待处理问题输入问答模型,根据所述问答模型确定所述待处理问题与各个单元格的匹配度;根据所述匹配度确定所述答案。11.根据权利要求10所述的问答模型训练方法,所述问答模型包括序列生成神经网络层和输出层;将所述邻接关系和所述待处理问题输入问答模型,根据所述问答模型确定所述待处理问题与各个单元格的匹配度,包括:将所述邻接关系和所述待处理问题输入所述序列生成神经网络层,根据所述序列生成神经网络层得到各个单元格的第一特征编码以及所述待处理问题的第二特征编码;所述第一特征编码通过对所述待处理问题进行联合理解得到,所述第二特征编码通过对单元格的内容进行联合理解得到;将所述第一特征编码和所述第二特征编码输入所述输出层,根据所述输出层确定所述匹配度。12.根据权利要求9所述的问答模型训练方法,所述邻接关系由邻接矩阵和内容序列表征,所述内容序列根据各个单元格的内容确定;所述将所述训练样本输入问答模型,包括:将所述内容序列与所述待处理问题进行拼接;将拼接结果和所述邻接矩阵输入问答模型。13.根据权利要求9所述的问答模型训练方法,还包括:构建所述表格的拓扑图;所述表格的一个单元格对应所述拓扑图的一个节点;所述拓扑图的边表征单元格之间的位置关系;根据所述拓扑图确定所述邻接关系;所述邻接关系用于构建所述训练样本。14.根据权利要求13所述的问答模型训练方法,其中,所述构建所述表格的拓扑图,包括:采用广度优先遍历算法构建所述表格的拓扑图。15.一种问答装置,包括:获取模块,用于获取待处理问题;确定模块,用于根据表格的单元格之间的邻接关系,从所述表格中确定与所述待处理问题相匹配的答案。16.根据权利要求15所述的问答装置,其中,所...
【专利技术属性】
技术研发人员:郝洋,姜文斌,崔骁鹏,吕雅娟,佘俏俏,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。