答案序列的确定方法及装置制造方法及图纸

技术编号:28126329 阅读:15 留言:0更新日期:2021-04-19 11:41
本发明专利技术公开了一种答案序列的确定方法及装置,涉及智能决策技术领域,主要目的在于解决答案文本框序列中包含无关文字,导致正确率较低的问题。包括:获取文本框序列,将文本框序列保存至二叉树存储结构的根节点S0中;对文本框序列进行聚类处理,得到第一子序列和第二子序列,并检测第一子序列和第二子序列中是否存在端点子序列;若否,则对二叉树存储结构进行回溯处理,得到答案序列;若是,则将端点子序列保存至根节点S0的左子节点S1中,将非端点子序列保存至根节点S0的右子节点S2中,对左子节点S1中的端点子序列重复进行聚类和检测,直至不存在端点子序列时,对二叉树存储结构进行回溯处理,得到并输出答案序列。得到并输出答案序列。得到并输出答案序列。

【技术实现步骤摘要】
答案序列的确定方法及装置


[0001]本专利技术涉及智能决策领域,特别是涉及一种答案序列的确定方法及装置。

技术介绍

[0002]视觉问答(Visual Question Answering,VQA)是一种结合文字检测、文字识别、NLP阅读理解等多个领域的研究目标,其过程通常可以包括:光学字符识别系统(Optical Character Recognition,OCR)先将扫描文档中的所有文字区域检测并识别出来,并且所有的文字框按照从左到右、从上到下的位置顺序排序,再通过模型输出问题答案。
[0003]目前,通常是利用预先训练的阅读理解模型输出起点和终点位置,并将两个位置之间的文字序列作为问题答案。然而,真实场景下的扫描文档结构和排版十分复杂,导致输出的问题答案中很容易包含无关的文字,正确率较低。

技术实现思路

[0004]有鉴于此,本专利技术提供一种答案序列的确定方法及装置,主要目的在于解决真实场景下的扫描文档结构和排版十分复杂,导致输出的问题答案中很容易包含无关的文字,正确率较低的问题。
[0005]依据本专利技术一个方面,提供了一种答案序列的确定方法,包括:
[0006]获取文本框序列,将所述文本框序列保存至二叉树存储结构的根节点S0中;
[0007]对所述文本框序列进行聚类处理,得到第一子序列和第二子序列;
[0008]检测所述第一子序列和所述第二子序列中是否存在端点子序列,其中,所述端点子序列为同时包括第一文本框和第二文本框的子序列;
[0009]若否,则对所述二叉树存储结构进行回溯合并处理,得到答案序列;
[0010]若是,则将端点子序列保存至所述根节点S0的左子节点S1中,将非端点子序列保存至所述根节点S0的右子节点S2中,并对所述左子节点S1中的端点子序列重复执行聚类处理以及检测步骤,直至不存在端点子序列时,对所述二叉树存储结构进行回溯合并处理,得到答案序列;
[0011]输出所述答案序列。
[0012]进一步地,所述对所述左子节点S2中的端点子序列重复执行聚类处理以及检测步骤之前,所述方法还包括:
[0013]对所述右子节点S2中的非端点子序列进行聚类处理,得到第三子序列和第四子序列,
[0014]分别计算所述第三子序列、第四子序列与所述左子节点S1中的端点子序列之间的最小水平距离;
[0015]若所述最小水平距离不大于预设距离阈值,则将相应的第三子序列或第四子序列合并保存至所述左子节点S1中。
[0016]进一步地,所述对所述二叉树存储结构进行回溯合并处理,包括:
[0017]根据所述二叉树存储结构最底层的左子节点S
2i+1
,查找相应的的父节点S
i+1

[0018]计算所述父节点S
i+1
与所述父节点S
i+1
的兄弟节点S
i+2
之间的最小水平距离;
[0019]判断所述父节点S
i+1
与所述父节点S
i+1
的兄弟节点S
i+2
之间的最小水平距离是否不大于预设距离阈值;
[0020]若否,则停止回溯并将所述左子节点S
2i+1
中的子序列确定为答案序列;
[0021]若是,继续向二叉树存储结构的上层节点进行回溯。
[0022]进一步地,所述计算所述父节点S
i+1
与所述父节点的兄弟节点S
i+2
之间的最小水平距离,包括:
[0023]获取所述父节点S
i+1
的最小x坐标和最大x坐标(A1,A2);
[0024]获取所述父节点的兄弟节点S
i+2
的最小x坐标和最大x坐标(B1,B2);
[0025]根据预设的最小水平距离公式计算所述父节点S
i+1
与所述父节点的兄弟节点S
i+2
之间的最小水平距离,所述最小水平距离公式包括:
[0026]D=max(A2,B2)

min(A1,B1)

(B2

B1)

(A2

A1)
[0027]其中,D为所述父节点S
i+1
与所述父节点的兄弟节点S
i+2
之间的最小水平距离,A1为所述父节点S
i+1
的最小x坐标,A2为所述父节点S
i+1
的最大x坐标,B1为所述父节点S
i+1
的兄弟节点S
i+2
的最小x坐标,B2为所述父节点S
i+1
的兄弟节点S
i+2
的最大x坐标。
[0028]进一步地,所述对所述文本框序列进行聚类处理,得到第一子序列和第二子序列,包括:
[0029]对所述文本框序列进行k

means聚类处理,得到第一子序列和第二子序列。
[0030]进一步地,所述对所述文本框序列进行k

means聚类处理,得到第一子序列和第二子序列,包括;
[0031]在所述文本框序列中随机提取2个文本框作为第一质心和第二质心;
[0032]分别计算所述文本框序列中的剩余各文本框与所述第一质心、第二质心之间的欧氏距离;
[0033]将与所述第一质心之间的欧式距离大于与所述第二质心之间的欧式距离的文本框划分至第一子序列,将与所述第二质心之间的欧式距离大于与所述第一质心之间的欧式距离的文本框划分至第二子序列。
[0034]进一步地,所述获取文本框序列,将所述文本框序列保存至二叉树存储结构的根节点S0中之前,所述方法还包括:
[0035]利用光学字符识别系统对获取的扫描文档进行检测识别,得到文本框簇;
[0036]对所述文本框簇按照预设顺序进行排列处理;
[0037]利用预先训练的阅读理解模型对所述排列处理后的文本框簇进行处理,得到第一文本框及第二文本框;
[0038]将所述第一文本框及第二文本框之间的文本框簇确定为输出的文本框序列。
[0039]依据本专利技术另一个方面,提供了一种答案序列的确定装置,包括:
[0040]获取单元,用于获取文本框序列,将所述文本框序列保存至二叉树存储结构的根节点S0中;
[0041]处理单元,用于对所述文本框序列进行聚类处理,得到第一子序列和第二子序列,并检测所述第一子序列和所述第二子序列中是否存在端点子序列,其中,所述端点子序列
为同时包括第一文本框和第二文本框的子序列;
[0042]回溯单元,用于若否,则对所述二叉树存储结构进行回溯合并处理,得到答案序列;
[0043]合并单元,用于若是,则将端点子序列保存至所述根节点S0的左子节点S1中,将非端点子序列保存至所述根节点S0的右子节点S2中,并对所述左子本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种答案序列的确定方法,其特征在于,包括:获取文本框序列,将所述文本框序列保存至二叉树存储结构的根节点S0中;对所述文本框序列进行聚类处理,得到第一子序列和第二子序列,并检测所述第一子序列和所述第二子序列中是否存在端点子序列,其中,所述端点子序列为同时包括第一文本框和第二文本框的子序列;若否,则对所述二叉树存储结构进行回溯合并处理,得到答案序列;若是,则将端点子序列保存至所述根节点S0的左子节点S1中,将非端点子序列保存至所述根节点S0的右子节点S2中,并对所述左子节点S1中的端点子序列重复执行聚类处理以及检测步骤,直至不存在端点子序列时,对所述二叉树存储结构进行回溯合并处理,得到答案序列;输出所述答案序列。2.根据权利要求1所述的方法,其特征在于,所述对所述左子节点S2中的端点子序列重复执行聚类处理以及检测步骤之前,所述方法还包括:对所述右子节点S2中的非端点子序列进行聚类处理,得到第三子序列和第四子序列,分别计算所述第三子序列、第四子序列与所述左子节点S1中的端点子序列之间的最小水平距离;若所述最小水平距离不大于预设距离阈值,则将相应的第三子序列或第四子序列合并保存至所述左子节点S1中。3.根据权利要求1所述的方法,其特征在于,所述对所述二叉树存储结构进行回溯合并处理,包括:根据所述二叉树存储结构最底层的左子节点S
2i+1
,查找相应的的父节点S
i+1
;计算所述父节点S
i+1
与所述父节点S
i+1
的兄弟节点S
i+2
之间的最小水平距离;判断所述父节点S
i+1
与所述父节点S
i+1
的兄弟节点S
i+2
之间的最小水平距离是否不大于预设距离阈值;若否,则停止回溯并将所述左子节点S
2i+1
中的子序列确定为答案序列;若是,继续向二叉树存储结构的上层节点进行回溯。4.根据权利要求3所述的方法,其特征在于,所述计算所述父节点S
i+1
与所述父节点的兄弟节点S
i+2
之间的最小水平距离,包括:获取所述父节点S
i+1
的最小x坐标和最大x坐标(A1,A2);获取所述父节点的兄弟节点S
i+2
的最小x坐标和最大x坐标(B1,B2);根据预设的最小水平距离公式计算所述父节点S
i+1
与所述父节点的兄弟节点S
i+2
之间的最小水平距离,所述最小水平距离公式包括:D=max(A2,B2)

min(A1,B1)

(B2

B1)

(A2

A1)其中,D为所述父节点S
i+1
与所述父节点的...

【专利技术属性】
技术研发人员:王德勋徐国强
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1