【技术实现步骤摘要】
答案序列的确定方法及装置
[0001]本专利技术涉及智能决策领域,特别是涉及一种答案序列的确定方法及装置。
技术介绍
[0002]视觉问答(Visual Question Answering,VQA)是一种结合文字检测、文字识别、NLP阅读理解等多个领域的研究目标,其过程通常可以包括:光学字符识别系统(Optical Character Recognition,OCR)先将扫描文档中的所有文字区域检测并识别出来,并且所有的文字框按照从左到右、从上到下的位置顺序排序,再通过模型输出问题答案。
[0003]目前,通常是利用预先训练的阅读理解模型输出起点和终点位置,并将两个位置之间的文字序列作为问题答案。然而,真实场景下的扫描文档结构和排版十分复杂,导致输出的问题答案中很容易包含无关的文字,正确率较低。
技术实现思路
[0004]有鉴于此,本专利技术提供一种答案序列的确定方法及装置,主要目的在于解决真实场景下的扫描文档结构和排版十分复杂,导致输出的问题答案中很容易包含无关的文字,正确率较低的问题。
[0005]依据本专利技术一个方面,提供了一种答案序列的确定方法,包括:
[0006]获取文本框序列,将所述文本框序列保存至二叉树存储结构的根节点S0中;
[0007]对所述文本框序列进行聚类处理,得到第一子序列和第二子序列;
[0008]检测所述第一子序列和所述第二子序列中是否存在端点子序列,其中,所述端点子序列为同时包括第一文本框和第二文本框的子序列;
[000 ...
【技术保护点】
【技术特征摘要】
1.一种答案序列的确定方法,其特征在于,包括:获取文本框序列,将所述文本框序列保存至二叉树存储结构的根节点S0中;对所述文本框序列进行聚类处理,得到第一子序列和第二子序列,并检测所述第一子序列和所述第二子序列中是否存在端点子序列,其中,所述端点子序列为同时包括第一文本框和第二文本框的子序列;若否,则对所述二叉树存储结构进行回溯合并处理,得到答案序列;若是,则将端点子序列保存至所述根节点S0的左子节点S1中,将非端点子序列保存至所述根节点S0的右子节点S2中,并对所述左子节点S1中的端点子序列重复执行聚类处理以及检测步骤,直至不存在端点子序列时,对所述二叉树存储结构进行回溯合并处理,得到答案序列;输出所述答案序列。2.根据权利要求1所述的方法,其特征在于,所述对所述左子节点S2中的端点子序列重复执行聚类处理以及检测步骤之前,所述方法还包括:对所述右子节点S2中的非端点子序列进行聚类处理,得到第三子序列和第四子序列,分别计算所述第三子序列、第四子序列与所述左子节点S1中的端点子序列之间的最小水平距离;若所述最小水平距离不大于预设距离阈值,则将相应的第三子序列或第四子序列合并保存至所述左子节点S1中。3.根据权利要求1所述的方法,其特征在于,所述对所述二叉树存储结构进行回溯合并处理,包括:根据所述二叉树存储结构最底层的左子节点S
2i+1
,查找相应的的父节点S
i+1
;计算所述父节点S
i+1
与所述父节点S
i+1
的兄弟节点S
i+2
之间的最小水平距离;判断所述父节点S
i+1
与所述父节点S
i+1
的兄弟节点S
i+2
之间的最小水平距离是否不大于预设距离阈值;若否,则停止回溯并将所述左子节点S
2i+1
中的子序列确定为答案序列;若是,继续向二叉树存储结构的上层节点进行回溯。4.根据权利要求3所述的方法,其特征在于,所述计算所述父节点S
i+1
与所述父节点的兄弟节点S
i+2
之间的最小水平距离,包括:获取所述父节点S
i+1
的最小x坐标和最大x坐标(A1,A2);获取所述父节点的兄弟节点S
i+2
的最小x坐标和最大x坐标(B1,B2);根据预设的最小水平距离公式计算所述父节点S
i+1
与所述父节点的兄弟节点S
i+2
之间的最小水平距离,所述最小水平距离公式包括:D=max(A2,B2)
‑
min(A1,B1)
‑
(B2
‑
B1)
‑
(A2
‑
A1)其中,D为所述父节点S
i+1
与所述父节点的...
【专利技术属性】
技术研发人员:王德勋,徐国强,
申请(专利权)人:深圳壹账通智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。