【技术实现步骤摘要】
一种处理方法、装置、设备和计算机可读存储介质
[0001]本申请涉及数据处理
,尤其涉及一种处理方法、装置、设备和计算机可读存储介质。
技术介绍
[0002]在可视化文档问答(Document Visual Question Answering,Doc VQA)范畴,从海量的扫描文档中确定出键(Key)和键值(Value),或确定出问题(Question)和答案(Answer),以及确定出Key和对应的Value(或Question对应的Answer)是文档处理的重要任务。
[0003]相关技术中,通常采用机器学习模型对文档进行处理,然而,在对机器学习模型训练过程中,由于文档格式不统一,且每种格式的文档数据量较少,导致机器学习模型的泛化能力较差,难以保证文档处理结果的准确性。
技术实现思路
[0004]有鉴于此,本申请实施例提供一种处理方法、装置、设备和计算机可读存储介质,能够提高待处理对象的处理结果的准确性。
[0005]本申请技术方案是这样实现的:
[0006]本申请实施例提 ...
【技术保护点】
【技术特征摘要】
1.一种处理方法,包括:获得待处理对象,对所述待处理对象进行字符识别,获得所述待处理对象中的第一信息;对所述第一信息进行序列化处理,获得至少一个文本块和各个文本块的结构信息,所述文本块为具有正确且完整语义信息的文字集合;基于所述第一信息、所述至少一个文本块和各个文本块的结构信息,对所述至少一个文本块进行分类处理和匹配处理,获得分类结果和匹配结果;将所述分类结果和匹配结果确定为所述待处理对象的处理结果。2.根据权利要求1所述的方法,所述第一信息包括各个文字对应的语义信息、位置信息和所述待处理对象的排版信息;对所述第一信息进行序列化处理,获得至少一个文本块和各个文本块的结构信息,包括:获得所述待处理对象中各个文字对应的语义信息、位置信息和所述待处理对象的排版信息;根据所述语义信息、位置信息和所述排版信息将所述待处理对象中的文字划分为至少一个文本块;基于各个文本块对应的语义信息和位置信息,确定所述各个文本块的结构信息。3.根据权利要求2所述的方法,所述根据所述语义信息、位置信息和所述排版信息将所述待处理对象中的文字划分为至少一个文本块,包括:获得第i个文字对应的第一语义信息、第一位置信息和第一排版信息,以及第i+1个文字对应的第二语义信息、第二位置信息和第二排版信息,其中i=1,
…
,N,N为所述待处理对象中的文字的个数;确定所述第一语义信息和所述第二语义信息满足第一匹配条件,所述第一排版信息和所述第二排版信息相同,且所述第一位置信息和所述第二位置信息满足第二匹配条件,确定所述第i个文字和所述第i+1个文字属于同一个文本块。4.根据权利要求1所述的方法,所述基于所述第一信息、所述至少一个文本块和各个文本块的结构信息,对所述至少一个文本块进行分类处理和匹配处理,获得分类结果和匹配结果,包括:对所述第一信息、所述至少一个文本块和各个文本块的结构信息进行融合处理,获得第一融合处理结果;利用训练好的第一分类模型对所述第一融合处理结果进行预测,获得各个文本块对应的对象类型,将所述各个文本块对应的对象类型作为分类结果,所述对象类型至少包括问题类型或答案类型;将问题类型的第一文本块和答案类型的第二文本块进行匹配处理,获得匹配处理结果,所述匹配处理结果包括第一文本块和第二文本块的对应关系。5.根据权利要求1所述的方法,还包括:获得所述待处理对象对应的整体图像特征和局部图像特...
【专利技术属性】
技术研发人员:田秋雨,王敏,陈永洒,罗林锋,
申请(专利权)人:联想北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。