【技术实现步骤摘要】
信息生成方法、装置、电子设备以及存储介质
[0001]本公开涉及人工智能
,尤其涉及图像处理、计算机视觉和深度学习
,可应用于OCR(Optical Character Recognition,光学字符识别)等场景。具体地,涉及一种信息生成方法、装置、电子设备以及存储介质。
技术介绍
[0002]随着计算机技术的发展,人工智能技术也得以发展。人工智能技术可以包括计算机视觉技术、语音识别技术、自然语言处理技术、机器学习、深度学习、大数据处理技术和知识图谱技术等。
[0003]人工智能技术在各种领域得到了广泛应用。例如,可以利用人工智能技术获取文本表格图像的结构化信息。
技术实现思路
[0004]本公开提供了一种用于信息生成的方法、装置、电子设备以及存储介质。
[0005]根据本公开的一方面,提供了一种信息生成方法,包括:对文本表格图像进行处理,得到上述文本表格图像中各文本区域的局部特征信息和文本识别信息;对上述局部特征信息进行列分类,得到各上述文本区域的列分类信息;根据上述局部特征信息,确定各上述文本区域之间的相似度;根据上述相似度,确定各上述文本区域的行分类信息;以及,根据上述行分类信息、上述列分类信息和上述文本识别信息,生成上述文本表格图像的结构化信息。
[0006]根据本公开的另一方面,提供了一种信息生成装置,包括:处理模块,用于对文本表格图像进行处理,得到所述文本表格图像中各文本区域的局部特征信息和文本识别信息;分类模块,用于对所述局部特征信息进行列分类,得到 ...
【技术保护点】
【技术特征摘要】
1.一种信息生成方法,包括:对文本表格图像进行处理,得到所述文本表格图像中各文本区域的局部特征信息和文本识别信息;对所述局部特征信息进行列分类,得到各所述文本区域的列分类信息;根据所述局部特征信息,确定各所述文本区域之间的相似度;根据所述相似度,确定各所述文本区域的行分类信息;以及根据所述行分类信息、所述列分类信息和所述文本识别信息,生成所述文本表格图像的结构化信息。2.根据权利要求1所述的方法,其中,所述对文本表格图像进行处理,得到所述文本表格图像中各文本区域的局部特征信息和文本识别信息,包括:对所述文本表格图像进行特征提取,得到全局特征信息;根据所述全局特征信息,获取文本检测信息,其中,所述文本检测信息包括所述文本表格图像中各子区域的文本位置信息和文本置信度,所述文本置信度表征所述子区域是所述文本区域的概率;以及根据所述全局特征信息和所述文本检测信息,获取所述局部特征信息和所述文本识别信息。3.根据权利要求2所述的方法,其中,所述根据所述全局特征信息和所述文本检测信息,获取所述局部特征信息和所述文本识别信息,包括:在根据所述文本置信度确定所述子区域是所述文本区域的情况下,基于所述文本位置信息和所述全局特征信息,获取所述局部特征信息;以及根据所述局部特征信息,获取所述文本识别信息。4.根据权利要求2或3所述的方法,其中,所述根据所述全局特征信息,获取文本检测信息,包括:根据所述全局特征信息,确定候选框信息;根据所述候选框信息和所述全局特征信息,获取候选特征信息;以及根据所述候选特征信息,获取所述文本检测信息。5.根据权利要求1~4中任一项所述的方法,其中,所述对所述局部特征信息进行列分类,得到各所述文本区域的列分类信息,包括:对所述局部特征信息进行全连接处理,得到所述列分类信息。6.根据权利要求2~5中任一项所述的方法,其中,所述根据所述局部特征信息,确定各所述文本区域彼此之间的相似度,包括:根据两个所述文本区域各自的局部特征信息,确定两个所述文本区域的差异特征信息;以及根据所述差异特征信息,确定两个所述文本区域之间的相似度。7.根据权利要求6所述的方法,其中,所述根据两个所述文本区域各自的局部特征信息,确定两个所述文本区域的差异特征信息,包括:对两个所述文本区域各自的文本位置信息进行特征提取,得到两个所述文本区域各自的文本位置特征信息;对所述局部特征信息和所述文本位置特征信息进行融合,得到两个所述文本区域各自
的融合特征信息;以及根据所述融合特征信息,获取所述差异特征信息。8.根据权利要求6所述的方法,其中,所述根据两个所述文本区域各自的局部特征信息,确定两个所述文本区域的差异特征信息,包括:确定两个所述文本区域各自的局部特征信息之间的差值;以及将所述差值确定为两个所述文本区域的差异特征信息。9.根据权利要求1~5中任一项所述的方法,其中,所述根据所述局部特征信息,确定各所述文本区域之间的相似度,包括:确定两个所述文本区域的两个局部特征信息之间的点积;以及根据所述点积,确定两个所述文本区域之间的相似度。10.根据权利要求1~9中任一项所述的方法,其中,所述根据所述相似度,确定各所述文本区域的行分类信息,包括:在确定两个所述文本区域之间的相似度大于或等于预定相似度阈值的情况下,确定两个所述文本区域各自的行分类信息是表征所述两个文本区域属于同一行的行分类信息。11.根据权利要求1~10中任一项所述的方法,其中,所述根据所述行分类信息、所述列分类信息和所述文本识别信息,生成所述文本表格图像的结构化信息,包括:根据各所述文本区域的行分类信息和列分类信息,对各所述文本区域进行组合,得到组合信息;以及根据所述组合信息和各所述文本区域的文本识别信息,生成所述文本表格图像的结构化信息。12.一种信息生成装置,包括:处理模块,用于对文本表格图像进行处理,得到所述文本表格图像中各文本区域的局部特征信息和文本识别信息;分类模块,用于对所述局部特征信息进行列分类,得到各所述文本区域的列分类信息;第一确定模块,用于根据所述局部特征信息,...
【专利技术属性】
技术研发人员:于海鹏,李煜林,钦夏孟,姚锟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。