【技术实现步骤摘要】
一种信息处理方法、装置及设备
[0001]相关申请的交叉引用
[0002]本申请要求于
2020
年
04
月
01
日提交中国专利局
、
申请号为
202010252333.9、
专利技术名称为“一种信息处理方法
、
装置及设备”的中国专利申请的优先权,其全部内容通过引用结合在本申请中
。
[0003]本说明书涉及计算机
,尤其涉及一种信息处理方法
、
装置及设备
。
技术介绍
[0004]随着工业互联网的发展,尤其是目前整个产业正处在消费互联网转向产业互联网的变革中,
5G
通信
、
人工智能等技术的发展无疑将助力整个变革,尤其是深度学习方面的技术进步,使得机器读图
、
识图的能力有了明显突破
。
[0005]这时,利用机器读图
、
识图的应用显著增多,比如文档扫描
、
物体识别等
。
[0006]例如,
Office Lens(
微软公司发布的一款软件
)
,用户可通过拍照
、
扫描等手段,将包含有文字
、
图形的纸质文档
、
名片
、
白板
、
海报等外部信息,变成电子图片录入到计算机系统中,甚至可经后期一些简单处理,比如
OCR(O ...
【技术保护点】
【技术特征摘要】
1.
一种信息处理方法,包括:获取待录入信息对应的电子图像;确定所述电子图像的图像类型;根据所述图像类型对所述电子图像进行目标检测,以识别所述电子图像中与所述待录入信息对应的若干信息元素;以及按照所述图像类型对应的排版规则对所述若干信息元素进行排版,生成所述待录入信息对应的数字化信息
。2.
根据权利要求1所述的方法,其中,所述根据所述图像类型对所述电子图像进行目标检测,以识别所述电子图像中与所述待录入信息对应的若干信息元素,包括:根据所述图像类型对所述电子图像进行目标检测,识别所述电子图像中的若干目标图像内容;将所述若干目标图像内容识别为与所述目标图像内容在计算机系统中对应的若干标准信息元素
。3.
根据权利要求2所述的方法,其中,所述按照所述图像类型对应的排版规则对所述若干信息元素进行排版,包括:确定所述图像类型对应的目标排版规则;根据所述目标排版规则对所述若干标准信息元素进行排版
。4.
根据权利要求3所述的方法,其中,所述根据所述目标排版规则对所述若干标准信息元素进行排版,包括:生成所述若干标准信息元素中的字符元素对应的字符区域对象和生成所述若干标准信息元素中的图形元素对应的图形区域对象;确定所述标准信息元素需占用的版面参数,所述版面参数包括用于排版所述字符区域对象的位置参数和用于排版所述图形区域对象的位置参数;按照所述目标排版规则,根据所述版面参数排版所述字符区域对象和所述图形区域对象
。5.
根据权利要求4所述的方法,其中,所述方法还包括:判断所述字符区域对象与所述图形区域对象是否存在交叉;若是,则确定所述字符区域对象与所述图形区域对象发生交叉的交叉区域;分割所述交叉区域,其中分割所述交叉区域的分割线的斜率应满足:所述斜率使得存在交叉的所述字符区域对象和所述图形区域对象之中任意一个距离分割线最近的点到分割线的直线距离最远;根据分割后的所述交叉区域,调整存在交叉的所述字符区域对象和所述图形区域对象的版面参数
。6.
根据权利要求2所述的方法,其中,所述按照所述图像类型对应的排版规则对所述若干信息元素进行排版,包括:确定所述图像类型对应的目标排版规则;根据所述目标排版规则从所述若干标准信息元素中选取与所述图像类型对应的目标标准信息元素;按照所述目标排版规则对所述目标标准信息元素进行排版
。
7.
根据权利要求1所述的方法,其中,所述根据所述图像类型对所述电子图像进行目标检测,以识别所述电子图像中与所述待录入信息对应的若干信息元素,包括:根据所述图像类型对所...
【专利技术属性】
技术研发人员:徐达峰,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。