结构图的内容识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：32564963 阅读：11 留言：0更新日期：2022-03-09 16:50

本发明专利技术公开了一种结构图的内容识别方法，对目标结构图片进行结构识别，识别出所述目标结构图片中的m个图形器单元和n个文本框，其中，m和n均为正整数；对所述目标结构图片进行文本识别，得到n个文本信息，其中，n为正整数；将所述m个图形器单元、所述n个文本框和所述n个文本信息进行匹配，得到所述目标结构图片中的目标结构图。本发明专利技术公开的结构图的内容识别方法、装置及电子设备，能够对结构图片中的结构图进行还原，且能够提高还原效率。且能够提高还原效率。且能够提高还原效率。

全部详细技术资料下载

【技术实现步骤摘要】
结构图的内容识别方法、装置、电子设备及存储介质

[0001]本专利技术涉及图像处理
，特别涉及一种结构图的内容识别方法、装置及电子设备。

技术介绍

[0002]随着互联网技术的飞速发展，为了提高展示效果，通常是将各种结构图以图片的方式进行展示，使得用户的体验更好。
[0003]但是在结构图以图片的方式进行展示时，若需要获取图片中的内容，通常是对图片中的结构图中的图形器和文本进行分类检测，以提取到结构图中的图形器和文本，但两者之间的关联关系无法识别。
[0004]如此，亟需一种能够还原图片中的结构图的方法。

技术实现思路

[0005]本专利技术实施例提供一种结构图的内容识别方法、装置及电子设备，能够对结构图片中的结构图进行还原，且能够提高还原效率。
[0006]本专利技术实施例第一方面提供一种结构图的内容识别方法，所述方法包括：
[0007]对目标结构图片进行结构识别，识别出所述目标结构图片中的m个图形器单元和n个文本框，其中，m和n均为正整数；
[0008]对所述目标结构图片进行文本识别，得到n个文本信息，其中，n为正整数；
[0009]将所述m个图形器单元、所述n个文本框和所述n个文本信息进行匹配，得到所述目标结构图片中的目标结构图。
[0010]可选的，所述对目标结构图片进行结构识别，识别出所述目标结构图片中的m个图形器单元和n个文本框，包括：
[0011]通过预先训练的深度学习模型对所述目标结构图片进行结构识别，识别出所述m个...

【技术保护点】

【技术特征摘要】
1.一种结构图的内容识别方法，其特征在于，所述方法包括：对目标结构图片进行结构识别，识别出所述目标结构图片中的m个图形器单元和n个文本框，其中，m和n均为正整数；对所述目标结构图片进行文本识别，得到n个文本信息，其中，n为正整数；将所述m个图形器单元、所述n个文本框和所述n个文本信息进行匹配，得到所述目标结构图片中的目标结构图。2.如权利要求1所述的方法，其特征在于，所述对目标结构图片进行结构识别，识别出所述目标结构图片中的m个图形器单元和n个文本框，包括：通过预先训练的深度学习模型对所述目标结构图片进行结构识别，识别出所述m个图形器单元和n个文本框，其中，每个图形器单元包括图形器形状和图形位置。3.如权利要求2所述的方法，其特征在于，每个所述图形器单元还包括与所述图形器形状对应的图形颜色，每个所述文本框包括文本类别。4.如权利要求3所述的方法，其特征在于，所述深度学习模型的训练步骤，包括：获取训练样本集，所述训练样本集中每个训练样本包括训练结构图片，及所述训练结构图片中的图形标注信息和文本框标注信息，所述图形标注信息包括图形器形状和图形位置；利用所述每个训练结构图片、所述每个训练结构图片中的所述图形标注信息和所述文本框标注信息进行模型训练，得到所述深度学习模型。5.如权利要求4所述的方法，其特征在于，所述对所述目标结构图片进行文本识别，得到n个文本信息，包括：通过文字识别方法对所述目标结构图片进行文本识别，得到所述n个文本信息，其中，每个文本信息还包括文本类别。6.如权利要求5所述的方法，其特征在于，所述将所述m个图形器单元、所述n个文本框和所述n个文本信息进行匹配，得到所述目标结构图片中的目标结构图，包括：获取所述n个文本信息和所述n个文本框的文本对应关系；获取所述n个文本框和所述m个图形...

【专利技术属性】
技术研发人员：赵志勇，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人