【技术实现步骤摘要】
用于生成图像的方法及装置
[0001]本申请公开了一种用于生成图像的方法及装置,涉及计算机
,尤其涉及计算机视觉领域。
技术介绍
[0002]Html(超文本语言)网页中的文字和图片往往包含有重要信息,是非常有价值的素材。相关技术中,基于html网页中的文件,通过编码的方式确定其中要提取的素材,然后从服务端下载要提取的素材对应的文件,以获取html网页中的素材。
技术实现思路
[0003]本申请实施例提供了一种用于生成图像的方法、装置、设备以及存储介质。
[0004]根据第一方面,提供了一种用于生成图像的方法,该方法包括:获取终端预加载的网页的截图,作为源图像;识别源图像中的连通域,并在各连通域的轮廓外生成第一外接矩形框;若连通域之间的距离小于预设距离阈值,合并连通域,并在合并后的连通域的轮廓外生成第二外接矩形框;基于第一外接矩形框与第二外接矩形框之间的嵌套关系以及第一外接矩形框中的图片,生成目标图像。
[0005]根据第二方面,提供了一种用于生成图像的装置,该装置包括:图像获取模块,获 ...
【技术保护点】
【技术特征摘要】
1.一种用于生成图像的方法,包括:获取终端预加载的网页的截图,作为源图像;识别所述源图像中的连通域,并在各连通域的轮廓外生成第一外接矩形框;若所述连通域之间的距离小于预设距离阈值,合并所述连通域,并在合并后的连通域的轮廓外生成第二外接矩形框;基于所述第一外接矩形框与所述第二外接矩形框之间的嵌套关系以及所述第一外接矩形框中的图片,生成目标图像。2.根据权利要求1所述的方法,其中,基于所述第一外接矩形框与所述第二外接矩形框之间的嵌套关系以及所述第一外接矩形框中的图片,生成目标图像,包括:基于所述第一外接矩形框与所述第二外接矩形框之间的嵌套关系,将各所述第一外接矩形框中的图片组合成初始目标图像;确定出所述初始目标图像中的核心区域,所述初始目标图像中的核心区域为所述初始目标图像中包括预设目标的区域;基于预设的剪裁比例和尺寸,分割所述初始目标图像,得到分割后的核心区域的图片;基于所述分割后的核心区域的图片的特征信息,聚合所述分割后的核心区域的图片,得到所述目标图像,所述特征信息至少包括以下之一:尺寸、横纵比以及图片的构成属性。3.根据权利要求2所述的方法,其中,生成初始目标图像之前,所述方法还包括:识别所述第一外接矩形框中的图片,获得所述第一外接矩形框中的图片内容对应的识别结果;基于所述识别结果,将符合预设条件的第一外接矩形框删除。4.根据权利要求3所述的方法,其中,将符合预设条件的第一外接矩形框删除,之前还包括:基于所述识别结果,将所述识别结果对应的第一外接矩形框中的图片存入预设位置。5.根据权利要求3所述的方法,其中,生成初始目标图像之前,所述方法还包括:基于所述第一外接矩形框在所述源图像中的位置,将处于所述源图像中预设区域的第一外接矩形框删除。6.根据权利要求2至5之一所述的方法,其中,生成初始目标图像之前,所述方法还包括:若所述第一外接矩形框中的图片的清晰度小于预设清晰度阈值,删除所述第一外接矩形框。7.一种用于生成图像的装置,包括:图像获取模块,获取终端预加载的网页的截图,作为源图像;第一生成模块,被配置成识别所述源图像中的连通域,并在各连通域的轮廓外生成第一外接矩形框;第二生成模块,被配置成若所述连通域之间的距离小于预设距离阈值,合并所述连通域,并在合并后的连通域的轮廓外生成第二外接矩形...
【专利技术属性】
技术研发人员:焦阳,杨羿,王建国,李一,陈晓冬,刘林,贺翔,朱延峰,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。