样本图像数据的获取方法、模型的训练方法、装置和设备制造方法及图纸

技术编号:37711835 阅读:8 留言:0更新日期:2023-06-02 00:05
本公开提供了样本图像数据的获取方法、模型的训练方法、装置和设备,涉及人工智能技术领域,尤其涉及深度学习、图像处理等技术领域。具体实现方案为:通过浏览器访问网页页面;定位到所述网页页面中的目标DOM元素;将所述目标DOM元素滚动至所述浏览器的可视区域,并对所述可视区域进行截图,得到样本图像;将所述目标DOM元素的特征信息作为所述样本图像的标签;其中,样本图像数据包括所述样本图像和所述样本图像的标签,用于训练深度学习模型,所述深度学习模型用于预测图像中DOM元素的特征信息。信息。信息。

【技术实现步骤摘要】
样本图像数据的获取方法、模型的训练方法、装置和设备


[0001]本公开涉及人工智能
,尤其涉及深度学习、图像处理等


技术介绍

[0002]随着人工智能技术的发展,深度学习模型得到了广泛的应用,例如可以将深度学习模型应用于各种图像处理场景中。在训练深度学习模型时,往往需要用到大量的样本数据,样本数据的数据量越大,深度学习模型的学习效果越好。

技术实现思路

[0003]本公开提供了一种样本图像数据的获取方法及装置、一种深度学习模型的训练方法及装置、一种图像预测方法及装置、电子设备、存储介质以及计算机程序产品。
[0004]根据本公开的一方面,提供了一种样本图像数据的获取方法,包括:通过浏览器访问网页页面;定位到所述网页页面中的目标文档对象模型DOM(Document Object Model)元素;将所述目标DOM元素滚动至所述浏览器的可视区域,并对所述可视区域进行截图,得到样本图像;将所述目标DOM元素的特征信息作为所述样本图像的标签;其中,样本图像数据包括所述样本图像和所述样本图像的标签,用于训练深度学习模型,所述深度学习模型用于预测图像中DOM元素的特征信息。
[0005]根据本公开的另一方面,提供了一种深度学习模型的训练方法,包括:利用上述获取方法获取样本图像数据;其中,所述样本图像数据包括样本图像和所述样本图像的标签;将所述样本图像输入深度学习模型中,得到输出结果;根据所述输出结果以及所述样本图像的标签计算损失,并根据所述损失训练所述深度学习模型。
[0006]根据本公开的另一方面,提供了一种图像预测方法,包括:获取待预测图像;将所述待预测图像输入深度学习模型中,得到所述待预测图像中DOM元素的特征信息;其中,所述深度学习模型是利用上述训练方法训练得到的。
[0007]根据本公开的另一方面,提供了一种样本图像数据的获取装置,包括:网页访问模块,用于通过浏览器访问网页页面;元素定位模块,用于定位到所述网页页面中的目标DOM元素;图像获取模块,用于将所述目标DOM元素滚动至所述浏览器的可视区域,并对所述可视区域进行截图,得到样本图像;标签获取模块,用于将所述目标DOM元素的特征信息作为所述样本图像的标签;其中,样本图像数据包括所述样本图像和所述样本图像的标签,用于训练深度学习模型,所述深度学习模型用于预测图像中DOM元素的特征信息。
[0008]根据本公开的另一方面,提供了一种深度学习模型的训练装置,包括:样本获取模块,用于利用上述获取装置获取样本图像数据;其中,所述样本图像数据包括样本图像和所述样本图像的标签;样本输入模块,用于将所述样本图像输入深度学习模型中,得到输出结果;模型训练模块,用于根据所述输出结果以及所述样本图像的标签计算损失,并根据所述损失训练所述深度学习模型。
[0009]根据本公开的另一方面,提供了一种图像预测装置,包括:图像获取模块,用于获
取待预测图像;图像输入模块,用于将所述待预测图像输入深度学习模型中,得到所述待预测图像中DOM元素的特征信息;其中,所述深度学习模型是利用上述训练装置训练得到的。
[0010]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述获取方法、上述训练方法或者上述图像预测方法。
[0011]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行上述获取方法、上述训练方法或者上述图像预测方法。
[0012]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述获取方法、上述训练方法或者上述图像预测方法。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1是根据本公开一实施例的样本图像数据的获取方法的流程图;
[0016]图2是根据本公开一实施例的网页页面示意图;
[0017]图3是根据本公开一实施例的获取图2中的标题元素在可视区域的位置信息的示意图;
[0018]图4是根据本公开一实施例的样本图像数据的获取装置示意图;
[0019]图5是根据本公开一实施例的深度学习模型的训练方法的流程图;
[0020]图6是根据本公开一实施例的深度学习模型的训练装置示意图;
[0021]图7是根据本公开一实施例的图像预测方法的流程图;
[0022]图8是根据本公开一实施例的图像预测装置示意图;
[0023]图9是用来实现本公开实施例的方法的电子设备的框图。
具体实施方式
[0024]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0025]需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0026]根据本公开实施例,提供了一种样本图像数据的获取方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0027]图1是根据本公开实施例的样本图像数据的获取方法的流程图,如图1所示,该获取方法包括以下步骤S101至步骤S104:
[0028]步骤S101、通过浏览器访问网页页面。具体地,可以通过访问网页页面对应的地址实现访问网页页面。
[0029]步骤S102、定位到所述网页页面中的目标文档对象模型DOM元素。在具体实施中,所述网页页面中包括至少一种DOM元素,所述目标DOM元素可以为至少一种DOM元素中的任一个。
[0030]步骤S103、将所述目标DOM元素滚动至所述浏览器的可视区域,并对所述可视区域进行截图,得到样本图像。其中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种样本图像数据的获取方法,包括:通过浏览器访问网页页面;定位到所述网页页面中的目标文档对象模型DOM元素;将所述目标DOM元素滚动至所述浏览器的可视区域,并对所述可视区域进行截图,得到样本图像;将所述目标DOM元素的特征信息作为所述样本图像的标签;其中,样本图像数据包括所述样本图像和所述样本图像的标签,用于训练深度学习模型,所述深度学习模型用于预测图像中DOM元素的特征信息。2.根据权利要求1所述的获取方法,其中,所述定位到所述网页页面中的目标DOM元素,包括:通过运行目标脚本定位到所述网页页面中的目标DOM元素;其中,脚本与DOM元素的类型一一对应,所述目标DOM元素为所述网页页面中与所述目标脚本对应的类型的DOM元素中的任一个。3.根据权利要求1所述的获取方法,其中,所述定位到所述网页页面中的目标DOM元素,包括:识别所述网页页面中的所有DOM元素;从所有DOM元素中确定目标DOM元素;定位到所述网页页面中的目标DOM元素。4.根据权利要求1所述的获取方法,其中,所述特征信息包括以下中的至少一种:所述目标DOM元素的类型、所述目标DOM元素在所述可视区域中的位置信息、所述目标DOM元素的样式。5.根据权利要求1

4中任一项所述的获取方法,其中,所述浏览器为无头浏览器。6.一种深度学习模型的训练方法,包括:利用权利要求1

5中任一项所述的获取方法获取样本图像数据;其中,所述样本图像数据包括样本图像和所述样本图像的标签;将所述样本图像输入深度学习模型中,得到输出结果;根据所述输出结果以及所述样本图像的标签计算损失,并根据所述损失训练所述深度学习模型。7.一种图像预测方法,包括:获取待预测图像;将所述待预测图像输入深度学习模型中,得到所述待预测图像中DOM元素的特征信息;其中,所述深度学习模型是利用权利要求6所述的训练方法训练得到的。8.一种样本图像数据的获取装置,包括:网页访问模块,用于通过浏览器访问网页页面;元素定位模块,用于定位到所述网页页面中的目标DOM元素;图像获取模块,用于将所述目标DOM元素滚动至所述浏览器的可视区域,并对所述可视区域进行截图,得到样本图像;标签获取模块,用于将所述目标DOM元素的特征信息作为所述样本图像的标签;其中,样本图像数据包括所述样本图像和所述样本图像的标签,用于训练深度学习模
型,所述深度学习模型用于预测图像中DOM元素的特征信息。9.根据权利...

【专利技术属性】
技术研发人员:李宇航
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1