样本图像数据的获取方法、模型的训练方法、装置和设备制造方法及图纸

技术编号：37711835 阅读：8 留言：0更新日期：2023-06-02 00:05

本公开提供了样本图像数据的获取方法、模型的训练方法、装置和设备，涉及人工智能技术领域，尤其涉及深度学习、图像处理等技术领域。具体实现方案为：通过浏览器访问网页页面；定位到所述网页页面中的目标DOM元素；将所述目标DOM元素滚动至所述浏览器的可视区域，并对所述可视区域进行截图，得到样本图像；将所述目标DOM元素的特征信息作为所述样本图像的标签；其中，样本图像数据包括所述样本图像和所述样本图像的标签，用于训练深度学习模型，所述深度学习模型用于预测图像中DOM元素的特征信息。信息。信息。

全部详细技术资料下载

【技术实现步骤摘要】
样本图像数据的获取方法、模型的训练方法、装置和设备

[0001]本公开涉及人工智能
，尤其涉及深度学习、图像处理等

技术介绍

[0002]随着人工智能技术的发展，深度学习模型得到了广泛的应用，例如可以将深度学习模型应用于各种图像处理场景中。在训练深度学习模型时，往往需要用到大量的样本数据，样本数据的数据量越大，深度学习模型的学习效果越好。

技术实现思路

[0003]本公开提供了一种样本图像数据的获取方法及装置、一种深度学习模型的训练方法及装置、一种图像预测方法及装置、电子设备、存储介质以及计算机程序产品。
[0004]根据本公开的一方面，提供了一种样本图像数据的获取方法，包括：通过浏览器访问网页页面；定位到所述网页页面中的目标文档对象模型DOM(Document Object Model)元素；将所述目标DOM元素滚动至所述浏览器的可视区域，并对所述可视区域进行截图，得到样本图像；将所述目标DOM元素的特征信息作为所述样本图像的标签；其中，样本图像数据包括所述样本图像和所述样本图像的标签，用于训练深度学习模型，所述深度学习模型用于预测图像中DOM元素的特征信息。
[0005]根据本公开的另一方面，提供了一种深度学习模型的训练方法，包括：利用上述获取方法获取样本图像数据；其中，所述样本图像数据包括样本图像和所述样本图像的标签；将所述样本图像输入深度学习模型中，得到输出结果；根据所述输出结果以及所述样本图像的标签计算损失，并根据所述损失训练所述深度学习模型。
[00...

【技术保护点】

【技术特征摘要】
1.一种样本图像数据的获取方法，包括：通过浏览器访问网页页面；定位到所述网页页面中的目标文档对象模型DOM元素；将所述目标DOM元素滚动至所述浏览器的可视区域，并对所述可视区域进行截图，得到样本图像；将所述目标DOM元素的特征信息作为所述样本图像的标签；其中，样本图像数据包括所述样本图像和所述样本图像的标签，用于训练深度学习模型，所述深度学习模型用于预测图像中DOM元素的特征信息。2.根据权利要求1所述的获取方法，其中，所述定位到所述网页页面中的目标DOM元素，包括：通过运行目标脚本定位到所述网页页面中的目标DOM元素；其中，脚本与DOM元素的类型一一对应，所述目标DOM元素为所述网页页面中与所述目标脚本对应的类型的DOM元素中的任一个。3.根据权利要求1所述的获取方法，其中，所述定位到所述网页页面中的目标DOM元素，包括：识别所述网页页面中的所有DOM元素；从所有DOM元素中确定目标DOM元素；定位到所述网页页面中的目标DOM元素。4.根据权利要求1所述的获取方法，其中，所述特征信息包括以下中的至少一种：所述目标DOM元素的类型、所述目标DOM元素在所述可视区域中的位置信息、所述目标DOM元素的样式。5.根据权利要求1
‑
4中任一项所述的获取方法，其中，所述浏览器为无头浏览器。6.一种深度学习模型的训练方法，包括：利用权利要求1
‑
5中任一项所述的获取方法获取样本图像数据；其中，所述样本图像数据包括样本图像和所述样本图像的标签；将所述样本图像输入深度学习模型中，得到输出结果；根据所述输出结果以及所述样本图像的标签计算损失，并根据所述损失训练所述深度学习模型。7.一种图像预测方法，包括：获取待预测图像；将所述待预测图像输入深度学习模型中，得到所述待预测图像中DOM元素的特征信息；其中，所述深度学习模型是利用权利要求6所述的训练方法训练得到的。8.一种样本图像数据的获取装置，包括：网页访问模块，用于通过浏览器访问网页页面；元素定位模块，用于定位到所述网页页面中的目标DOM元素；图像获取模块，用于将所述目标DOM元素滚动至所述浏览器的可视区域，并对所述可视区域进行截图，得到样本图像；标签获取模块，用于将所述目标DOM元素的特征信息作为所述样本图像的标签；其中，样本图像数据包括所述样本图像和所述样本图像的标签，用于训练深度学习模
型，所述深度学习模型用于预测图像中DOM元素的特征信息。9.根据权利...

【专利技术属性】
技术研发人员：李宇航，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人