数字检测数据集生成方法、模型训练方法及相关装置制造方法及图纸

技术编号：40797132 阅读：4 留言：0更新日期：2024-03-28 19:24

本发明专利技术提供了一种数字检测数据集生成方法、模型训练方法及相关装置，涉及计算机技术领域。该方法包括：获得至少一种字体对应的字体文件；获得多张图片作为背景图片；根据获得的至少一个字体文件，生成多个数字字符串；针对各数字字符串，将数字字符串与背景图片进行叠加，得到数字图片，并获得数字图片对应的第一标注文件，以得到第一数字检测数据集，第一标注文件用于指示数字图片中的数字字符串中的各字符的位置及字符值。如此，可快速生成训练时要使用的图片以得到数字检测数据集，从而解决训练数字检测模型时实际场景数据采集工作繁重的问题，并且可丰富数据集的多样性，提高数字检测模型的准确率和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机，具体而言，涉及一种数字检测数据集生成方法、模型训练方法及相关装置。

技术介绍

1、生活中各类仪表等基本都涉及到数字读数，一个准确的数字检测模型可以大大减轻人工读数的工作量，具有广泛的应用前景。为了训练一个好的数字检测模型，往往需要真实场景真实仪表采集的数据，这个采集的工作量是巨大的，并且现实场景中很多仪表的图片难以用人工去收集。

技术实现思路

1、本专利技术实施例提供了一种数字检测数据集生成方法、模型训练方法及相关装置，其能够快速生成训练时要使用的图片以得到数字检测数据集，从而解决训练数字检测模型时实际场景数据采集工作繁重的问题，并且可丰富数据集的多样性，提高数字检测模型的准确率和鲁棒性。

2、本专利技术的实施例可以这样实现：

3、第一方面，本专利技术实施例提供一种数字检测数据集生成方法，所述方法包括：

4、获得至少一种字体对应的字体文件；

5、获得多张图片作为背景图片；

6、根据获得的至少一个所述字体文件，生成多个数字字符串；

7、针对各所述数字字符串，将所述数字字符串与所述背景图片进行叠加，得到数字图片，并获得所述数字图片对应的第一标注文件，其中，第一数字检测数据集中包括多张所述数字图片及各所述数字图片对应的第一标注文件，所述第一标注文件用于指示数字图片中的数字字符串中的各字符的位置及字符值。

8、第二方面，本专利技术实施例提供一种模型训练方法，所述方法包括：

10、根据所述目标数字检测数据集对初始模型进行训练，得到数字检测模型。

11、第三方面，本专利技术实施例提供一种数字检测数据集生成装置，所述装置包括：

12、获得模块，用于获得至少一种字体对应的字体文件；

13、所述获得模块，还用于获得多张图片作为背景图片；

14、字符串生成模块，用于根据获得的至少一个所述字体文件，生成多个数字字符串；

15、处理模块，用于针对各所述数字字符串，将所述数字字符串与所述背景图片进行叠加，得到数字图片，并获得所述数字图片对应的第一标注文件，其中，第一数字检测数据集中包括多张所述数字图片及各所述数字图片对应的第一标注文件，所述第一标注文件用于指示数字图片中的数字字符串中的各字符的位置及字符值。

16、第四方面，本专利技术实施例提供一种电子设备，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的机器可执行指令，所述处理器可执行所述机器可执行指令以实现前述实施方式所述的数字检测数据集生成方法，或实现前述实施方式所述的模型训练方法。

17、第五方面，本专利技术提供一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现前述实施方式所述的数字检测数据集生成方法，或实现前述实施方式所述的模型训练方法。

18、本专利技术实施例提供的数字检测数据集生成方法、模型训练方法及相关装置，在获得至少一种字体对应的字体文件及多张背景图片的情况下，根据获得的字体文件生成多个数字字符串，并针对该数字字符串，将该数字字符串与背景图片叠加，从而得到数字图片，并获得该数字图片对应的第一标注文件，从而得到包括多张数字图片及各数字图片对应的第一批注文件的第一数字检测数据集，该第一标注文件用于指示数字图片中的数字字符串中的各字符的位置及字符值。如此，通过将获得的字体文件中的数字和背景图片进行结合生成各式各样的数字图片，可快速获得包括多张数字图片及各数字图片对应的标注文件的数字检测数据集，可解决并且可极大丰富数据集的多样性，提高数字检测模型的准确率和鲁棒性。

本文档来自技高网...

【技术保护点】

1.一种数字检测数据集生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述数字字符串与所述背景图片进行叠加，得到数字图片，包括：

3.根据权利要求2所述的方法，其特征在于，添加噪声的方式包括以下至少一种：

4.根据权利要求1所述的方法，其特征在于，

5.根据权利要求1所述的方法，其特征在于，所述将所述数字字符串与所述背景图片进行叠加，包括：将所述数字字符串中的每个字符按照预设大小与所述背景图片进行叠加；

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

7.一种模型训练方法，其特征在于，所述方法包括：

8.一种数字检测数据集生成装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的机器可执行指令，所述处理器可执行所述机器可执行指令以实现权利要求1-6中任意一项所述的数字检测数据集生成方法，或实现权利要求7所述的模型训练方法。

10.一种可读存储介质，其上存储有

...

【技术特征摘要】

1.一种数字检测数据集生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述数字字符串与所述背景图片进行叠加，得到数字图片，包括：

3.根据权利要求2所述的方法，其特征在于，添加噪声的方式包括以下至少一种：

4.根据权利要求1所述的方法，其特征在于，

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

【专利技术属性】
技术研发人员：黄乐，董培，庞建新，谭欢，
申请(专利权)人：深圳市优必选科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人