数据扩增方法与非瞬时计算机可读取介质技术

技术编号：36664562 阅读：13 留言：0更新日期：2023-02-21 22:39

本申请公开一种数据扩增方法与非瞬时计算机可读取介质，数据扩增方法包含以下步骤：自原始数据集中选择原始影像，其中原始数据集包含用于表示原始影像的标注区域的标注数据；选择至少部分原始影像位于标注区域中的内容作为第一目标影像；依据第一目标影像产生第一样本影像，其中第一样本影像包含第一目标影像以及不同于第一目标影像的第一边框图案，且原始影像位于标注区域中的内容不包含第一边框图案的至少一部分；以及将第一样本影像加入样本数据集，其中样本数据集用于输入机器学习模型。型。型。

全部详细技术资料下载

【技术实现步骤摘要】
数据扩增方法与非瞬时计算机可读取介质

[0001]本申请有关一种数据处理方法与非瞬时计算机可读取介质，尤指一种数据扩增方法与非瞬时计算机可读取介质。

技术介绍

[0002]为了提升机器学习模型的准确度，训练模型时不仅需要数量多且多样化的训练数据，训练数据的内容也要符合训练主题。虽然从网络上直接取得机器学习的公开数据集进行训练可加快产品的开发速度，但公开数据集中符合训练主题的样本数可能不足。另一方面，自行手动产生质精、量多又多样化训练数据(例如针对某种生物拍摄一系列影像)，将使得产品开发旷日废时，大幅增加时间成本。因此，现今与机器学习有关的产业正致力于研究能基于现有数据创造出额外训练数据的各种数据扩增技术。

技术实现思路

[0003]本申请提供一种数据扩增方法，其包含以下步骤步骤：自原始数据集中选择原始影像，其中原始数据集包含用于表示原始影像的标注区域的标注数据；选择至少部分原始影像位于标注区域中的内容作为第一目标影像；依据第一目标影像产生第一样本影像，其中第一样本影像包含第一目标影像以及不同于第一目标影像的第一边框图案，且原始影像位于标注区域中的内容不包含第一边框图案的至少一部分；以及将第一样本影像加入样本数据集，其中样本数据集用于输入机器学习模型。
[0004]本申请提供一种非瞬时计算机可读取介质。非瞬时计算机可读取介质储存有一或多个计算机可执行指令。当计算装置执行一或多个计算机可执行指令时，一或多个计算机可执行指令使得计算装置执行以下运作：自原始数据集中选择原始影像，其中原始数据集包含用于...

【技术保护点】

【技术特征摘要】
1.一种数据扩增方法，其特征在于，包含：自一原始数据集中选择一原始影像，其中该原始数据集包含用于表示该原始影像的一标注区域的一标注数据；选择至少部分该原始影像位于该标注区域中的内容作为一第一目标影像；依据该第一目标影像产生一第一样本影像，其中该第一样本影像包含该第一目标影像以及不同于该第一目标影像的一第一边框图案，且该原始影像位于该标注区域中的该内容不包含该第一边框图案的至少一部分；以及将该第一样本影像加入一样本数据集，其中该样本数据集用于输入一机器学习模型。2.如权利要求1所述的数据扩增方法，其特征在于，选择至少部分该原始影像位于该标注区域中的该内容作为该第一目标影像包含：在该标注区域中决定一目标区域，其中该目标区域具有随机决定的一位置、一长度和一宽度；以及选择该原始影像位于该目标区域中的内容作为该第一目标影像。3.如权利要求1所述的数据扩增方法，其特征在于，该标注区域中包含一人形对象，选择至少部分该原始影像位于该标注区域中的该内容作为该第一目标影像包含：选择该原始影像位于该标注区域中且包含该人形对象的上半部分的内容作为该第一目标影像。4.如权利要求1所述的数据扩增方法，其特征在于，依据该第一目标影像产生该第一样本影像包含：依据该第一目标影像在该原始影像中的位置，在该原始影像中决定一待撷取区域，其中该待撷取区域包含该第一目标影像；将该待撷取区域的一高度设定为该第一目标影像的一高度加上随机决定的一第一数值，并将该待撷取区域的一宽度设定为该第一目标影像的一宽度加上随机决定的一第二数值；以及撷取该原始影像位于该待撷取区域中的内容以产生该第一样本影像，其中该待撷取区域中不同于该第一目标影像的内容为该第一边框图案。5.如权利要求4所述的数据扩增方法，其特征在于，该带撷取区域与该第一目标影像共享一顶点，且该待撷取区域的相邻两边缘包...

【专利技术属性】
技术研发人员：杨朝勋，吴俊樟，陈世泽，
申请(专利权)人：瑞昱半导体股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人