数据扩增方法与非瞬时计算机可读取介质技术

技术编号:36664562 阅读:13 留言:0更新日期:2023-02-21 22:39
本申请公开一种数据扩增方法与非瞬时计算机可读取介质,数据扩增方法包含以下步骤:自原始数据集中选择原始影像,其中原始数据集包含用于表示原始影像的标注区域的标注数据;选择至少部分原始影像位于标注区域中的内容作为第一目标影像;依据第一目标影像产生第一样本影像,其中第一样本影像包含第一目标影像以及不同于第一目标影像的第一边框图案,且原始影像位于标注区域中的内容不包含第一边框图案的至少一部分;以及将第一样本影像加入样本数据集,其中样本数据集用于输入机器学习模型。型。型。

【技术实现步骤摘要】
数据扩增方法与非瞬时计算机可读取介质


[0001]本申请有关一种数据处理方法与非瞬时计算机可读取介质,尤指一种数据扩增方法与非瞬时计算机可读取介质。

技术介绍

[0002]为了提升机器学习模型的准确度,训练模型时不仅需要数量多且多样化的训练数据,训练数据的内容也要符合训练主题。虽然从网络上直接取得机器学习的公开数据集进行训练可加快产品的开发速度,但公开数据集中符合训练主题的样本数可能不足。另一方面,自行手动产生质精、量多又多样化训练数据(例如针对某种生物拍摄一系列影像),将使得产品开发旷日废时,大幅增加时间成本。因此,现今与机器学习有关的产业正致力于研究能基于现有数据创造出额外训练数据的各种数据扩增技术。

技术实现思路

[0003]本申请提供一种数据扩增方法,其包含以下步骤步骤:自原始数据集中选择原始影像,其中原始数据集包含用于表示原始影像的标注区域的标注数据;选择至少部分原始影像位于标注区域中的内容作为第一目标影像;依据第一目标影像产生第一样本影像,其中第一样本影像包含第一目标影像以及不同于第一目标影像的第一边框图案,且原始影像位于标注区域中的内容不包含第一边框图案的至少一部分;以及将第一样本影像加入样本数据集,其中样本数据集用于输入机器学习模型。
[0004]本申请提供一种非瞬时计算机可读取介质。非瞬时计算机可读取介质储存有一或多个计算机可执行指令。当计算装置执行一或多个计算机可执行指令时,一或多个计算机可执行指令使得计算装置执行以下运作:自原始数据集中选择原始影像,其中原始数据集包含用于表示原始影像的标注区域的标注数据;选择至少部分原始影像位于标注区域中的内容作为第一目标影像;依据第一目标影像产生第一样本影像,其中第一样本影像包含第一目标影像以及不同于第一目标影像的第一边框图案,且原始影像位于标注区域中的内容不包含第一边框图案的至少一部分;以及将第一样本影像加入样本数据集,其中样本数据集用于输入机器学习模型。
附图说明
[0005]图1为依据本申请一实施例的移动检测系统简化后功能方块图。图2为依据一实施例用于说明移动检测系统辨识移动对象的示意图。图3为依据本申请一实施例的数据扩增方法的步骤图。图4为依据一实施例的原始数据集中的原始影像的示意图。图5为依据一实施例用于说明计算装置产生随机决定的目标影像的示意图。图6为依据本申请一实施例用于说明计算装置产生目标影像的示意图。图7为依据一实施例用于说明计算装置产生样本影像的示意图。
图8为依据一实施例用于说明计算装置产生样本影像的示意图。图9为依据一实施例用于说明计算装置产生样本影像的示意图。
具体实施方式
[0006]以下将配合相关附图来说明本申请的实施例。在附图中,相同的标号表示相同或类似的组件或方法步骤。
[0007]图1为依据本申请一实施例的移动检测系统100简化后功能方块图。移动检测系统100包含影像捕获设备110、处理器120和电子装置130,其中处理器120耦接于影像捕获设备110,且通过网络耦接于电子装置130。处理器120用于判断影像捕获设备110拍摄的影像是否存在移动对象,并用于将包含移动对象的影像上传至电子装置130。电子装置130包含对象检测模型132,对象检测模型132可以是训练完成的机器学习模型。当电子装置130执行对象检测模型132时,电子装置130可判断处理器120上传的影像中是否包含特定对象,例如人形对象。
[0008]详细而言,处理器120可以将影像捕获设备110拍摄的连续两帧画面相减,藉由两帧画面中像素的灰阶值差异判断存在移动对象的区域。接着,为了节省数据流量,处理器120可自较晚的一帧画面中仅撷取包含移动对象的部分,并将撷取的部分上传以供电子装置130判断是否拍摄到特定对象。
[0009]图2为依据一实施例用于说明移动检测系统100辨识移动对象的示意图。图2所示的画面210为影像捕获设备110拍摄的一帧画面,且画面210包含移动对象MO。理想上,处理器120会判断区域212存在移动对象MO,并撷取区域212中的影像220以供电子装置130判断区域212中是否存在特定(例如人形)对象。然而,由于影像辨识算法会受到残影现象(ghost effect)影响,处理器120实际上会判断区域214存在移动对象MO,并上传区域214中的影像230给电子装置130。若对象检测模型132是以几乎不含背景的单纯人形影像进行训练(例如类似影像220的影像),则影像230右半部的额外背景部分可能会降低对象检测模型132的准确度。
[0010]为了提升对于移动对象的辨识正确率,本申请提供了一种数据扩增方法300。数据扩增方法300可以由各种合适的计算装置(未绘示)来执行,例如单或多芯片的通用处理器、现场可编程逻辑门阵列(FPGA)及专用集成电路(ASIC)等等。数据扩增方法300的步骤可被记录为非瞬时计算机可读取介质中的一或多个计算机可执行指令。当前述一或多个指令被计算装置执行时,这一或多个指令会使得计算装置执行数据扩增方法300。
[0011]图3为依据本申请一实施例的数据扩增(data augmentation)方法300的步骤图。首先,计算装置可以自一原始数据集中选择一张原始影像(如图4所示的原始影像410)。原始数据集可以是自因特网下载的公开影像数据集(例如Common Object in Context(COCO)数据集)、用户自行拍摄收集的影像数据集、或是前述两者的组合。在一些实施例中,原始数据集可以储存于与计算电路互相耦接的一内存电路(未绘示)之中,以供计算电路在执行数据扩增方法300时进行存取。
[0012]原始数据集包含多张原始影像(例如原始影像410)与标注数据。标注数据用于表示每张原始影像的标注区域(例如一定界框(bonding box)),且可以用于表示标注区域中的对象类型。例如,请参考图4,标注数据可记载原始影像410的标注区域412的左上角为具
有坐标(380,677)的坐标点Vla,以及记载标注区域412的高度HTa和宽度WDa。在一些实施例中,前述坐标值是以像素为单位。又例如,标注数据还可记载标注区域412所标示的对象为“person”,亦即人形对象。在一些实施例中,标注数据为可延伸标记式语言(XML)档案或文本文件。值得注意的是,图4的标注区域412是通过标注数据于原始影像410中所定义出的范围,不需要是实际存在于原始影像410中的框线。
[0013]接着,于步骤320,计算装置可以选择原始影像410位于标注区域412中的完整内容作为目标影像,并接着执行步骤330。在一些实施例中,计算装置可以选择原始影像410位于标注区域412中的内容的一部分作为目标影像(例如图5的目标影像520及图6的目标影像610)。换言之,计算装置可以选择原始影像410位于标注区域412中的至少部分内容作为目标影像,并基于目标影像接着执行步骤330。以下将配合图5和图6进一步说明步骤320。
[0014]图5为依据一实施例用于说明计算装置产生随本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据扩增方法,其特征在于,包含:自一原始数据集中选择一原始影像,其中该原始数据集包含用于表示该原始影像的一标注区域的一标注数据;选择至少部分该原始影像位于该标注区域中的内容作为一第一目标影像;依据该第一目标影像产生一第一样本影像,其中该第一样本影像包含该第一目标影像以及不同于该第一目标影像的一第一边框图案,且该原始影像位于该标注区域中的该内容不包含该第一边框图案的至少一部分;以及将该第一样本影像加入一样本数据集,其中该样本数据集用于输入一机器学习模型。2.如权利要求1所述的数据扩增方法,其特征在于,选择至少部分该原始影像位于该标注区域中的该内容作为该第一目标影像包含:在该标注区域中决定一目标区域,其中该目标区域具有随机决定的一位置、一长度和一宽度;以及选择该原始影像位于该目标区域中的内容作为该第一目标影像。3.如权利要求1所述的数据扩增方法,其特征在于,该标注区域中包含一人形对象,选择至少部分该原始影像位于该标注区域中的该内容作为该第一目标影像包含:选择该原始影像位于该标注区域中且包含该人形对象的上半部分的内容作为该第一目标影像。4.如权利要求1所述的数据扩增方法,其特征在于,依据该第一目标影像产生该第一样本影像包含:依据该第一目标影像在该原始影像中的位置,在该原始影像中决定一待撷取区域,其中该待撷取区域包含该第一目标影像;将该待撷取区域的一高度设定为该第一目标影像的一高度加上随机决定的一第一数值,并将该待撷取区域的一宽度设定为该第一目标影像的一宽度加上随机决定的一第二数值;以及撷取该原始影像位于该待撷取区域中的内容以产生该第一样本影像,其中该待撷取区域中不同于该第一目标影像的内容为该第一边框图案。5.如权利要求4所述的数据扩增方法,其特征在于,该带撷取区域与该第一目标影像共享一顶点,且该待撷取区域的相邻两边缘包...

【专利技术属性】
技术研发人员:杨朝勋吴俊樟陈世泽
申请(专利权)人:瑞昱半导体股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1