采集用于训练机器学习(ML)模型的数据的方法和系统技术方案

技术编号:33340919 阅读:22 留言:0更新日期:2022-05-08 09:26
本发明专利技术题为“采集用于训练机器学习(ML)模型的数据的方法和系统”。本文所公开的各种实施方案描述了一种方法,该方法包括从标记扫描仪接收标记数据。该标记数据至少包括基于对图像中的标记进行解码而获得的解码数据、包括该标记的一部分的图像图块和/或该标记的该部分的一个或多个角部在该图像中的位置。此外,该方法包括至少基于该解码数据来生成理想标记的图像。此后,修改该理想标记的该图像以生成该理想标记的经修改图像。此外,从经修改图像中检索该标记的该部分。干净图像图块包括该理想标记的一部分。此外,该方法包括生成训练数据,其中该训练数据包括该标记的该部分和该理想标记的该部分。想标记的该部分。想标记的该部分。

【技术实现步骤摘要】
采集用于训练机器学习(ML)模型的数据的方法和系统


[0001]本公开的示例性实施方案整体涉及机器学习(ML)模型,并且更具体地讲,涉及用于采集用于训练ML模型的数据的系统和方法。

技术介绍

[0002]一般来讲,机器学习(ML)模型可对应于能够预测结果的数学模型和/或概率模型。此外,可基于要使用ML模型的域来优化ML模型。例如,在标记扫描域中,ML模型可用于识别标记扫描仪的视野中的标记。此外,在一些情况下,ML模型可用于解码标记。在部署ML模型之前,可以在训练数据上训练ML模型。

技术实现思路

[0003]本文所公开的各种实施方案描述了一种方法,该方法包括从标记扫描仪接收标记数据。该标记数据至少包括基于对图像中的标记进行解码而获得的解码数据、包括该标记的一部分的图像图块和/或该标记的该部分的一个或多个角部在该图像中的位置。此外,该方法包括至少基于该解码数据来生成理想标记的图像。此后,修改该理想标记的该图像以生成该理想标记的经修改图像。此外,从经修改图像中检索该标记的该部分。干净图像图块包括该理想标记的一部分。此外,该方法包括生成训练数据,其中该训练数据包括该标记的该部分和该理想标记的该部分。
[0004]本文所示的各种实施方案描述了中央服务器,该中央服务器包括具有一组指令的存储器设备。处理器被配置为执行该组指令,其中该处理器被配置为从标记扫描仪接收标记数据,其中该标记数据至少包括基于对图像中的标记进行解码而获得的解码数据、包括该标记的一部分的图像图块和/或该标记的该部分的一个或多个角部在该图像中的位置。该处理器还被配置为至少基于该解码数据来生成理想标记的图像。此外,该处理器被配置为修改该理想标记的该图像以生成该理想标记的经修改图像,其中该理想标记在该经修改图像中的取向与该标记在该图像中的取向相同。另外,该处理器被配置为基于该标记的该部分的一个或多个角部在该图像中的该位置从该理想标记的该经修改图像中检索干净图像图块,其中该干净图像图块包括该理想标记的一部分。此外,该处理器被配置为生成训练数据,其中该训练数据包括该标记的该部分和该理想标记的该部分。
[0005]本文所示的各种实施方案描述了标记扫描仪,该标记扫描仪包括图像捕获单元,该图像捕获单元被配置为捕获该标记扫描仪的视野的图像,其中该图像包括标记。此外,该标记扫描仪包括可通信地耦接到该图像捕获单元的处理器。该处理器被配置为将该图像分割成多个图像图块。此外,该处理器被配置为确定该多个图像图块中的一个或多个图像图块中的每个图像图块的质量分数,其中该一个或多个图像图块包括该标记的一部分。另外,该处理器被配置为基于与该一个或多个图像图块中的每个图像图块相关联的该质量分数来选择该一个或多个图像图块中的图像图块。此外,该处理器被配置为将该图像图块传输到中央服务器,其中该图像图块构成用于训练机器学习模型的训练数据。
附图说明
[0006]可结合附图阅读例示性实施方案的描述。应当理解,为了说明的简单和清晰,图中所示的元件不一定按比例绘制。例如,元件中的一些元件的尺寸相对于其他元件被夸大。结合本公开的教导的实施方案相对于文中给出的附图示出和描述,在附图中:
[0007]图1示出了实现本公开的各种实施方案的系统环境;
[0008]图2示出了根据本文所述一个或多个实施方案的标记扫描仪的框图;
[0009]图3示出了根据本文所述一个或多个实施方案的用于操作标记扫描仪的方法的流程图;
[0010]图4示出了根据本文所述一个或多个实施方案的示例性图像;
[0011]图5示出了根据本文所述一个或多个实施方案的用于从图像中检索图像图块的方法的流程图;
[0012]图6示出了根据本文所述一个或多个实施方案的示例性图像;
[0013]图7示出了根据本文所述一个或多个实施方案的中央服务器的框图;
[0014]图8示出了根据本文所述一个或多个实施方案的用于操作中央服务器的方法的流程图;
[0015]图9示出了根据本文所述一个或多个实施方案的用于渲染经修改图像的方法的流程图;
[0016]图10示出了根据本文所述一个或多个实施方案的用于从标记的部分移除非标记图像部分(包含辅助信息)的方法的流程图;并且
[0017]图11是示出根据本文所述一个或多个实施方案的在中央服务器处执行的操作的示例性流程图。
具体实施方式
[0018]在下文中将参考附图更全面地描述本公开的一些实施方案,附图中示出了本公开的一些实施方案,但未示出全部实施方案。实际上,这些公开内容可以以许多不同的形式体现,并且不应该被解释为限于本文所阐述的实施方案;相反,提供这些实施方案是为了使本公开满足适用的法律要求。在全篇内容中,类似的标号指代类似的元件。
[0019]除非上下文另作要求,否则在整个本说明书和随后的权利要求中,词语“包括”及其变型形式诸如“包含”和“具有”应以开放意义来解释,即解释为“包括但不限于”。
[0020]在整个本说明书中对“一个实施方案”或“实施方案”的提及意指结合该实施方案描述的特定特征、结构或特性包括在至少一个实施方案中。因此,短语“在一个实施方案中”或“在实施方案中”在整个本说明书的各个地方的出现不一定都指同一实施方案。此外,来自一个或多个实施方案的一个或多个特定特征、结构或特性可在一个或多个其他实施方案中以任何合适的方式组合。
[0021]本文使用的词语“示例”或“示例性”意指“用作示例、实例或说明”。本文描述为“示例性”的任何具体实施不一定被理解为比其他具体实施优选或有利。
[0022]如果说明书陈述了部件或特征“可以”、“能够”、“能”、“应当”、“将”、“优选地”、“有可能地”、“通常”、“任选地”、“例如”、“经常”或“可能”(或其他此类语言)被包括或具有特性,则具体部件或特征不是必须被包括或具有该特性。此类部件或特征可任选地包括在一
些实施方案中,或可排除在外。
[0023]本公开中的术语“电子联接(electronically coupled)”、“电子联接(electronically coupling)”、“电子联接(electronically couple)”、“与...通信”、“与...电子通信”或“连接”是指两个或更多个部件通过有线装置(例如但不限于系统总线、有线以太网)和/或无线装置(例如但不限于Wi

Fi、蓝牙、ZigBee)连接(直接或间接),使得可向这些部件传输和/或从这些部件接收数据和/或信息。
[0024]术语“标记”广义地旨在包括任何标记或机器可读代码,包括线性符号、2D条形码(诸如QR码和数据矩阵码)、RFID标签、IR标签、近场通信(NFC)标签和可由计算设备(例如,标记扫描仪)读取的字符。标记通常是信息(例如,数据)的图形表示,诸如产品编号、包装跟踪号、患者条形码符号标识符号、药物跟踪标识符、人员条形码符号标识符号等。
[0025]术语“质量”可以指标准或协议,基于该标准或本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,包括:由处理器接收来自标记扫描仪的标记数据,其中所述标记数据至少包括基于对图像中的标记进行解码而获得的解码数据、包括所述标记的一部分的图像图块和/或所述标记的所述部分的一个或多个角部在所述图像中的位置;由所述处理器至少基于所述解码数据来生成理想标记的图像;由所述处理器修改所述理想标记的所述图像以生成所述理想标记的经修改图像,其中所述理想标记在所述经修改图像中的取向与所述标记在所述图像中的取向相同;由所述处理器基于所述标记的所述部分的所述一个或多个角部在所述图像中的所述位置从所述理想标记的所述经修改图像中检索干净图像图块,其中所述干净图像图块包括所述理想标记的一部分;以及由所述处理器生成训练数据,其中所述训练数据包括所述标记的所述部分和所述理想标记的所述部分。2.根据权利要求1所述的方法,还包括:接收所述标记的一个或多个角部在所述图像中的所述位置和与所述标记相关联的条形码符号标识符,以及基于所述条形码符号标识符来生成所述理想标记的所述图像。3.根据权利要求2所述的方法,所述方法还包括由所述处理器确定所述理想标记的一个或多个角部在所述理想标记的所述图像中的位置。4.根据权利要求3所述的方法,还包括由所述处理器基于所述理想标记的所述一个或多个角部在所述理想标记的所述图像中的所...

【专利技术属性】
技术研发人员:保罗
申请(专利权)人:手持产品公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1