本发明专利技术提供一种跨DIKW模态的混合特征机器学习建模与标记方法,该方法包括:获取应用于机器学习的训练集图片,所述训练集图片为经过标注的图片并至少包含一个识别目标,建立训练集图片的DIKW模型;对训练集图片进行裁剪处理,将其切分为多张训练集子图片;建立训练集子图片的DIKW模型,将训练集图片和训练集子图片输入到机器学习模型中对机器学习模型进行训练,令机器学习模型学习训练集子图片识别目标与训练集图片识别目标之间的整体与局部关系;将待标记图片输入到机器学习模型中,机器学习模型为待标记图片中的识别目标进行识别并添加标注框,为标注框中的识别目标添加标记。本发明专利技术能够提高机器学习所需的训练样本的标注效率。标注效率。标注效率。
【技术实现步骤摘要】
跨DIKW模态的混合特征机器学习建模与标记方法
[0001]本专利技术涉及机器学习
,尤其涉及一种跨DIKW模态的混合特征机器学习建模与标记方法。
技术介绍
[0002]机器学习的原理是用大量的数据去对模型进行堆砌训练,数据的质量对生成模型的质量会产生很大的影响,在机器学习模型的开发过程中,人们总是希望训练好的模型能够在新的、未见过的数据上表现良好,这对训练机器学习模型所用的数据质量提出了高要求,例如,当通过机器学习模型去识别包含有数字6的图片时,人们需要通过各种带有数字6和非数字6的图片对机器学习模型进行训练,当输入带有数字6的图片时,人们需要令机器学习模型认识到“这是6的概率为100%,不是6的概率为0”,反之亦然,即需要使用大量经过标注的数据对机器学习模型进行训练,特别是在图像识别领域,然而,目前对数据进行标注大多是人工进行,特别是在一些细分领域,例如医疗影像,所需的专业知识门槛较高,需要专职医生进行。对于一些被破坏的物体,机器学习模型也难以识别,因为在对其进行训练时所使用的图片中物体是完好的,但被破坏后物体形状可能会发生各种改变,导致机器学习模型对其识别率低。以上种种导致目前的数据标注难以摆脱人工方式,难以在兼顾效率的情况下产出高质量的标注数据。
技术实现思路
[0003]鉴于此,本专利技术的目的在于提供一种跨DIKW模态的混合特征机器学习建模与标记方法,以克服或至少部分解决现有技术所存在的上述问题。
[0004]为实现上述专利技术目的,本专利技术提供一种跨DIKW模态的混合特征机器学习建模与标记方法,所述方法包括以下步骤:
[0005]获取应用于机器学习的训练集图片,所述训练集图片为经过标注的图片并至少包含一个识别目标,建立训练集图片的DIKW模型;
[0006]对训练集图片进行裁剪处理,将其切分为多张训练集子图片;
[0007]建立训练集子图片的DIKW模型,将训练集图片和训练集子图片输入到机器学习模型中对机器学习模型进行训练,令机器学习模型学习训练集子图片识别目标与训练集图片识别目标之间的整体与局部关系;
[0008]将待标记图片输入到机器学习模型中,机器学习模型为待标记图片中的识别目标进行识别并添加标注框,为标注框中的识别目标添加标记。
[0009]进一步的,所述令机器学习模型学习训练集子图片与训练集图片之间的整体与局部关系,具体为:遍历训练集子图片DIKW模型节点,查找训练集图片DIKW模型中与其相匹配的节点,根据与其相匹配的节点在训练集图片DIKW模型中的位置及其内容判断训练集子图片与训练集图片的整体与局部关系。
[0010]进一步的,还将训练集子图片的位置组合进行调整,将训练集图片和经过位置调
整的训练集子图片输入到机器学习模型中对机器学习模型进行训练,令机器学习模型学习训练集子图片识别目标与训练集图片识别目标之间的结构关系。
[0011]进一步的,所述令机器学习模型学习训练集子图片与训练集图片之间的结构关系,具体包括以下步骤:
[0012]识别经过位置调整的训练集子图片,查询其对应的DIKW模型;
[0013]基于训练集子图片的DIKW模型查找与训练集子图片中的识别目标相关的类型资源,所述与训练集子图片中的识别目标相关的类型资源称为相关类型资源;
[0014]在训练集图片的DIKW模型中查找与相关类型资源内容相同的对应类型资源;
[0015]根据训练集图片的DIKW模型中的知识模型和对应类型资源判断训练集子图片与训练集图片之间的结构关系。
[0016]进一步的,还将不同的训练集图片进行跨图片组合,将组合后的图片输入到机器学习模型中,令机器学习模型学习时空维度下的识别目标变化性。
[0017]进一步的,所述将不同训练集的图片进行跨图片组合,将组合后的图片输入到机器学习模型中,令机器学习模型学习时空维度下的识别目标变化性,具体包括以下步骤:
[0018]将不同的训练集图片通过图层叠加或拼接的方式进行跨图片组合,得到组合后图片;
[0019]将组合后图片输入到机器学习模型中,机器学习模型对组合后图片中的识别目标进行识别并添加标注框,对标注框中的识别目标进行类型化获得类型资源;
[0020]根据所获得的类型资源对识别目标原先所属的训练集图片的DIKW模型进行更新。
[0021]进一步的,所述机器学习模型为待标记图片中的识别目标进行识别并添加标注框,为标注框中的识别目标添加标记,具体包括:
[0022]对待标记图片的背景、识别目标进行类型化得到相应的类型资源,将背景类型资源和识别目标类型资源进行模态运算得到新的识别目标类型资源;
[0023]根据识别目标类型资源查询识别目标DIKW模型,根据识别目标类型资源和识别目标DIKW模型对识别目标进行标注。
[0024]与现有技术相比,本专利技术的有益效果是:
[0025]本专利技术所提供的一种跨DIKW模态的混合特征机器学习建模与标记方法,首先为训练集图片建立DIKW模型,并对训练集图片进行裁剪处理,将其切分为多张训练集子图片,为训练集子图片建立DIKW模型,将训练集图片和训练集子图片输入到机器学习模型中,令机器学习模型在两者DIKW模型的基础上学习训练集图片和训练集子图片之间整体与局部的关系,从而使得机器学习模型在面对不完整的识别目标时能够有更好的识别准确率,并能够基于DIKW模型确定识别目标的本质,对图片进行自动标记,从而产出高质量的训练数据。
附图说明
[0026]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的优选实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0027]图1是本专利技术实施例提供的跨DIKW模态的混合特征机器学习建模与标记方法整体
流程示意图。
[0028]图2是本专利技术实施例提供的机器学习模型学习训练集子图识别目标与训练集图片识别目标之间的结构关系流程示意图。
[0029]图3是本专利技术实施例提供的机器学习模型学习时空维度下的识别目标变化性流程示意图。
[0030]图4是本专利技术实施例提供的机器学习模型标注待标记图片流程示意图。
具体实施方式
[0031]以下结合附图对本专利技术的原理和特征进行描述,所列举实施例只用于解释本专利技术,并非用于限定本专利技术的范围。
[0032]参照图1,本实施例提供一种跨DIKW模态的混合特征机器学习建模与标记方法,所述方法包括以下步骤:
[0033]S101、获取应用于机器学习的训练集图片,所述训练集图片为经过标注的图片并至少包含一个识别目标,建立训练集图片的DIKW模型。
[0034]所述DIKW模型由类型资源构成,包括数据模型、信息模型、知识模型和智慧模型,一些情况下还包括意图模型,各个模型由相应的类型资源组成。所述类型资源包括数据资源本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种跨DIKW模态的混合特征机器学习建模与标记方法,其特征在于,所述方法包括以下步骤:获取应用于机器学习的训练集图片,所述训练集图片为经过标注的图片并至少包含一个识别目标,建立训练集图片的DIKW模型;对训练集图片进行裁剪处理,将其切分为多张训练集子图片;建立训练集子图片的DIKW模型,将训练集图片和训练集子图片输入到机器学习模型中对机器学习模型进行训练,令机器学习模型学习训练集子图片识别目标与训练集图片识别目标之间的整体与局部关系;将待标记图片输入到机器学习模型中,机器学习模型为待标记图片中的识别目标进行识别并添加标注框,为标注框中的识别目标添加标记。2.根据权利要求1所述的一种跨DIKW模态的混合特征机器学习建模与标记方法,其特征在于,所述令机器学习模型学习训练集子图片与训练集图片之间的整体与局部关系,具体为:遍历训练集子图片DIKW模型节点,查找训练集图片DIKW模型中与其相匹配的节点,根据与其相匹配的节点在训练集图片DIKW模型中的位置及其内容判断训练集子图片与训练集图片的整体与局部关系。3.根据权利要求1所述的一种跨DIKW模态的混合特征机器学习建模与标记方法,其特征在于,还将训练集子图片的位置组合进行调整,将训练集图片和经过位置调整的训练集子图片输入到机器学习模型中对机器学习模型进行训练,令机器学习模型学习训练集子图片识别目标与训练集图片识别目标之间的结构关系。4.根据权利要求3所述的一种跨DIKW模态的混合特征机器学习建模与标记方法,其特征在于,所述令机器学习模型学习训练集子图片与训练集图片之间的结构关系,具体包括以下步骤:识别经过位置调整的训练集子图片,查询其对应的DIKW模型;基于训练集子图片的DIKW...
【专利技术属性】
技术研发人员:段玉聪,
申请(专利权)人:海南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。