System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 标签传播的数据标注方法、装置、计算机设备及存储介质制造方法及图纸_技高网

标签传播的数据标注方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:40012379 阅读:10 留言:0更新日期:2024-01-16 15:28
本发明专利技术涉及数据标注领域,特别涉及一种标签传播的数据标注方法,采用信息量度量方法,从确认时间序列中若干个目标时间节点对应的训练样本,进行标签标注,并采用标签传播方法,通过将具有已标注数据的时间节点,将其相应的已标注数据传播到的该时间节点附近的其他时间节点,以此增加标签数据为已标注数据的时间节点对应的训练样本的覆盖率,提高分类模型训练的准确性以及效率性。

【技术实现步骤摘要】

本专利技术涉及数据标注领域,特别涉及是一种标签传播的数据标注方法、装置、计算机设备以及存储介质。


技术介绍

1、时间序列数据广泛应用于金融、医疗、工业等领域,时间序列的监督学习问题往往需要大量已标注的数据样本。然而,由于时间序列数据的事件描述往往是长期的、多维的,且需要专业人员进行复杂的分析,因此要获得大量已标注数据总是需要较高的标注成本。对此,主动学习提供了一个良好的解决方案,它通过选择关键样本和交互式查询专家来进行数据标注,进而降低样本标注的成本。然而,传统的主动学习方法并不适用于时间序列数据,因为它们假设数据点之间是彼此独立的,这对于时间序列数据来说显然不成立。

2、时间序列数据通常具有时间相关性的特点,时间连续的数据点往往具有相同的标签,我们将时间相关数据点的子序列称为段。因此,当利用主动学习方法从用户那里获得某个数据点的标签时,可以将相同的标签传播到同一段的其他数据点,以此来增加以带标签数据的覆盖率,加速模型的训练。

3、现有的几种针对时间序列的主动学习方法大多数仅适用于分段时间序列数据,其假设时间序列已分为标记片段和未标记片段。这些方法将各个片段视为独立同分布的,只需将现有的主动学习框架应用于这些片段即可,这与我们处理未分段时间序列数据的问题并不相符。


技术实现思路

1、基于此,本专利技术的目的在于,提供一种标签传播的数据标注方法、装置、计算机设备以及存储介质,采用信息量度量方法,从确认时间序列中若干个目标时间节点对应的训练样本,进行标签标注,并采用标签传播方法,通过将具有已标注数据的时间节点,将其相应的已标注数据传播到的该时间节点附近的其他时间节点,以此增加标签数据为已标注数据的时间节点对应的训练样本的覆盖率,提高分类模型训练的准确性以及效率性。方案具体如下:

2、第一方面,本申请实施例提供了一种标签传播的数据标注方法,包括以下步骤:

3、获得初始时间序列以及初始分类模型,其中,所述初始时间序列包括若干个时间节点对应的训练样本,所述训练样本包括各个所述时间节点对应的训练数据以及标签数据,所述标签数据包括未标注数据以及已标注数据;

4、将所述初始时间序列输入至所述初始分类模型中,采用信息量度量方法,从所述初始时间序列中确认若干个目标时间节点对应的训练样本,对若干个所述目标时间节点对应的训练样本进行标签标注,获得中间时间序列;

5、采用标签传播方法,将所述中间时间序列中,若干个时间节点对应的训练样本中的已标注数据双向传播至将相应的时间节点相邻的时间节点对应的训练样本中的标签数据,获得最终时间序列;

6、根据所述最终时间序列以及中间时间序列,对所述初始分类模型进行训练,获得训练完成的分类模型,将所述最终时间序列作为下一次训练的初始时间序列,所述训练完成的分类模型作为下一次训练的初始分类模型,重复上述步骤,直到训练完成的分类模型满足预设的条件,作为目标分类模型;

7、响应于标签标注指令,将待标注的时间序列输入至所述目标分类模型,获得所述待标注的时间序列的标签标注结果。

8、第二方面,本申请实施例提供了一种标签传播的数据标注装置,包括:

9、数据获得模块,用于获得初始时间序列以及初始分类模型,其中,所述初始时间序列包括若干个时间节点对应的训练样本,所述训练样本包括各个所述时间节点对应的训练数据以及标签数据,所述标签数据包括未标注数据以及已标注数据;

10、第一标签标注模块,用于将所述初始时间序列输入至所述初始分类模型中,采用信息量度量方法,从所述初始时间序列中确认若干个目标时间节点对应的训练样本,对若干个所述目标时间节点对应的训练样本进行标签标注,获得中间时间序列;

11、标签传播模块,用于采用标签传播方法,将所述中间时间序列中,若干个时间节点对应的训练样本中的已标注数据双向传播至将相应的时间节点相邻的时间节点对应的训练样本中的标签数据,获得最终时间序列;

12、模型训练模块,用于根据所述最终时间序列以及中间时间序列,对所述初始分类模型进行训练,获得训练完成的分类模型,将所述最终时间序列作为下一次训练的初始时间序列,所述训练完成的分类模型作为下一次训练的初始分类模型,重复上述步骤,直到训练完成的分类模型满足预设的条件,作为目标分类模型;

13、第二标签标注模块,用于响应于标签标注指令,将待标注的时间序列输入至所述目标分类模型,获得所述待标注的时间序列的标签标注结果。

14、第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述的标签传播的数据标注方法的步骤。

15、第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的标签传播的数据标注方法的步骤。

16、在本申请实施例中,提供一种标签传播的数据标注方法、装置、计算机设备以及存储介质,采用信息量度量方法,从确认时间序列中若干个目标时间节点对应的训练样本,进行标签标注,并采用标签传播方法,通过将具有已标注数据的时间节点,将其相应的已标注数据传播到的该时间节点附近的其他时间节点,以此增加标签数据为已标注数据的时间节点对应的训练样本的覆盖率,提高分类模型训练的准确性以及效率性。

17、为了更好地理解和实施,下面结合附图详细说明本专利技术。

本文档来自技高网...

【技术保护点】

1.一种标签传播的数据标注方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的标签传播的数据标注方法,其特征在于,所述将所述初始时间序列输入至所述初始分类模型中,采用信息量度量方法,从所述初始时间序列中确认若干个目标时间节点对应的训练样本,包括步骤:

3.根据权利要求2所述的标签传播的数据标注方法,其特征在于,所述采用置信度采样方法,根据若干个所述候选时间节点的训练样本中的训练数据,对若干个所述候选时间节点的训练样本进行信息量度量,获得若干个候选时间节点的训练样本的样本查询分数,包括步骤:

4.根据权利要求3所述的标签传播的数据标注方法,其特征在于,所述采用置信度采样方法,根据若干个所述候选时间节点的训练样本中的训练数据,对若干个所述候选时间节点的训练样本进行信息量度量,获得若干个候选时间节点的训练样本的样本查询分数,包括步骤:

5.根据权利要求2所述的标签传播的数据标注方法,其特征在于,所述采用熵值采样方法,根据若干个所述候选时间节点的训练样本中的训练数据,对若干个所述候选时间节点的训练样本进行信息量度量,获得若干个候选时间节点的训练样本的样本查询分数,包括步骤:

6.根据权利要求1所述的标签传播的数据标注方法,其特征在于,所述采用标签传播方法,将所述中间时间序列中,若干个时间节点对应的训练样本中的已标注数据双向传播至将相应的时间节点相邻的时间节点对应的训练样本中的标签数据,获得最终时间序列,包括步骤:

7.一种标签传播的数据标注装置,其特征在于,包括:

8.一种计算机设备,其特征在于,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如权利要求1至6中任一项所述的标签传播的数据标注方法的步骤。

9.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的标签传播的数据标注方法的步骤。

...

【技术特征摘要】

1.一种标签传播的数据标注方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的标签传播的数据标注方法,其特征在于,所述将所述初始时间序列输入至所述初始分类模型中,采用信息量度量方法,从所述初始时间序列中确认若干个目标时间节点对应的训练样本,包括步骤:

3.根据权利要求2所述的标签传播的数据标注方法,其特征在于,所述采用置信度采样方法,根据若干个所述候选时间节点的训练样本中的训练数据,对若干个所述候选时间节点的训练样本进行信息量度量,获得若干个候选时间节点的训练样本的样本查询分数,包括步骤:

4.根据权利要求3所述的标签传播的数据标注方法,其特征在于,所述采用置信度采样方法,根据若干个所述候选时间节点的训练样本中的训练数据,对若干个所述候选时间节点的训练样本进行信息量度量,获得若干个候选时间节点的训练样本的样本查询分数,包括步骤:

5.根据权利要求2所述的标签传播的数据标注方法,其特征在于,所述采用熵值采样...

【专利技术属性】
技术研发人员:周娴玮林怡帆余松森张楚略
申请(专利权)人:华南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1