一种模型更新方法、装置及设备制造方法及图纸

技术编号:36503409 阅读:12 留言:0更新日期:2023-02-01 15:26
本说明书实施例公开了一种模型更新方法、装置及设备,方案包括:获取采用已训练完成的网络模型识别得到的多个识别数据;各个所述识别数据具有表示所述识别数据所处的人工检验阶段的状态信息;所述状态信息包括表示浏览态、确认态、存疑态、修改态中的任一种状态的信息;将处于所述确认态且数据属性值被修改过的识别数据确定为样本数据;采用所述样本数据对所述已训练完成的网络模型进行更新。结合识别数据在人工检验阶段的状态信息,确定样本数据,可将人工检验阶段提供的数据属性值应用到模型更新中,使得网络模型可以更符合实际需求。求。求。

【技术实现步骤摘要】
一种模型更新方法、装置及设备


[0001]本申请涉及计算机
,尤其涉及一种模型更新方法、装置及设备。

技术介绍

[0002]数据标注是目前人工智能应用于数据处理的重要步骤,其核心作用是生成用于人工智能模型训练的数据样本,支撑模型生成或进化,数据标注的质量直接决定训练模型的应用效果,其重要性不言而喻。
[0003]目前,数据标注手段主要包括人工打标方法和自动标注软件,其中:人工打标方法针对待处理的文本、图像等数据进行确认、分类、批注等人工打标操作,标注内容包括布尔标签、分类标签、特征标签等,通过逐条标注生成标注结果集合,并在标注过程中完成对标注结果的人工确认。自动标注软件包括华为平台ModelArts、百度PP平台EastDL等典型软件,上述平台主要提供基于预置算法模型的自动打标能力,可对文本、图像等数据进行自动化批量标注,生成的数据标注结果需要人工进行确认。
[0004]由于目前数据标注通常是在模型开发阶段,数据标注通常由算法或模型设计人员完成,并且,采用的训练数据与将模型投入使用的使用方需要识别的数据通常存在一定的差异,使得设计人员开发出的模型在使用方处的效果并不是很好。因此,需要提供一种能够让使用方获取效果更好的模型的方法。

技术实现思路

[0005]本说明书实施例提供一种模型更新方法、装置及设备,以解决现有的模型更新方法存在的需要模型开发的技术人员标注样本,模型效果不佳的问题。
[0006]为解决上述技术问题,本说明书实施例是这样实现的:本说明书实施例提供的一种模型更新方法,包括:获取采用已训练完成的网络模型识别得到的多个识别数据;各个所述识别数据具有表示所述识别数据所处的人工检验阶段的状态信息;所述状态信息包括表示浏览态、确认态、存疑态、修改态中的任一种状态的信息;将处于所述确认态且数据属性值被修改过的识别数据确定为样本数据;采用所述样本数据对所述已训练完成的网络模型进行更新。
[0007]本说明书实施例提供的一种模型更新装置,包括:数据获取模块,用于获取采用已训练完成的网络模型识别得到的多个识别数据;各个所述识别数据具有表示所述识别数据所处的人工检验阶段的状态信息;所述状态信息包括表示浏览态、确认态、存疑态、修改态中的任一种状态的信息;样本确定模块,用于将处于所述确认态且数据属性值被修改过的识别数据确定为样本数据;模型更新模块,用于采用所述样本数据对所述已训练完成的网络模型进行更新。
[0008]本说明书实施例提供的一种模型更新设备,包括:
至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:获取采用已训练完成的网络模型识别得到的多个识别数据;各个所述识别数据具有表示所述识别数据所处的人工检验阶段的状态信息;所述状态信息包括表示浏览态、确认态、存疑态、修改态中的任一种状态的信息;将处于所述确认态且数据属性值被修改过的识别数据确定为样本数据;采用所述样本数据对所述已训练完成的网络模型进行更新。
[0009]本说明书一个实施例实现了能够达到以下有益效果:本说明书实施例中可以结合识别数据在人工检验阶段的状态信息,从标记有浏览态、确认态、存疑态、修改态的多个识别数据中,选取处于确认态且识别数据的数据属性值因人工检验被修改过的识别数据作为更新网络模型的样本数据。其中,处于确认态且数据属性值被修改过的识别数据,可以理解为已训练完成的网络模型不能准确识别的数据,但经过人工检验阶段的处理,可以获取该类数据准确的数据属性值,将该类数据作为更新该网络模型的样本,将人工检验阶段提供的数据属性值应用到模型更新中可以更有效的提高模型的性能,也可使得网络模型可以更符合实际使用方的需求。
附图说明
[0010]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0011]图1为本说明书实施例提供的一种模型更新方法的流程示意图;图2为本说明书实施例提供的一种模型更新装置的结构示意图;图3为本说明书实施例提供的一种模型更新设备的结构示意图。
具体实施方式
[0012]为使本说明书一个或多个实施例的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书一个或多个实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书一个或多个实施例保护的范围。
[0013]以下结合附图,详细说明本说明书各实施例提供的技术方案。
[0014]为了解决现有技术中的缺陷,本方案给出了以下实施例:图1为本说明书实施例提供的一种模型更新方法的流程示意图。从程序角度而言,流程的执行主体可以为搭载于应用服务器的程序或应用客户端。从硬件角度而言,可以数据管理或检验人员操作的能够对数据进行管理或检验的操作平台。例如,为了保证网络信息的健康性,需要管理或检验人员对需要发布到网络上的文字、图像等数据进行分类或审
核,防止不健康信息在网络中传播。
[0015]可以理解的是,本说明书实施例中的方法可应用于具有数据分类或数据识别的场景,例如,对于不健康信息的识别,对于不同对象的分类等等。上述内容仅是示例,并不能构成对本申请的限定。
[0016]如图1所示,该流程可以包括以下步骤:步骤102:获取采用已训练完成的网络模型识别得到的多个识别数据;各个所述识别数据具有表示所述识别数据所处的人工检验阶段的状态信息;所述状态信息包括表示浏览态、确认态、存疑态、修改态中的任一种状态的信息。
[0017]本说明书实施例中可以通过已训练完成的网络模型对识别数据进行初步识别,然后将包含有识别结果的识别数据发送至数据管理或审核人员的显示端,数据管理或审核人员可以对识别数据进行人工检验。数据管理或审核人员在对信息进行审核时,可以对识别数据执行浏览、确认、存疑、修改等分析行为。上述多个识别数据可以包括被已训练完成的网络模型初步识别的数据,也可以包括经历了人工检验阶段的数据。具体的,识别数据可以是图像数据,也可以是文字数据,还可以是声音数据等等。
[0018]这里可以认为数据管理或审核人员的本职工作就是对数据进行人工检验,在不打扰数据管理或审核人员的正常工作的情况下,服务器可以根据信息管理或审核人员的日常数据分析行为,确定各个识别数据的状态。
[0019]步骤104:将处于所述确认态且数据属性值被修改过的识别数据确定为样本数据。
[0020]其中,数据属性值可以表示识别数据所属的类别、识别数据中包含的内容等等。例如,识别数据是否包含违规内容,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型更新方法,其特征在于,包括:获取采用已训练完成的网络模型识别得到的多个识别数据;各个所述识别数据具有表示所述识别数据所处的人工检验阶段的状态信息;所述状态信息包括表示浏览态、确认态、存疑态、修改态中的任一种状态的信息;将处于所述确认态且数据属性值被修改过的识别数据确定为样本数据;采用所述样本数据对所述已训练完成的网络模型进行更新。2.根据权利要求1所述的方法,其特征在于,所述获取采用已训练完成的网络模型识别得到的多个识别数据之前,还包括:获取用户对所述识别数据的数据检验操作;所述识别数据的状态信息为第一状态信息;根据所述数据检验操作,将所述识别数据的状态信息由所述第一状态信息转换为第二状态信息。3.根据权利要求2所述的方法,其特征在于,所述第一状态信息为表示浏览态的状态信息;所述第二状态信息为表示确认态的状态信息;所述根据所述数据检验操作,将所述识别数据的状态信息由所述第一状态信息转换为第二状态信息,具体包括:根据表示对所述识别数据进行确认的确认操作,将所述识别数据的状态信息由浏览态转换为确认态;或者,根据表示对所述识别数据进行浏览的浏览操作,获取所述识别数据被浏览的次数或时长;判断所述识别数据被浏览的次数是否大于或等于第一阈值,或者所述识别数据被浏览的时长是否大于或等于第二阈值;若所述识别数据被浏览的次数大于或等于第一阈值,或者所述识别数据处于被浏览的时长大于或等于第二阈值,则将所述识别数据的状态信息由浏览态转换为确认态。4.根据权利要求2所述的方法,其特征在于,所述第一状态信息为表示浏览态的状态信息;所述第二状态信息为表示修改态的状态信息;所述根据所述数据检验操作,将所述识别数据的状态信息由所述第一状态信息转换为第二状态信息,具体包括:根据表示对所述识别数据进行修改的修改操作,将所述识别数据的状态信息由浏览态转换为修改态。5.根据权利要求2所述的方法,其特征在于,所述第一状态信息为表示浏览态的状态信息;所述第二状态信息为表示存疑态的状态信息;所述根据所述数据检验操作,将所述识别数据的状态信息由所述第一状态信息转换为第二状态信息,具体包括:根据表示对所述识别数据存在疑问的存疑操作,将所述识别数据的状态信息由浏览态转换为存疑态。6.根据权利要求2所述的方法,其特征在于,所述第一状态信息为表示确认态的状态信息;所述第二状态信息为表示修改态的状态信息;
所述根据所述数据检验操作,将所述识别数据的状态信息由所述第一状态信息转换为第二状态信息,具体包括:根据表示对所述识别数据进行修改的修改操作,将所述识别数据的状态信息由确认态转换为修改态。7.根据权利要求2所述的方法,其特征在于,所述第一状态信息为表示确认态的状态信息;所述第二状态信息为表示存疑态的状态信息;所述根据所述数据检验操作,将所述识别数据的状态信息由所述第一状态信息转换为第二状态信息,具体包括:根据表示对所述识别数据存在疑问的存疑操作,将所述识别数据的状态信息由确认态转换为存疑态。8.根据权利要求2所述的方法,其特征在于,所述第一状态信息为表示修改态的状态信息;所述第二状态信息为表示确认态的状态信息;所述根据所述数据检验操作,将所述识别数据的状态信息由所述第一状态信息转换为第二状态信息,具体包括:根据表示对所述识别数据进行确认的确认操作,将所述识别数据的状态信息由修改态转换为确认态;或,根据表示对所述识别数据进行浏览的浏览操作,获取所述识别数据被浏览的次数或时长;所述识别数据处于修改态;判断所述识别数据被浏览的次数是否大于或等于第一阈值,或者所述识别数据被浏览的时长是否大于或等于第二阈值;若所述识别数据被浏览的次数大于或等于第一阈值,或者所述识别数据处于被浏览的时长大于或等于第二阈值,则将所述识别数据的状态信息由修改态...

【专利技术属性】
技术研发人员:李常宝顾平莉王书龙贾贺袁媛
申请(专利权)人:中国电子科技集团公司第十五研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1