一种神经网络训练用样本的修订系统及方法技术方案

技术编号:26690711 阅读:50 留言:0更新日期:2020-12-12 02:41
本发明专利技术涉及一种神经网络训练用样本的修订系统及方法,系统包括服务终端和客户前端;服务终端设置为存储样本,将样本分发给客户前端,接收并存储客户前端的处理结果,并根据处理结果生成统计展示;客户前端设置为接收样本,执行修订处理,将处理结果传递到服务终端。服务终端包括存储模块和统计模块;客户前端包括标注模块和审核模块;标注模块包括预处理单元和精处理单元;审核模块还可以设置为对修订质量进行评分。本发明专利技术可以实现多个客户前端同时对同一个数据集中的样本进行修订,加快了样本的修订进度,节省了时间成本;内置自动预处理单元,减少后续精处理的工作量;设立审核评分机制,既不打击标注者的积极性,又提升数据集样本的可靠性。

【技术实现步骤摘要】
一种神经网络训练用样本的修订系统及方法
本专利技术涉及神经网络领域,尤其涉及一种神经网络训练用样本的修订系统及方法。
技术介绍
神经网络是目前人工智能领域进步最快、热度最高的研究领域,其在搜索技术、数据挖掘、机器学习、机器翻译、自然语言处理和个性化推荐领域都有着广泛应用。其实是一个复杂的机器学习算法,通过学习海量样本数据的内在规律和表达层次,从而让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。随着人工智能实际应用范围的增广与应用场景的深入,对深度学习模型预测准确率的要求越来越高,同时,随着实际需求的逐渐明确,对深度模型输出的结果种类或格式也有相应变化。众所周知,深度模型的训练需要依赖数万到数十万个经过标注的样本,作为训练数据。收集和标注如此大量的有效数据,其时间成本与金钱成本都是极高的,而如上所说,需求一直在不断变化,要满足新的需求,就需要新的训练数据,每次都重新收集与标注样本,成本显然是无法接受的。另外,原始样本集在标注过程中总有或多或少的错误,例如在图像标注样本集中,没有把所有人体区域标注出来,也就是漏标,或将非人体区域标注为人体,也就是错标。而训练样本的质量直接关系着最终训练出的模型的准确率。
技术实现思路
本专利技术的目的在于提供一种通用型神经网络训练用样本的修订系统及方法,用以解决现有技术中存在的问题。为实现上述目的,本专利技术公开了一种神经网络训练用样本的修订系统,包括:服务终端和客户前端;所述服务终端设置为存储样本,将所述样本分发给所述客户前端,接收并存储所述客户前端的处理结果,并根据所述处理结果生成统计展示;所述客户前端设置为接收所述样本,执行修订处理,将处理结果传递到所述服务终端。在一些较优的实施例中,所述服务终端包括存储模块和统计模块;所述存储模块设置为接收样本,将其分为待修订样本和已修订样本分别存储;所述统计模块设置为从所述存储模块加载已修订样本,统计样本特征信息,并生成分析报告。在一些较优的实施例中,所述客户前端包括标注模块和审核模块;所述标注模块设置为从所述存储模块加载待修订样本,预处理后进行标注,得到第一样本,将所述第一样本传递给所述审核模块;所述审核模块设置为接收所述第一样本,审核标注是否合格,若是,将所述第一样本作为已修订样本传递给所述服务终端,若否,向所述标注模块传递审核意见,并将所述第一样本作为待修订样本传递给所述标注模块。在一些较优的实施例中,所述标注模块包括预处理单元和精处理单元;所述预处理单元设置为从所述存储模块加载待修订样本,根据其修订需求选择匹配的预处理算法进行预处理,得到第二样本,将所述第二样本传递给所述精确标注单元;所述精处理单元设置为接收所述第二样本进行精确处理,得到所述第一样本,将所述第一样本传递给所述审核模块。在一些较优的实施例中,所述审核模块还可以设置为对已修订样本的修订质量进行评分。在一些较优的实施例中,所述服务终端还包括展示模块;所述展示模块设置为从所述统计模块加载分析报告并展示。本专利技术还公开了一种神经网络训练用样本的修订方法,包括以下步骤:步骤S1.标注客户前端从服务终端的存储模块加载待修订样本,标注后作为第一样本传递给审核客户前端;步骤S2.所述审核客户前端对所述第一样本的标注结果进行审核,若审核合格,则将样本存储到服务器存储模块;若审核不合格,将所述第一样本作为待修订样本传递给所述标注客户前端并反馈审核意见;步骤S3.统计模块从所述存储模块加载已修订样本,统计样本特征信息,并生成分析报告。进一步的是,步骤S1中所述标注的具体方法为:从所述存储模块加载待修订样本,根据其修订需求选择匹配的预处理算法进行预处理,得到第二样本,然后对所述第二样本进行精确标注,得到所述第一样本。进一步的是,步骤S2所述审核还包括:对已修订样本的修订质量进行评分。进一步的是,步骤S3还包括:将所述分析报告传递给展示模块进行展示。本专利技术与现有的技术相比,其有益的特点是:1、多个客户前端可同时对同一个数据集中的样本进行修订,大大加快了样本的修订进度,节省了时间成本;2、内置的自动预处理单元,可以减少后续精处理的工作量,特别是精处理为人工标注时,该单元可以大大的降低人工工作量,进一步的节约时间成本;3、通过提供易用的图形界面控件,提高了客户前端的修订效率;4、通过有效的审核反馈机制,帮助人工标注者更快地明确标注问题,提升标注质量;5、通过设立审核评分机制,既不打击人工标注者的积极性,又能提升数据集中样本的可靠性;6、通过统计模块生成分析报告并展示出来,可以让管理者更好的掌控修订进度。附图说明图1为本专利技术一种较优实施例中一种神经网络训练用样本的修订系统的结构图;图2为本专利技术一种较优实施例中标注模块的结构图;图3为本专利技术一种较优实施例中服务终端的结构图;图4为本专利技术一种较优实施例中一种神经网络训练用样本的修订方法的流程图;图5为本专利技术一种较优实施例中统计模块生成的分析报告示意图;图6为本专利技术一种较优实施例中精处理单元提供的图形界面和操作控件示意图;具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图对本专利技术作进一步阐述。在本专利技术的描述中,需要理解的是,术语“上”、“下”、“前”、“后”、“左”、“右”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。如图1所示,是本专利技术提供的一种神经网络训练用样本的修订系统的结构图,包括:服务终端和客户前端。所述服务终端设置为存储样本,将所述样本分发给所述客户前端,接收并存储所述客户前端的处理结果,并根据所述处理结果生成统计展示;所述客户前端设置为接收所述样本,执行修订处理,将处理结果传递到所述服务终端。其中,所述服务终端可以是云端或本地服务器,所述客户前端可以是通过网线或无线信号与服务终端连接,也可以是与本地服务终端共处同一个局域网。本专利技术所述样本是神经网络模型所需处理对象的样本数据,根据处理对象的不同,样本类别也不相同。例如,用于图像分割的样本为图像数据,用于语音识别的样本为语音数据,用于信息分析的样本为信息数据。本专利技术所公开的样本处理系统对于各类样本均可进行处理,本领域技术人员应当知晓,各类型样本的处理流程共同点在于对样本的特征进行标注修订,例如用于人像分割的样本需要标注人物和背景,用于目标人物语音识别的样本需要标注目标人物语音和背景杂音,用于天气预测的样本需要标注影响天气变化的要素和失真要素。而样本的具体标注方法不是本专利技术的重点,可以采用本领域常用的标注方法。基于同样的专利技术构思,本申请的技术方案还可以应用于语本文档来自技高网...

【技术保护点】
1.一种神经网络训练用样本的修订系统,其特征在于,包括:服务终端和客户前端;/n所述服务终端设置为存储样本,将所述样本分发给所述客户前端,接收并存储所述客户前端的处理结果,并根据所述处理结果生成统计展示;/n所述客户前端设置为接收所述样本,执行修订处理,将处理结果传递到所述服务终端。/n

【技术特征摘要】
1.一种神经网络训练用样本的修订系统,其特征在于,包括:服务终端和客户前端;
所述服务终端设置为存储样本,将所述样本分发给所述客户前端,接收并存储所述客户前端的处理结果,并根据所述处理结果生成统计展示;
所述客户前端设置为接收所述样本,执行修订处理,将处理结果传递到所述服务终端。


2.如权利要求1所述的神经网络训练用样本的修订系统,其特征在于:所述服务终端包括存储模块和统计模块;
所述存储模块设置为接收样本,将其分为待修订样本和已修订样本分别存储;
所述统计模块设置为从所述存储模块加载已修订样本,统计样本特征信息,并生成分析报告。


3.如权利要求1所述的神经网络训练用样本的修订系统,其特征在于:所述客户前端包括标注模块和审核模块;
所述标注模块设置为从所述存储模块加载待修订样本,预处理后进行标注,得到第一样本,将所述第一样本传递给所述审核模块;
所述审核模块设置为接收所述第一样本,审核标注是否合格,若是,将所述第一样本作为已修订样本传递给所述服务终端,若否,向所述标注模块传递审核意见,并将所述第一样本作为待修订样本传递给所述标注模块。


4.如权利要求3所述的神经网络训练用样本的修订系统,其特征在于:所述标注模块包括预处理单元和精处理单元;
所述预处理单元设置为从所述存储模块加载待修订样本,根据其修订需求选择匹配的预处理算法进行预处理,得到第二样本,将所述第二样本传递给所述精确标注单元;
所述精处理单元设置为接收所述第二样本进行精确处理,得到所述第...

【专利技术属性】
技术研发人员:张靖淇徐滢
申请(专利权)人:成都品果科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1