【技术实现步骤摘要】
数据处理方法、装置、服务器及系统
本专利技术涉及计算机应用领域,具体而言,涉及一种数据处理方法、装置、服务器及系统。
技术介绍
现有技术中,对模型的训练流程大多数是采用如下流程:人工对大量采集的数据进行一次性的批注,所有样本批注完成后,才交由服务器进行训练,由于样本较多,导致训练周期太长,并且若训练产生的模型进行评估后,无法达到预期效果则需要重新对所有样本进行标注后,再重新进行训练,这样导致标注工作量较大,并且效率较低。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提供一种数据处理方法、装置、服务器及系统,以解决上述问题。为了实现上述目的,本专利技术实施例采用的技术方案如下:第一方面,本专利技术实施例提供了一种数据处理方法,所述方法包括:从总样本集中获取本次待标注样本集,并发送到用户终端;接收所述用户终端返回的第一标注结果集;根据所述第一标注结果集,进行模型训练,获取训练模型并对所述训练模型的准确率进行评估;若评估结果不满足预设条件,根据所述训练模型,重新从所述总样本集中获取下次待标注样本集,并发送到所述用户终端,接收所述用户终端返回的第二标注结果集,根据所述第 ...
【技术保护点】
一种数据处理方法,其特征在于,所述方法包括:从总样本集中获取本次待标注样本集,并发送到用户终端;接收所述用户终端返回的第一标注结果集;根据所述第一标注结果集,进行模型训练,获取训练模型并对所述训练模型的准确率进行评估;若评估结果不满足预设条件,根据所述训练模型,重新从所述总样本集中获取下次待标注样本集,并发送到所述用户终端,接收所述用户终端返回的第二标注结果集,根据所述第二标注结果集,重新获取训练模型并对该训练模型的准确率进行评估,直到评估结果满足预设条件,将所述评估结果满足预设条件对应的训练模型作为最终模型。
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:从总样本集中获取本次待标注样本集,并发送到用户终端;接收所述用户终端返回的第一标注结果集;根据所述第一标注结果集,进行模型训练,获取训练模型并对所述训练模型的准确率进行评估;若评估结果不满足预设条件,根据所述训练模型,重新从所述总样本集中获取下次待标注样本集,并发送到所述用户终端,接收所述用户终端返回的第二标注结果集,根据所述第二标注结果集,重新获取训练模型并对该训练模型的准确率进行评估,直到评估结果满足预设条件,将所述评估结果满足预设条件对应的训练模型作为最终模型。2.根据权利要求1所述的方法,其特征在于,所述从总样本集中获取本次待标注样本集,包括:根据第一预设关键词集,从总样本集中筛选出本次待标注样本集。3.根据权利要求1所述的方法,其特征在于,所述根据所述训练模型,重新从所述总样本集中获取下次待标注样本集,包括:根据所述训练模型,分别对所述总样本集中的各个样本进行判定,获取每个样本对应的判定结果;根据所述每个样本对应的判定结果,获取下次待标注样本集。4.根据权利要求3所述的方法,其特征在于,所述根据所述训练模型,分别对所述总样本集中的各个样本进行判定,获取每个样本对应的判定结果,包括:根据第二预设关键词集,从所述总样本集中筛选出下次待标注候选样本集;根据所述训练模型,分别对所述下次待标注候选样本集中的各个样本进行判定,获取每个样本对应的判定结果。5.根据权利要求3所述的方法,其特征在于,所述每个样本对应的判定结果为一个概率值,所述根据所述每个样本对应的判定结果,获取下次待标注样本集,包括:依次遍历每个样本对应的概率值,若当前样本对应的概率值属于预设区间,则将所述当前样本加入所述下次待标注样本集中,直到遍历完每个样本对应的概率值。6.根据权利要求1所述的方法,其特征在于,在所述从总样本集中获取本次待标注样本集之前,所述方法还包括:从第三方平台实时获取样本,生成所述总样本集。7.根据权利要求1所述的方法,其特征在于,在所述对所述训练模型的准确率进行评估之后,所述方法还包括:若评估结果满足预设条件,则将所述训练模型作为最终模型。8.一种数据处理装置,其特征在于,所述装置包括:第一处理模块,用于...
【专利技术属性】
技术研发人员:赵海丰,杨成,黄鹏,刘海旭,江岭,
申请(专利权)人:成都小多科技有限公司,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。