【技术实现步骤摘要】
本专利技术涉及数字化加工,特别是涉及一种基于双向反馈调优模型的数字化加工方法及装置。
技术介绍
1、数字化加工是将纸质或非数字形式的信息资料,如报纸、书刊、杂志、图册、表单、公文、历史文献、文物等,通过计算机技术转换为数字格式的过程。随着大模型逐渐走向垂直化、专业化,定制化数据加工服务在数字化加工市场将占据更大比例,定制化的数据加工服务成为当前市场需求的主流,这也对数字化加工模型的适应性提出了更高的要求。
2、为了提高数字化加工模型的适应性,需要不断更新数字化加工模型的数据集,以基于数据集对模型进行微调训练。目前的数据集主要依赖人工标注数据样本来构建,由于数字化过程中会产生大量的数据,用于模型训练的数据集大多是人工自主选择,存在某类数据样本较少或分布不均等问题,导致模型训练过拟合、偏差、欠拟合、泛化能力弱以及类别不平衡引起的误分类等问题。在面临新的数据时,数字化加工模型无法及时适应数据,导致数字化加工结果的准确率不稳定。
技术实现思路
1、有鉴于此,本专利技术提供一种基于双向反
...【技术保护点】
1.一种基于双向反馈调优模型的数字化加工方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述依据所述人工校改信息和所述初始加工结果生成所述待加工数据的加工结果之后,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述得到再次更新的数据集生成策略之后,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于,所述依据所述加工结果和所述人工校改信息更新数据集生成策略,包括:
5.根据权利要求4所述的方法,其特征在于,所述加工结果包括正数据和负数据,所述依据更新后的数据集生成策略重新生成训练数
...【技术特征摘要】
1.一种基于双向反馈调优模型的数字化加工方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述依据所述人工校改信息和所述初始加工结果生成所述待加工数据的加工结果之后,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述得到再次更新的数据集生成策略之后,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于,所述依据所述加工结果和所述人工校改信息更新数据集生成策略,包括:
5.根据权利要求4所述的方法,其特征在于,所述加工结果包括正数据和负数据,所述依据更新后的数据集生成策略重新生成训练数据集,包括:
6.根据权利要求2所述的方法,其特征在于,所述依据所述新版...
【专利技术属性】
技术研发人员:薛德军,徐乾,张镔,李愿军,韦芳玉,
申请(专利权)人:同方知网数字出版技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。