筛查模型的训练方法、装置及存储介质制造方法及图纸

技术编号:21549570 阅读:21 留言:0更新日期:2019-07-06 22:27
本发明专利技术实施例提出一种筛查模型的训练方法、装置及计算机可读存储介质。其中筛查模型的训练方法包括:利用源领域的分级训练数据作为训练样本对目标领域中的筛查模型进行训练;对所述筛查模型采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距;使用修改后的最小二乘损失函数,对所述筛查模型进行AUC优化。本发明专利技术实施例利用源领域中的分级训练数据进行知识迁移,能够在目标领域中得到更好的预测性能。此外,本发明专利技术实施例通过对筛查模型进行AUC优化,能够更为准确和全面地衡量算法的性能,更好地应对样本不平衡的问题。

Training methods, devices and storage media for screening models

【技术实现步骤摘要】
筛查模型的训练方法、装置及存储介质
本专利技术涉及信息
,尤其涉及一种筛查模型的训练方法、装置及计算机可读存储介质。
技术介绍
目前常用的人工智能筛查系统,在部署到新的应用环境中时,由于新的应用环境使用的筛查机型不一样,数据来源也不一样,例如图像的亮度、对比度可能都不同,直接使用源领域数据会影响性能。因此需要在新的应用环境中收集大规模的标注数据用于训练筛查模型,从而得到预测性能较高的筛查模型。这一迁移过程的数据收集和标注的成本较高。在现有技术的迁移过程中,通常利用预测错误率评估算法性能。而预测错误率的方法对于样本不平衡问题不适用,难以用来判断算法的性能。例如,对于二元分类问题,存在类别分布不平衡的问题,即某一类别的样本数量远远多于另一类。分类错误率作为传统分类学习的评估指标,在进行模型优化时没有考虑到样本不平衡的问题,因而不能准确和全面地反应算法的性能。
技术实现思路
本专利技术实施例提供一种筛查模型的训练方法、装置及计算机可读存储介质,以解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种筛查模型的训练方法,包括:利用源领域的分级训练数据作为训练样本对目标领域中的筛查模型进行训练;对所述筛查模型采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距;使用修改后的最小二乘损失函数,对所述筛查模型进行AUC优化。在一种实施方式中,使用修改后的最小二乘损失函数,对所述筛查模型进行AUC优化之后,还包括:通过所述AUC优化,更新所述筛查模型的参数。在一种实施方式中,通过所述AUC优化,更新所述筛查模型的参数,包括:利用随机梯度下降算法更新所述筛查模型的参数。在一种实施方式中,对所述筛查模型采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距,包括:对二分类模型中解决AUC优化问题采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距。在一种实施方式中,对二分类模型中解决AUC优化问题采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距,包括:将二分类模型中解决AUC优化问题采用的最小二乘损失函数修改为以下公式,其中,L(f)表示所述修改后的最小二乘损失函数;函数f表示所述筛查模型的映射函数;用Y={0,1,2,3,4,…,k}表示所述分级训练数据的标签集合;表示标签为j的第i个训练样本;n0,n1,n2,n3,n4,…,nk分别表示每个标签对应的样本数量。第二方面,本专利技术实施例提供了一种筛查模型的训练装置,包括:训练单元,用于利用源领域的分级训练数据作为训练样本对目标领域中的筛查模型进行训练;修改单元,用于对所述筛查模型采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距;优化单元,用于:使用修改后的最小二乘损失函数,对所述筛查模型进行AUC优化。在一种实施方式中,所述装置还包括更新单元,用于:通过所述AUC优化,更新所述筛查模型的参数。在一种实施方式中,所述更新单元用于:利用随机梯度下降算法更新所述筛查模型的参数。在一种实施方式中,所述修改单元用于:对二分类模型中解决AUC优化问题采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距。在一种实施方式中,所述修改单元用于:将二分类模型中解决AUC优化问题采用的最小二乘损失函数修改为以下公式,其中,L(f)表示所述修改后的最小二乘损失函数;函数f表示所述筛查模型的映射函数;用Y={0,1,2,3,4,…,k}表示所述分级训练数据的标签集合;表示标签为j的第i个训练样本;n0,n1,n2,n3,n4,…,nk分别表示每个标签对应的样本数量。第三方面,本专利技术实施例提供了一种筛查模型的训练装置,所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,所述装置的结构中包括处理器和存储器,所述存储器用于存储支持所述装置执行上述筛查模型的训练方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述装置还可以包括通信接口,用于与其他设备或通信网络通信。第四方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储筛查模型的训练装置所用的计算机软件指令,其包括用于执行上述筛查模型的训练方法所涉及的程序。上述技术方案具有如下优点或有益效果:利用源领域中的分级训练数据进行知识迁移,能够在目标领域中得到更好的预测性能。此外,通过对筛查模型进行AUC优化,能够更为准确和全面地衡量算法的性能,更好地应对样本不平衡的问题。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1示出根据本专利技术实施例的筛查模型的训练方法的流程图。图2示出了正常眼球的眼底示意图。图3示出了患有糖尿病视网膜病变的眼底示意图。图4示出根据本专利技术另一实施例的筛查模型的训练方法的流程图。图5示出根据本专利技术实施例的筛查模型的训练装置的结构框图。图6示出根据本专利技术另一实施例的筛查模型的训练装置的结构框图。图7示出根据本专利技术又一实施例的筛查模型的训练装置的结构框图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。图1示出根据本专利技术实施例的筛查模型的训练方法的流程图。如图1所示,该筛查模型的训练方法包括:步骤S110,利用源领域的分级训练数据作为训练样本对目标领域中的筛查模型进行训练;步骤S120,对所述筛查模型采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距;步骤S130,使用修改后的最小二乘损失函数,对所述筛查模型进行AUC(AreaUnderCurve)优化。其中,AUC被定义为ROC曲线(receiveroperatingcharacteristiccurve,受试者工作特征曲线)下与坐标轴围成的面积。作为一个数值,对应AUC值更大的分类器效果更好,因此可使用AUC值作为分类器性能的评价标准。而且,AUC的优点在于:它不受类别不平衡问题的影响,不同的样本比例不会影响AUC的评测结果。在训练模型时,可以直接使用AUC作为损失函数。ROC曲线是以假阳性概率(Falsepositiverate)为横轴,真阳性(Truepositiverate)为纵轴所组成的坐标图,以及受试者在特定刺激条件下由于采用不同的判断标准得出的不同结果画出的曲线。传统的诊断试验评价方法有一个共同的特点,必须将试验结果分为两类,再进行统计分析。ROC曲线的评价方法与传统的评价方法不同,无须此限制,而是根据实际情况,允许有中间状态。ROC曲线的评价方法可以把试验结果划分为多个有序分类,如正常、大致正常、可疑、大本文档来自技高网...

【技术保护点】
1.一种筛查模型的训练方法,其特征在于,包括:利用源领域的分级训练数据作为训练样本对目标领域中的筛查模型进行训练;对所述筛查模型采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距;使用修改后的最小二乘损失函数,对所述筛查模型进行AUC优化。

【技术特征摘要】
1.一种筛查模型的训练方法,其特征在于,包括:利用源领域的分级训练数据作为训练样本对目标领域中的筛查模型进行训练;对所述筛查模型采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距;使用修改后的最小二乘损失函数,对所述筛查模型进行AUC优化。2.根据权利要求1所述的方法,其特征在于,使用修改后的最小二乘损失函数,对所述筛查模型进行AUC优化之后,还包括:通过所述AUC优化,更新所述筛查模型的参数。3.根据权利要求2所述的方法,其特征在于,通过所述AUC优化,更新所述筛查模型的参数,包括:利用随机梯度下降算法更新所述筛查模型的参数。4.根据权利要求1至3中任一项所述的方法,其特征在于,对所述筛查模型采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距,包括:对二分类模型中解决AUC优化问题采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距。5.根据权利要求4所述的方法,其特征在于,对二分类模型中解决AUC优化问题采用的最小二乘损失函数进行修改,以拉开所述分级训练数据中相邻级别的差距,包括:将二分类模型中解决AUC优化问题采用的最小二乘损失函数修改为以下公式,其中,L(f)表示所述修改后的最小二乘损失函数;函数f表示所述筛查模型的映射函数;用Y={0,1,2,3,4,…,k}表示所述分级训练数据的标签集合;表示标签为j的第i个训练样本;n0,n1,n2,n3,n4,…,nk分别表示每个标签对应的样本数量。6.一种筛查模型的训练装置,其特征在于,包括:训练单元,用于利用源领域...

【专利技术属性】
技术研发人员:杨叶辉许言午王磊黄艳
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1