筛查模型的训练方法、装置及存储介质制造方法及图纸

技术编号：21549570 阅读：21 留言：0更新日期：2019-07-06 22:27

本发明专利技术实施例提出一种筛查模型的训练方法、装置及计算机可读存储介质。其中筛查模型的训练方法包括：利用源领域的分级训练数据作为训练样本对目标领域中的筛查模型进行训练；对所述筛查模型采用的最小二乘损失函数进行修改，以拉开所述分级训练数据中相邻级别的差距；使用修改后的最小二乘损失函数，对所述筛查模型进行AUC优化。本发明专利技术实施例利用源领域中的分级训练数据进行知识迁移，能够在目标领域中得到更好的预测性能。此外，本发明专利技术实施例通过对筛查模型进行AUC优化，能够更为准确和全面地衡量算法的性能，更好地应对样本不平衡的问题。

Training methods, devices and storage media for screening models

全部详细技术资料下载

【技术实现步骤摘要】
筛查模型的训练方法、装置及存储介质
本专利技术涉及信息
，尤其涉及一种筛查模型的训练方法、装置及计算机可读存储介质。
技术介绍
目前常用的人工智能筛查系统，在部署到新的应用环境中时，由于新的应用环境使用的筛查机型不一样，数据来源也不一样，例如图像的亮度、对比度可能都不同，直接使用源领域数据会影响性能。因此需要在新的应用环境中收集大规模的标注数据用于训练筛查模型，从而得到预测性能较高的筛查模型。这一迁移过程的数据收集和标注的成本较高。在现有技术的迁移过程中，通常利用预测错误率评估算法性能。而预测错误率的方法对于样本不平衡问题不适用，难以用来判断算法的性能。例如，对于二元分类问题，存在类别分布不平衡的问题，即某一类别的样本数量远远多于另一类。分类错误率作为传统分类学习的评估指标，在进行模型优化时没有考虑到样本不平衡的问题，因而不能准确和全面地反应算法的性能。
技术实现思路
本专利技术实施例提供一种筛查模型的训练方法、装置及计算机可读存储介质，以解决现有技术中的一个或多个技术问题。第一方面，本专利技术实施例提供了一种筛查模型的训练方法，包括：利用源领域的分级训练数据作为训练样本对目标领域中的筛查模型进行训练；对所述筛查模型采用的最小二乘损失函数进行修改，以拉开所述分级训练数据中相邻级别的差距；使用修改后的最小二乘损失函数，对所述筛查模型进行AUC优化。在一种实施方式中，使用修改后的最小二乘损失函数，对所述筛查模型进行AUC优化之后，还包括：通过所述AUC优化，更新所述筛查模型的参数。在一种实施方式中，通过所述AUC优化，更新所述筛查模型的参数，包括：利用随机梯...

【技术保护点】
1.一种筛查模型的训练方法，其特征在于，包括：利用源领域的分级训练数据作为训练样本对目标领域中的筛查模型进行训练；对所述筛查模型采用的最小二乘损失函数进行修改，以拉开所述分级训练数据中相邻级别的差距；使用修改后的最小二乘损失函数，对所述筛查模型进行AUC优化。

【技术特征摘要】
1.一种筛查模型的训练方法，其特征在于，包括：利用源领域的分级训练数据作为训练样本对目标领域中的筛查模型进行训练；对所述筛查模型采用的最小二乘损失函数进行修改，以拉开所述分级训练数据中相邻级别的差距；使用修改后的最小二乘损失函数，对所述筛查模型进行AUC优化。2.根据权利要求1所述的方法，其特征在于，使用修改后的最小二乘损失函数，对所述筛查模型进行AUC优化之后，还包括：通过所述AUC优化，更新所述筛查模型的参数。3.根据权利要求2所述的方法，其特征在于，通过所述AUC优化，更新所述筛查模型的参数，包括：利用随机梯度下降算法更新所述筛查模型的参数。4.根据权利要求1至3中任一项所述的方法，其特征在于，对所述筛查模型采用的最小二乘损失函数进行修改，以拉开所述分级训练数据中相邻级别的差距，包括：对二分类模型中解决AUC优化问题采用的最小二乘损失函数进行修改，以拉开所述分级训练数据中相邻级别的差距。5.根据权利要求4所述的方法，其特征在于，对二分类模型中解决AUC优化问题采用的最小二乘损失函数进行修改，以拉开所述分级训练数据中相邻级别的差距，包括：将二分类模型中解决AUC优化问题采用的最小二乘损失函数修改为以下公式，其中，L(f)表示所述修改后的最小二乘损失函数；函数f表示所述筛查模型的映射函数；用Y＝{0，1，2，3，4，…，k}表示所述分级训练数据的标签集合；表示标签为j的第i个训练样本；n0，n1，n2，n3，n4，…，nk分别表示每个标签对应的样本数量。6.一种筛查模型的训练装置，其特征在于，包括：训练单元，用于利用源领域...

【专利技术属性】
技术研发人员：杨叶辉，许言午，王磊，黄艳，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人