半监督学习系统及半监督学习方法技术方案

技术编号：33990065 阅读：18 留言：0更新日期：2022-07-02 09:27

本发明专利技术涉及一种半监督学习系统和一种半监督学习方法，半监督学习方法包括：取得一或多个源域的源域数据及一目标域的目标域数据；使用该源域数据及该目标域数据以训练一特征萃取模型；利用一域判别模型、一任务模型及一半监督学习机制以分别计算该特征萃取模型的域判别损失函数、任务损失函数及半监督损失函数；依据该域判别损失函数、该任务损失函数及该半监督损失函数以计算一总损失函数，并依据该总损失函数以更新该特征萃取模型、任务模型与域判别模型的权重；以及因应于整体模型满足模型收敛条件，结束整体模型的训练过程。结束整体模型的训练过程。结束整体模型的训练过程。

全部详细技术资料下载

【技术实现步骤摘要】
半监督学习系统及半监督学习方法

[0001]本专利技术涉及机器学习，特别涉及一种半监督学习系统及半监督学习方法。

技术介绍

[0002]数据导向的分析建模技术在特定应用领域(下称源域，source domain)中搜集大量含标签数据标签后，训练所得的模型在同领域的预测表现多能逼近甚至能超越人类。然而当我们想要在另一新领域(下称目标域，target domain)重复利用该模型进行相同预测任务时，新领域的数据集往往和过去训练用数据分布有落差，导致模型的预测表现大幅折损。例如同一产品在多个工厂生产的情况下，使用A工厂生产数据建立出的外观缺陷识别系统，若直接套到B工厂进行识别时，可能因为拍摄角度、采光、相机型号等差别，在数据分布上有所差异，导致运行效果不如预期。

技术实现思路

[0003]有鉴于此，本专利技术是提供一种半监督学习系统及半监督学习方法以解决上述问题。
[0004]本专利技术提供一种半监督学习系统，包括：一非易失性存储器，用以存储一半监督学习应用程序；以及一处理器，用以执行该半监督学习应用程序以执行下列步骤：取得一或多个源域的源域数据及一目标域的目标域数据；使用该源域数据及该目标域数据以训练一特征萃取模型；利用一域判别模型、一任务模型及一半监督学习机制以分别计算该特征萃取模型的域判别损失函数、任务损失函数及半监督损失函数；依据该域判别损失函数、该任务损失函数及该半监督损失函数以计算一总损失函数，并依据该总损失函数以更新该特征萃取模型、该任务模型及该域判别模型的权重；以及因应于该整体模型满...

【技术保护点】

【技术特征摘要】
1.一种半监督学习系统，包括：一非易失性存储器，用以存储一半监督学习应用程序；以及一处理器，用以执行该半监督学习应用程序以执行下列步骤：取得一或多个源域的源域数据及一目标域的目标域数据；使用该源域数据及该目标域数据以训练一特征萃取模型；利用一域判别模型、一任务模型及一半监督学习机制以分别计算该特征萃取模型的域判别损失函数、任务损失函数及半监督损失函数；依据该域判别损失函数、该任务损失函数及该半监督损失函数以计算一总损失函数，并依据该总损失函数以更新相应于该特征萃取模型、该任务模型及该域判别模型的第一权重、第二权重及第三权重；以及因应于一整体模型满足模型收敛条件，结束该整体模型的训练过程，其中该整体模型包括该特征萃取模型、该任务模型及该域判别模型。2.如权利要求1所述的半监督学习系统，其中该特征萃取模型为ResNet50模型，该半监督学习机制为一致性正规化的未监督数据增强机制，该任务模型为一第一全连接层，且该域判别模型为一第二全连接层加上一梯度反转层。3.如权利要求1所述的半监督学习系统，其中该处理器分别指派第一超参数、第二超参数及第三超参数至该域判别损失函数、该任务损失函数及该半监督损失函数以计算该总损失函数。4.如权利要求3所述的半监督学习系统，其中该源域数据包括第一已标签数据及第一未标签数据，且该目标域数据包括第二已标签数据及第二未标签数据，其中，该处理器是使用该第一已标签数据、该第一未标签数据、该第二已标签数据及该第二未标签数据以计算该域判别损失函数，并依据该域判别损失函数以更新该特征萃取模型及该域判别模型的该第一权重，其中，该处理器使用该第一已标签数据及该第二已标签数据以计算该任务损失函数，并依据该任务损失函数以更新该特征萃取模型的该第一权重及该任务模型的该第二权重，其中，该处理器使用该第一未标签数据及该第二未标签数据以计算该半监督损失函数，并依据该半监督损失函数以更新该特征萃取模型的该第一权重。5.如权利要求2所述的半监督学习系统，其中该模型收敛条件表示该整体...

【专利技术属性】
技术研发人员：黄咏舜，苏育正，张晋维，
申请(专利权)人：台达电子工业股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人