System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种面向正标记和无标记样本学习的医学影像分类方法技术_技高网
当前位置: 首页 > 专利查询>安徽大学专利>正文

一种面向正标记和无标记样本学习的医学影像分类方法技术

技术编号:40877456 阅读:3 留言:0更新日期:2024-04-08 16:47
本发明专利技术公开了一种面向正标记和无标记样本学习的医学影像分类方法,包括:步骤1:收集正标记和无标记样本的医学影像数据集;步骤2:构建无标记样本的标签优化模型;步骤3:通过结合动态分组、邻域信息种群初始化和协同优化策略在进化多目标优化的框架下获得无标记样本的优化标签;步骤4:最终通过监督学习训练分类器,实现对医学影像样本的分类。本发明专利技术能应对传统监督学习方法在处理医学影像标签不确定性方面的限制,从而能提高医学影像分类的准确性和鲁棒性。

【技术实现步骤摘要】

本专利技术涉及机器学习、医学影像分类领域,具体的说是一种面向正标记和无标记样本学习的医学影像分类方法


技术介绍

1、当前机器学习和医学影像分类领域的发展虽然取得了一些显著的进展,但在面对日益复杂的医学影像数据时,现有技术仍然存在一系列严重的问题,这些问题为新的创新方法提供了迫切的需求。

2、首先,传统监督学习方法在医学影像分类中普遍存在的一个问题是过度依赖于大量的标记样本。这不仅令标记的过程变得极为昂贵,而且容易受到主观因素的影响,因而标签的准确性和一致性常常受到怀疑。这种标记依赖性不仅限制了这些方法在实际应用中的可行性,而且也使得其在长期持续使用中面临着持续高昂的成本。其次,医学影像数据往往涉及到各种复杂的病理情况和模糊的特征,导致现有技术对复杂特征处理能力的不足,导致模型的泛化能力受到限制,尤其在面对新的、未曾见过的病例时,往往难以做出准确的分类决策。此外,对于大量存在的无标记样本,现有技术未能充分发挥其潜在信息。这造成了模型未能有效地利用这些宝贵的、未标记的数据,直接影响了模型学习的效果和分类性能的提升。这种未能充分挖掘无标记样本潜力的问题,制约了医学影像分类方法在真实场景中的实际效果。

3、总的来说,现有技术在标记依赖性、复杂特征以及对无标记样本的利用等方面存在明显的问题,这些问题不仅限制了当前技术的性能,也制约了其在医学影像分类领域的广泛应用。


技术实现思路

1、针对当前技术中存在的不足,本专利技术提出一种面向正标记和无标记样本学习的医学影像分类方法,以期能应对传统监督学习方法在处理医学影像标签不确定性方面的限制,从而能提高医学影像分类的准确性和鲁棒性。

2、本专利技术为达到上述专利技术目的,采用如下技术方案:

3、本专利技术一种面向正标记和无标记样本学习的医学影像分类方法的特点在于,包括如下步骤:

4、步骤一、收集正标记和无标记样本数据集;

5、步骤1:收集正标记和无标记样本的医学影像数据集,记为x={x1,x2,…,xi,…,xn},其中,xi为第i个医学影像样本,xi={xi,1,xi,2,…,xi,d,…,xi,d}是一个d维特征向量,xi,d表示第i个医学影像样本的第d个特征;x的标签,记为y={y1,y2,…,yi,…,yn},其中,yi∈{0,1}表示xi的标签,若yi=0,则表示xi为无标记样本,若yi=1,则表示xi为正标记样本;n为医学影像样本的总数量,其中,n=|xp|+|xu|,|·|表示集合的样本数量;x=xp∪xu,xp为正标记样本的集合,且是xp中第s个正标记样本,xu为无标记样本的集合,且是xu中第e个无标记样本,y=yp∪yu,其中,yp表示xp的标签,且yu表示xu的预测标签,且其中,表示的预测标签,若预测为正标记样本,则令否则,令初始化xu的标签yu均为-1;

6、步骤二、利用式(1)构建无标记样本的标签优化模型:

7、

8、式(1)中,为xu中识别的正标记样本集合,表示以最大化中标签的局部一致性为目标的第一优化目标函数,是中第j个预测的正标记样本,表示的k个邻域样本所构成的集合;lc(·,·)是一个指示函数,若中有超过半数样本的标签与相同,则令否则令表示以最小化与xp中全部样本的欧氏距离为全局可靠性目标的第二优化目标函数,gr(·,·)代表欧氏距离函数;

9、步骤三、优化xu的预测标签yu;

10、步骤3.1:定义最大迭代次数为maxgen,重新分组间隔为interre,协同优化间隔为interev,特征上限参数为α,邻域的数量为k;当前迭代次数为t;

11、初始化t=1;

12、步骤3.2:计算分组的当前次数为r,并初始化其中,表示向上取整;

13、对x中的所有特征进行第r次分组后,得到第r次分组下的特征分组集合其中,为第r次分组下的第m个特征分组,且的包含特征总数不超过m为分组的总数,且

14、将第r次分组下的xu的预测标签,记为其中,表示第r次分组下的预测标签,若预测为正标记样本,则令否则,令

15、将x中所有样本的第d个特征构成的集合记为fd={x1,d,x2,d,…,xi,d,…,xn,d};

16、步骤3.3:基于gr,对第t代种群pt进行初始化:

17、定义第t代种群其中,pmt为第t代种群pt中gm对应的第m个种群,并用于对第r次分组下的第m个特征分组下的标签进行预测,且pmt={p1t,m,p2t,m,…,pet,m,…,pnt,m},n为种群的规模,pet,m为第m个种群pmt中的第e个个体,每个个体代表的一种预测标签,且其中,表示第m个种群pmt中的第e个个体对第e个无标记样本的预测标签,若预测为正标记样本,则令否则,令

18、步骤3.4:初始化第m个种群pmt中的第e个个体pet,m,从而得到第m个种群pmt;

19、步骤3.5:当mod(t,interev)≠0时,采用nsga-ii的进化算子对pmt进行独立进化,得到第t+1代的第m个种群pmt+1;从而得到第t+1代种群pt+1,mod(·,·)表示取余函数;

20、当mod(t,interev)=0时,采用协同优化法选择两个种群进行协同进化,得到第t+1代的两个种群;从而得到第t+1代种群pt+1,mod(·,·)表示取余函数;

21、步骤3.6:当mod(t,interre)=0时,采用投票集成方法对第t代种群pt中所有个体所对应的预测标签进行处理,得到第t代种群pt输出的第r次分组下的xu的预测标签否则,将t+1赋值给t,返回步骤3.5顺序执行;

22、步骤3.7:当t=maxgen时,输出第maxgen代种群pmaxgen输出的第r次分组下xu的预测标签并作为xu最终优化的标签否则,将t+1赋值给t,返回步骤3.2顺序执行;

23、步骤四、测试样本分类;

24、步骤4:基于医学影像数据集为x及其优化后的标签通过监督学习训练分类器,从而得到训练后的分类器用于对医学影像进行预测,并输出预测标签。

25、本专利技术所述的面向正标记和无标记样本学习的医学影像分类方法的特点也在于,所述步骤3.2包括:

26、步骤3.2.1:利用式(2)计算第r次分组下第d个特征集合fd与标签的相关性

27、

28、式(2)中,cov(·,·)表示协方差,σf表示fd的标准差,表示标签的标准差;

29、步骤3.2.2:对第r次分组下每个特征集合与标签的相关性进行两两比较,并将相关性较高的特征集合添加到gm中,直到gm中的特征集合数量达到为止,从而得到为第r次分组下的第m个特征分组进而得到gr。

30、所述步骤3.4包括:

31、步骤3.4.1:在1到|xu|/2之间随机生成一个正整数τ;

32、步骤3.4.2:从xu中随机选择两个无标本文档来自技高网...

【技术保护点】

1.一种面向正标记和无标记样本学习的医学影像分类方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的面向正标记和无标记样本学习的医学影像分类方法,其特征在于,所述步骤3.2包括:

3.根据权利要求2所述的面向正标记和无标记样本学习的医学影像分类方法,其特征在于,所述步骤3.4包括:

4.根据权利要求3所述的面向正标记和无标记样本学习的医学影像分类方法,其特征在于,所述协同优化法是按如下步骤进行:

5.一种电子设备,包括存储器以及处理器,其特征在于,所述存储器用于存储支持处理器执行权利要求1-4中任一所述医学影像分类方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

6.一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行权利要求1-4中任一所述医学影像分类方法的步骤。

【技术特征摘要】

1.一种面向正标记和无标记样本学习的医学影像分类方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的面向正标记和无标记样本学习的医学影像分类方法,其特征在于,所述步骤3.2包括:

3.根据权利要求2所述的面向正标记和无标记样本学习的医学影像分类方法,其特征在于,所述步骤3.4包括:

4.根据权利要求3所述的面向正标记和无标记样本学习的医学影像分类方法,其特征在...

【专利技术属性】
技术研发人员:邱剑锋杜腾谢娟程凡
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1