对象聚类方法和装置制造方法及图纸

技术编号:24421742 阅读:44 留言:0更新日期:2020-06-06 14:28
一种对类似于彼此的对象进行聚类或分组的方法。数据集包含针对每个对象的定量值集合,每个定量值表示该对象的相应临床或病理特征。对所述数据集执行主成分分析PCA。通过所述PCA识别的头两个主成分中的一个主成分的载荷用来生成加权值的相应数据集。这些加权值用来对所述数据集中的每个定量值集合进行加权或修改。对加权对象数据集执行聚类算法。所述过程可以被迭代直到满足用户定义的停止条件。

Object clustering method and device

【技术实现步骤摘要】
【国外来华专利技术】对象聚类方法和装置
本专利技术涉及对对象进行聚类的领域,并且更具体涉及使用对象的数据进行聚类的领域。
技术介绍
对象的分组在临床实践中是常规活动,其目的是为了定义针对给定对象的最佳处置选项。具体地,如果对象能够被准确地一起分组到类似的组中,这将允许临床医生容易地比较给定对象或案例与类似的对象或案例来识别潜在诊断、合适的处置选项和所述处置选项的可能结果。这往往导致改善的对象结果和更准确的诊断,因为(即类似案例的)相关历史医学数据能够被临床医生准确地识别和利用。因此存在对改善分组过程的准确性的增加期望。然而,由于对象的通常大量的变量或可能有影响的特性,甚至对于有经验的临床医生来说确定两个对象是否类似也是困难的。临床医生因此已经求助于自动化或监督式‘机器学习’(ML)方法用于对对象进行分组。常规分组方法假设所有特征(即变量或特性)都是在统计上类似的,例如,具有类似的范围或具有类似的变化范围和统计分布。然而,对象数据(例如生物医学信息)通常是各种各样的,并且不同的数据因此往往属于具有高度统计差异的不同范畴。当执行常规聚类方法时,这导致显本文档来自技高网...

【技术保护点】
1.一种对多个对象中的类似对象进行聚类的方法(1),所述方法包括:/n获得对象数据的数据集(20),所述数据集包含针对每个对象的相应定量值集合,每个定量值是所述对象的临床或病理特征的测量结果,并且每个定量值集合具有相同数量的定量值;以及/n执行聚类过程(3),包括:/n对对象数据的所述数据集执行(4)主成分分析以识别至少两个主成分(PC1、PC2),每个主成分与成分得分(cs

【技术特征摘要】
【国外来华专利技术】20170920 EP 17192198.41.一种对多个对象中的类似对象进行聚类的方法(1),所述方法包括:
获得对象数据的数据集(20),所述数据集包含针对每个对象的相应定量值集合,每个定量值是所述对象的临床或病理特征的测量结果,并且每个定量值集合具有相同数量的定量值;以及
执行聚类过程(3),包括:
对对象数据的所述数据集执行(4)主成分分析以识别至少两个主成分(PC1、PC2),每个主成分与成分得分(cs1、cs2)和载荷的数据集(22A)相关联,载荷的每个数据集中的载荷的数量等于对象数据的所述数据集中的定量值的数量;
生成(5)加权值的第一数据集(51),每个加权值基于载荷的所述数据集中的与头两个主成分中的一个主成分相关联的相应载荷,所述第一数据集中的加权值的数量等于载荷的所述数据集中的载荷的数量;
使用加权值的所述第一数据集对对象数据的所述数据集的所述定量值进行加权(6),以获得对象数据的加权数据集(60);以及
对对象数据的所述加权数据集执行(7)聚类算法以便将类似对象聚类成具有类似临床特性的对象组,其中,每个对象组中的对象具有类似的诊断、预测的对象结果和/或合适的处置选项。


2.根据权利要求1所述的方法,还包括获得加权值的第二数据集(52)的步骤(31),所述第二数据集中的加权值的数量等于对象数据的所述数据集中的定量值的数量,并且
其中,生成加权值的所述第一数据集的步骤包括基于载荷的所述数据集中的与所述头两个主成分中的一个主成分相关联的相应载荷来修改加权值的所述第二数据集中的每个加权值,以由此获得加权值的所述第一数据集。


3.根据权利要求2所述的方法,其中,所述的修改加权值的所述第二数据集中的每个加权值包括:
选择(32)与第一主成分或第二主成分中的一个主成分相关联的载荷的数据集;以及
将加权值的所述第二数据集中的每个加权值乘以(33)载荷的所述数据集中的与所选择的主成分相关联的相应载荷,以获得加权值的修改的第一数据集。


4.根据权利要求3所述的方法,其中,所述的修改加权值的所述第二数据集中的每个值还包括将加权值的所述第二数据集中的每个加权值除以(34)0与1之间的随机或伪随机选择的数。


5.根据权利要求2至4中的任一项所述的方法,其中,所述的修改加权值的所述第二数据中的每个值包括基于载荷的所述数据集中的与所述头两个主成分中的随机或伪随机选择的一个相关联的相应载荷来修改加权值的所述第二数据中的每个值。


6.根据权利要求2至5中的任一项所述的方法,其中,所述的执行所述聚类过程包括迭代地执行所述聚类过程,并且其中,所述聚类过程还包括:
计算(41)指示通过所述聚类算法执行的所述聚类的质量的质量值;
响应于所述质量值大于第一预定阈值,利用加权值的所述第一数据集中的所述加权值来替换(43)加权值的所述第二数据集中的所述加权值;以及
响应于所述质量值在所述第一预定阈值以下,拒绝(44)加权值的所述第一数据集,并且保留加权值的所述第二数据集的所述加权值。


7.根据权利要求6所述的方法,其中,所述方法包括响应于以下中的任何一个或多个而中断(45)执行迭代聚类过程:
所述质量值大于第二预定阈值;
迭代次数大于预定迭代次数;
在所述迭代聚类过程期间逝去的时间长度大于预定时间长度;以...

【专利技术属性】
技术研发人员:S·孔索利M·亨德里克斯P·C·沃斯J·L·库斯特拉R·D·霍夫曼D·马夫里厄杜斯
申请(专利权)人:皇家飞利浦有限公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1