The aim of this study is to ensure the independence of the mass spectrometry data collected from the samples collected by the examinees and the concurrent implementation of the cancer marker-based diagnosis, and to improve the reliability of the mutual diagnosis. The m/z values of ions derived from tumor markers and other substances used in other examinations are stored in DB (31) of concern m/z value in advance. The spectral information filter (22) deletes the signal intensity of m/z values stored in DB (31) of concern m/z value from multiple mass spectra classified according to cancer and non-cancer. The learning processing unit (23) takes the deleted data as the learning data to obtain the learning result information and saves it to the learning result DB (32). For the mass spectrometry data of the target sample, the signal intensity of the prescribed m/z value is also deleted. Then, the decision processing unit (24) determines which category is classified into cancer and non-cancer based on the learning result information stored in the learning result DB (32).
【技术实现步骤摘要】
【国外来华专利技术】质谱分析数据解析装置及解析方法
本专利技术涉及对由质谱分析装置得到的数据进行解析的数据解析装置及解析方法,更详细而言,涉及对针对特定疾病的诊断或检查、农产品和水产品等的产地的真伪判定、假药或假币等的判定等各种领域中的试样的检查及判定有用的质谱分析数据解析装置及解析方法。
技术介绍
伴随近年的质谱分析技术的迅速发展,进行了如下的尝试:对从被检者采集的生物体试样(血液、尿、唾液、或生物体组织的一部分等)进行质谱分析,对于由此得到的数据进行数据解析,从而进行癌等特定疾病的诊断。例如本申请人等的专利文献1中记载了以下内容:将作为统计机器学习的一个方法的dPLRM(双惩罚逻辑回归机;dualPenalizedLogisticRegressionMachine)应用于对生物体试样进行质谱分析而收集到的质谱数据,来进行癌的判定。通过像这样使用统计机器学习的方法而不使用通常的多变量分析,能够从庞大量的复杂数据中提取极微小的差异,基于这种差异,能够提高癌/非癌的判定精度。这种统计机器学习已经或逐渐应用于如上所述的疾病的诊断、以及语音识别、字符识别、面部识别等图像识别、各种产品的真伪判定等各种各样的领域。这种统计机器学习的算法中,大致分为监督学习和无监督学习,监督学习是常规的。在监督机器学习中,通常以预先提供的被分类到多个类中的多个数据为学习数据,来学习上述多个类的界限,对于新数据,基于学习结果来判定分类到哪一个类。例如在专利文献1中记载的装置中,多个类是指癌症患者的类和健康者(或非癌症患者)的类。在以下的说明中,将监督机器学习简称为机器学习。在如上所述的机器学习中,若作为判 ...
【技术保护点】
1.一种质谱分析数据解析方法,使用学习结果信息,基于针对目标试样进行质谱分析所得到的质谱数据来将该目标试样分类,所述学习结果信息是以针对被分类到多个类中的多个试样分别进行质谱分析所得到的质谱数据为学习数据来执行规定的机器学习从而求出的,所述质谱分析数据解析方法的特征在于,包括以下步骤:a)学习数据过滤步骤,针对作为所述学习数据而被提供的多个质谱数据中的各个质谱数据,进行将预先设定的一个或多个质荷比或质荷比范围的信号强度信息删除或修改该信号强度信息的权重的处理;b)学习执行步骤,使用在所述学习数据过滤步骤中进行处理后的学习数据,来执行所述机器学习,制作并存储学习结果信息;c)目标数据过滤步骤,对于针对目标试样得到的质谱数据,执行与所述学习数据过滤步骤同等的处理;d)判定执行步骤,基于在所述目标数据过滤步骤中进行处理后的质谱数据,使用在所述学习执行步骤中存储的学习结果信息,来判定所述目标试样属于多个类中的哪一个类。
【技术特征摘要】
【国外来华专利技术】1.一种质谱分析数据解析方法,使用学习结果信息,基于针对目标试样进行质谱分析所得到的质谱数据来将该目标试样分类,所述学习结果信息是以针对被分类到多个类中的多个试样分别进行质谱分析所得到的质谱数据为学习数据来执行规定的机器学习从而求出的,所述质谱分析数据解析方法的特征在于,包括以下步骤:a)学习数据过滤步骤,针对作为所述学习数据而被提供的多个质谱数据中的各个质谱数据,进行将预先设定的一个或多个质荷比或质荷比范围的信号强度信息删除或修改该信号强度信息的权重的处理;b)学习执行步骤,使用在所述学习数据过滤步骤中进行处理后的学习数据,来执行所述机器学习,制作并存储学习结果信息;c)目标数据过滤步骤,对于针对目标试样得到的质谱数据,执行与所述学习数据过滤步骤同等的处理;d)判定执行步骤,基于在所述目标数据过滤步骤中进行处理后的质谱数据,使用在所述学习执行步骤中存储的学习结果信息,来判定所述目标试样属于多个类中的哪一个类。2.根据权利要求1所述的质谱分析数据解析方法,其特征在于,通过一并使用基于与该解析方法不同的其它方法的判定结果,来断定所述目标试样被分类到所述多个类中的哪一个类中,将源自以下化合物的离子的质荷比或质荷比范围设为所述预先设定的一个或多个质荷比或质荷比范围:作为所述其它方法中的测定或检查的对象的一个或多个化合物。3.根据权利要求2所述的质谱分析数据解析方法,其特征在于,所述其它方法为以特定化合物为标志物来进行测定或检查的方法,将源自以下化合物的离子的质荷比或质荷比范围设为所述预先设定的一个或多个质荷比或质荷比范围:作为该标志物的化合物、和/或、该化合物的代谢物、和/或、在该化合物代谢时受到影响的生物体内分子。4.根据权利要求1所述的质谱分析数据解析方法,其特征在于,将源自以下化合物的离子的质荷比或包含该质荷比的规定幅度的质荷比范围设为所述预先设定的一个或多个质荷比或质荷比范围:预计质谱上的信号强度在基于学习数据的学习时与目标试样的判定时产生较大差异的一个或多个化合物。5.根据权利要求4所述的质谱分析数据解析方法,其特征在于,所述试样为源自生物体的试样,将源自以下化合物的离子的质荷比或包含该质荷比的规定幅度的质荷比范围设为所述预先设定的一个或多个质荷比或质荷比范围:施用于该生物体或有可能施用于该生物体的药剂、该药剂的代谢...
【专利技术属性】
技术研发人员:出水秀明,梶原茂树,
申请(专利权)人:株式会社岛津制作所,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。