一种数据库系统的建立及其应用技术方案

技术编号:38089135 阅读:26 留言:0更新日期:2023-07-06 08:59
本发明专利技术涉及一种数据库系统的建立的方法,其包括以下步骤:步骤一、使用分析仪器对生物液体活检样本进行检测,获取实验室生成的fid原始数据文件;步骤二、使用软件将数据文件转化为可以处理的数据文件;步骤三、使用数据转换方法对可处理的数据进行处理;步骤四、根据样本特征数据情况分析判断本次实验进行QC,判断是否满足数据要求;步骤五、如满足数据要求,则对样本特征数据进行数据清洗;步骤六、使用算法对处理过的特征数据进行数据建模预测,并筛选出关键的峰以及其丰度数据;步骤七、事先使用带有准确人工标注的数据,用于机器学习模型的训练;步骤八、将筛选所得的数据输入预训练好的机器学习模型,并给出相应的预测结果以辅助临床诊断。辅助临床诊断。辅助临床诊断。

【技术实现步骤摘要】
一种数据库系统的建立及其应用


[0001]本专利技术涉及解决质谱仪、光谱仪、气相色谱仪或液相色谱仪等分析仪器对生物液体活检样本中的蛋白组学、多肽组学和代谢组学等检测结果的数据处理的方法。

技术介绍

[0002]在体外诊断领域,疾病的发展过程总是体现出蛋白、多肽以及代谢产物的异常。例如,在癌症患者血清中,有些多肽持续保持很低水平(如各种癌症患者中所有的FPA片段和乳腺癌患者中3C3f片段),有的则呈高水平(如膀胱癌和前列腺癌中的几种C3f片段和乳腺癌中的一种FPA片段)。从数据分析的角度,我们需要获取这些检测对象的各种属性,然后归一化为等长的特征向量,最后再采用各种计算手段进行分析,以便识别出肿瘤、冠心病等疾病的标志物,进而对疾病进行诊断。在这个过程中,标志物的提取尤其重要,直接影响到诊断结果的准确性。
[0003]实验数据处理是一种广泛应用于生产和科学研究过程中的普遍使用的科学计算方法,是产品设计质量管理和科学研究的重要工具。通过特殊的计算手段,对光谱、色谱以及质谱等检测方法得到的数据进行分析,可快速判断出肿瘤、冠心病、高血压及糖尿病等本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据库系统的建立的方法,其包括以下步骤:步骤一、使用分析仪器对生物液体活检样本进行检测,获取实验室生成的fid原始数据文件;步骤二、使用CompassXport软件将fid数据文件转化为可以处理的数据文件;步骤三、使用数据转换方法对上述可处理的数据进行处理,以获得各组分准确的相对丰度;步骤四、根据样本特征数据情况分析判断本次实验进行QC,判断是否满足数据要求,如不满足,分析原因,重新实验;步骤五、如满足数据要求,则对样本特征数据进行数据清洗;步骤六、使用算法对处理过的特征数据进行数据建模预测,并筛选出关键的峰以及其丰度数据;步骤七、事先使用带有准确人工标注的数据,用于机器学习模型的训练;步骤八、将筛选所得的数据输入预训练好的机器学习模型,并给出相应的预测结果以辅助临床诊断。2.根据权利要求1所述数据库系统的建立的方法,其中,在步骤一中,所述分析仪器为质谱仪、光谱仪、气相色谱仪或液相色谱仪。3.根据权利要求1所述数据库系统的建立的方法,其中,步骤一中,所述生物液体活检样本选自血清、尿液、组织液、唾液、血浆和关节液中的任一种。4.根据权利要求1所述数据库系统的建立的方法,其中,在步骤二中,为了提高数据转化的效率,采用多进程处理的方法。5.根据权利要求1所述数据库系统的建立的方法,其中,在步骤二中,可以处理的数据文件为mzml、txt、csv格式的数据文件。6.根据权利要求1所述数据库系统的建立的方法,其中,步骤三中数据转换方法包括以下几个步骤:S1、使用平方根的方法对数据进行处理;S2、使用SavitzkyGolay方法平滑数据;S3、使用SNIP方法矫正数据;S4、计算峰强度。7.根据权利要求1所述数据库系统的建立的方法,其中,步骤五中数据清洗选自删除异常数据、数据填补和特征筛选中的一种以上。8.根据权利要求1所述数据库系统的建立的方法,其中,步骤六中的算法为随机森林、SVM、神经网络或者贝叶斯网络。9.一种建立数据库的系统,其包括以下模块:采集模块,...

【专利技术属性】
技术研发人员:傅博韩嘉宸
申请(专利权)人:上海固容生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1