【技术实现步骤摘要】
本申请涉及数据处理,尤其涉及一种基于同位素分布相似性网络的代谢组学数据处理方法。
技术介绍
1、代谢反应是生命系统中物质转化的过程,具有重要的生物学意义,如提供能量、生成信号分子和参与生物大分子的构建。这些代谢反应构成了错综复杂的代谢网络,形成了细胞代谢的基本生化骨架。如果代谢网络不完整,就会限制人们对生命活动的全面理解,因此,如何注释未知代谢反应以构建完整代谢网络成为人们关注的焦点。
2、在相关技术中,注释未知代谢反应的方式可以包括计算预测和实验技术。前者可以通过现有的代谢网络、酶功能和化学转化知识进行注释,然而,基因组并不能完全反应代谢组的真实情况,大部分计算预测局限于已知代谢物,这限制了被预测的代谢反应的范围。后者可以基于体外基于酶活性的代谢组学分析注释新的代谢反应,具体地,可以将过表达或纯化的酶孵育在一个含有数百种代谢物的提取溶液中,通过非靶向代谢组学测定积累和消耗的代谢物,来判断酶催化反应中的底物与产物,然而,该过程需要纯化或过表达酶,限制了可研究的酶范围且非酶催化反应无法被捕获,因此会缩小注释未知代谢反应的范围。
【技术保护点】
1.一种基于同位素分布相似性网络的代谢组学数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于每个所述代谢物的代谢物数据,确定所述N个代谢物中任两个代谢物之间的同位素分布相似度,包括:
3.根据权利要求2所述的方法,其特征在于,所述M类代谢物对包括第一类代谢物对,所述第一类代谢物对包括第一代谢物对,所述第一代谢物对中两个代谢物的同位素体的数量相同;所述同位素分布相似度包括第一同位素分布相似度;所述同位素分布相似度策略包括用于基于代谢物的同位素体的标记比例和代谢物对的中两个代谢物的分子式的目标原子数量中的最小目标原
...【技术特征摘要】
1.一种基于同位素分布相似性网络的代谢组学数据处理方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于每个所述代谢物的代谢物数据,确定所述n个代谢物中任两个代谢物之间的同位素分布相似度,包括:
3.根据权利要求2所述的方法,其特征在于,所述m类代谢物对包括第一类代谢物对,所述第一类代谢物对包括第一代谢物对,所述第一代谢物对中两个代谢物的同位素体的数量相同;所述同位素分布相似度包括第一同位素分布相似度;所述同位素分布相似度策略包括用于基于代谢物的同位素体的标记比例和代谢物对的中两个代谢物的分子式的目标原子数量中的最小目标原子数量计算所述第一同位素分布相似度的第一策略;
4.根据权利要求2所述的方法,其特征在于,所述m类代谢物对包括第二类代谢物对,所述第二类代谢物对包括第二代谢物对,所述第二代谢物对中两个代谢物的同位素体的数量不相同且所述第二代谢物对中每个代谢物标记的同位素体的数量为一个;所述同位素分布相似度包括第二同位素分布相似度;所述同位素分布相似度策略包括用于基于代谢物的标记的同位素体对应的同位素分布单元和代谢物对中两个代谢物的每个代谢物对应的同位素分布单元的最小目标原子数量计算所述第二同位素分布相似度的第二策略;
5.根据权利要求2所述的方法,其特征在于,所述m类代谢物对包括第三类代谢物对,所述第三类代谢物对包括第三代谢物对,所述第三代谢物对中两个代...
【专利技术属性】
技术研发人员:朱正江,高扬,蔡玉萍,
申请(专利权)人:中国科学院上海有机化学研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。