【技术实现步骤摘要】
本专利技术涉及系统生物学研究
,尤其涉及一种基于复杂生物网络集的频繁模式挖掘基因功能的预测方法。
技术介绍
随着生物芯片技术的产生和生物信息学的发展,通过基因组序列分析,大量未知功能的基因被识别出来。如何系统科学的“赋予”这些基因的功能是后基因组时代科学家们需解决的难题,然而大规模基因表达数据的产生,为这一问题的解决带来了新的突破口。另外,在生物体中,基因往往是通过与其他基因一起共同参与完成一个功能。这些基因往往具有相似的表达谱,因此如何根据这些基因表达的谱数据从而挖掘出这些共表达的基因团,在生物学中有很重要的研究价值(比如可以预测一个基因的未知功能或者推断一个未知基因的功能),但是由于高通量技术本身具有高噪声的影响以及生物系统本身的复杂性,人们得到的基因芯片数据转化的生物网络中,含有大量无关的“噪声”,正是因为这些“噪声”的存在,才使得科学家们寻找共表达的基因团变得很困难。如果能够把这些大量无关的“噪声”逐步的给剔除掉,那么寻找保守的共表达基因团的问题也就变得简单起来。在现有技术中,基于复杂生物网络集的频繁模式挖掘基因功能的预测方法有以下几种:(1)基于 ...
【技术保护点】
一种基于复杂生物网络集的频繁模式挖掘基因功能的预测方法,其特征在于,所述预测方法包括:第一步、寻找频繁稠密点集无贡献的不相关的边:步骤S11、获取多个基因表达数据转换成生物网络后形成的初始图集D={Gi=(V,Ei)}(1≤i≤m),并确定最小稠密度阈值δ、最小频繁支持度阈值k和用户自定义参数f,p,q分别对应的数值;其中,所述初始图集由多个均具有相同点集的子图Gi形成,且不同子图Gi之间至少存在一条相异的边;步骤S12:确定每一个子图Gi的每条边,在所述初始图集中出现的次数均大于最小频繁支持度阈值k和图集大小m的乘积的最小正整数值;步骤S13、删除所述初始图集中每一个子图 ...
【技术特征摘要】
1.一种基于复杂生物网络集的频繁模式挖掘基因功能的预测方法,其特征在于,所述预测方法包括:第一步、寻找频繁稠密...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。