当前位置: 首页 > 专利查询>温州大学专利>正文

基于复杂生物网络集的频繁模式挖掘基因功能的预测方法技术

技术编号:14349200 阅读:135 留言:0更新日期:2017-01-04 19:49
本发明专利技术实施例公开了一种基于复杂生物网络集频繁模式挖掘基因功能的方法,该方法首先获取由多个基因表达数据转换成生物网络后形成的初始图集,并对初始图集做粗过滤,删除对于寻找频繁稠密点集无贡献的不相关的边得到摘要图,接着在摘要图的基础上寻找可能的候选网络子集,然后回到初始图集中分别提取出候选网络子集,并对提取的图集再一次做粗过滤以便得到摘要图集,最后分别对摘要图进行稠密子图查找,得到频繁稠密点集作为共表达的基因团。实施本发明专利技术,能够降低计算复杂度,提高频繁模式挖掘的准确性、效率以及解决模式重叠问题。

【技术实现步骤摘要】

本专利技术涉及系统生物学研究
,尤其涉及一种基于复杂生物网络集的频繁模式挖掘基因功能的预测方法
技术介绍
随着生物芯片技术的产生和生物信息学的发展,通过基因组序列分析,大量未知功能的基因被识别出来。如何系统科学的“赋予”这些基因的功能是后基因组时代科学家们需解决的难题,然而大规模基因表达数据的产生,为这一问题的解决带来了新的突破口。另外,在生物体中,基因往往是通过与其他基因一起共同参与完成一个功能。这些基因往往具有相似的表达谱,因此如何根据这些基因表达的谱数据从而挖掘出这些共表达的基因团,在生物学中有很重要的研究价值(比如可以预测一个基因的未知功能或者推断一个未知基因的功能),但是由于高通量技术本身具有高噪声的影响以及生物系统本身的复杂性,人们得到的基因芯片数据转化的生物网络中,含有大量无关的“噪声”,正是因为这些“噪声”的存在,才使得科学家们寻找共表达的基因团变得很困难。如果能够把这些大量无关的“噪声”逐步的给剔除掉,那么寻找保守的共表达基因团的问题也就变得简单起来。在现有技术中,基于复杂生物网络集的频繁模式挖掘基因功能的预测方法有以下几种:(1)基于广度优先算法:利用类本文档来自技高网...
基于复杂生物网络集的频繁模式挖掘基因功能的预测方法

【技术保护点】
一种基于复杂生物网络集的频繁模式挖掘基因功能的预测方法,其特征在于,所述预测方法包括:第一步、寻找频繁稠密点集无贡献的不相关的边:步骤S11、获取多个基因表达数据转换成生物网络后形成的初始图集D={Gi=(V,Ei)}(1≤i≤m),并确定最小稠密度阈值δ、最小频繁支持度阈值k和用户自定义参数f,p,q分别对应的数值;其中,所述初始图集由多个均具有相同点集的子图Gi形成,且不同子图Gi之间至少存在一条相异的边;步骤S12:确定每一个子图Gi的每条边,在所述初始图集中出现的次数均大于最小频繁支持度阈值k和图集大小m的乘积的最小正整数值;步骤S13、删除所述初始图集中每一个子图Gi中均满足稠密度系...

【技术特征摘要】
1.一种基于复杂生物网络集的频繁模式挖掘基因功能的预测方法,其特征在于,所述预测方法包括:第一步、寻找频繁稠密...

【专利技术属性】
技术研发人员:沈良忠
申请(专利权)人:温州大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1