The invention relates to a method of visualization of multiple sequence alignment based on image processing, including the following steps: S1. takes multiple sequence of amino acids produced by the multi sequence alignment algorithm as input; S2. defines different colors for different types of amino acids, then transforms the sequence of amino acids with color; S3. combines image conversion. Each amino acid in the amino acid sequence corresponds to one pixel in the image, and the color of the pixel corresponds to the color of the amino acid. The image conversion will convert a number of one-dimensional amino acid sequences into two dimensional color images; the S4. is divided into the image segmentation algorithm based on the edge detection and will be segmented after the conversion. The image is presented to the user.
【技术实现步骤摘要】
基于图像处理的多序列比对可视化的方法
本专利技术涉及生物信息学
,更具体地,涉及一种基于图像处理的多序列比对可视化的方法。
技术介绍
近年来,随着人类基因组计划在世界范围内的开展,人类基因组草图已基本完成,标志着人类对生命信息的探索进入了一个新的阶段。同时,对基因表达模式、蛋白质结构、蛋白质-蛋白质相互作用分析得到的数据越来越多。生物信息学的研究重点主要体现在基因组学和蛋白质组学两方面,具体地说就是从核酸和蛋白质序列出发,分析序列中表达结构和功能的生物信息。生物信息学的基本任务是对各种生物序列进行分析,也就是研究新的计算机方法,从大量的序列信息中获取基因结构、功能和进化等知识。生物序列检索在生物信息学中是一项基础性工作。生物学研究认为:生物序列的功能是由它的结构决定的,而它的结构往往是由一些特定的子序列决定的。所以,进行特定序列的检索在生物学中具有重要的意义:可以用来进行蛋白质的功能区域预测、蛋白质保守区域的判断等。目前有很多针对序列可视化的方法,但大多数是针对DNA序列的可视化。由于蛋白质序列隐含了蛋白质的结构信息,对于蛋白质序列的可视化一般要结合其生物学 ...
【技术保护点】
基于图像处理的多序列比对可视化的方法,其特征在于:包括以下步骤:S1.将多序列比对算法产生的多条氨基酸序列作为输入;S2.分别为不同类型的氨基酸定义不同的颜色,然后对氨基酸序列进行颜色转换;S3.结合图像转换,将氨基酸序列中的每一个氨基酸分别对应图像中的一个像素,像素的颜色对应氨基酸的颜色,图像转换将多条一维的氨基酸序列转换成二维彩色图像;S4.对转换的图像利用基于边缘检测的图像分割算法进行分割,将分割后的图像展现给用户。
【技术特征摘要】
1.基于图像处理的多序列比对可视化的方法,其特征在于:包括以下步骤:S1.将多序列比对算法产生的多条氨基酸序列作为输入;S2.分别为不同类型的氨基酸定义不同的颜色,然后对氨基酸序列进行颜色转换;S3.结合图像转换,将氨基酸序列中的每一个氨基酸分别对应图像中的一个像素,像素的颜色对应氨基酸的颜色,图像转换将多条一维的氨基酸序列转换成二维彩色图像;S4.对转换的图像利用基于边缘检测的图像分割算法进行分割,将分割后的图像展现给用户。2.根据权利要求1所述的基于图像处理的多序列比对可视化的方法,其特征在于:所述步骤S2利用改进的ClustalOmega的配色标准对不同类型的氨基酸定义不同的颜色:氨基酸AVFPMILW用红色表示;氨基酸DE用蓝色表示;氨基酸RK用品红色表示;氨基酸STYHCNGQ用绿色表示;剩余的氨基酸和其他字符使用黑色表示。3.根据权利要求2所述的基于图像处理的多序列比对可视化的方法,其特征在于:所述步骤S3的具体流程如下:设氨基酸序列的条数为M,M条氨基酸序列中最长的氨基酸序列的长度为N,对其余的氨基酸序列的尾部进行补空使其长度也为N,从而新建一个M*N的二维彩色图像。4.根据权利要求3所述的基于图像处理的多序列比对可视化的方法,其特征在于:所述二维彩色图像中,氨基酸AVFPMILW采用RGB(255,0,0)表示,对应位置的像素为红色;氨基酸DE用RGB(20,90,255)表示,对应位置的像素为蓝色;氨基酸RK用RGB(180,90,180)表示,对应位置的像素为品红色;氨基酸STYHCNGQ用RGB(0,255,0)表示,对应位置的像素为绿色;剩余的氨基酸和其他字符用RGB(0,0,0)表示,对应位置的像素为黑色。5.根据权利要求1所述的基于图像处理的多序列比对可视化的方法...
【专利技术属性】
技术研发人员:王玲芳,李伟忠,郑贵锋,
申请(专利权)人:中山大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。