蛋白质-DNA结合位点的鉴定方法技术

技术编号:18892214 阅读:84 留言:0更新日期:2018-09-08 09:56
本发明专利技术提出了确定蛋白质‑DNA结合位点的方法以及确定蛋白质‑DNA结合位点的装置。所述方法包括:分别将参考蛋白质集的氨基酸序列和待测蛋白质的氨基酸序列拆分为具有预定氨基酸数目的多个候选单元;确定所述多个候选单元每一个的氨基酸属性,确定所述待测蛋白质的蛋白质‑DNA结合位点。利用本发明专利技术的确定蛋白质‑DNA结合位点的方法及装置能够准确地确定蛋白质‑DNA结合位点,且步骤简单,操作方便,极大地降低了成本。

Identification of protein -DNA binding sites

The invention provides a method for determining the binding site of protein DNA and a device for determining the binding site of protein DNA. The method comprises: splitting the amino acid sequence of the reference protein set and the amino acid sequence of the protein to be measured into a plurality of candidate units with a predetermined number of amino acids, determining the amino acid properties of each of the multiple candidate units, and determining the protein DNA binding site of the protein to be measured. The method and device for determining the binding site of protein to DNA can accurately determine the binding site of protein to DNA, and the steps are simple, the operation is convenient, and the cost is greatly reduced.

【技术实现步骤摘要】
蛋白质-DNA结合位点的鉴定方法
本专利技术涉及生物领域。具体地,本专利技术涉及蛋白质-DNA结合位点的鉴定方法。更具体地,本专利技术涉及确定蛋白质-DNA结合位点的方法以及确定蛋白质-DNA结合位点的装置。
技术介绍
蛋白质与DNA的相互作用在细胞的生命活动中广泛存在。DNA分子不仅作为遗传物质来编码蛋白质,还能与特定蛋白质结合,调控基因表达。例如DNA复制、mRNA转录与修饰以及病毒的感染等都涉及到DNA与蛋白质之间的相互作用。然而,目前对确定蛋白质-DNA结合位点的方法及装置仍有待改进。
技术实现思路
本专利技术旨在至少在一定程度上解决现有技术中存在的技术问题至少之一。为此,本专利技术提出了确定蛋白质-DNA结合位点的方法及装置。利用根据本专利技术实施例的确定蛋白质-DNA结合位点的方法及装置能够准确地确定蛋白质-DNA结合位点,且步骤简单,操作方便,极大地降低了成本。需要说明的是,本专利技术是基于专利技术人的下列发现而完成的:目前,确定蛋白质-DNA结合位点的方法主要包括点突变实验、DNA迁移率变动实验、DNaseI足迹实验、X射线衍射、核磁共振等。但是实验周期长,经费投入巨大,特别是有些蛋白质-DNA复合体很难获得,造成了蛋白质功能位点的标注速度远远落后于蛋白质序列和结构信息增长的速度。有鉴于此,专利技术人经过大量实验发现,一些氨基酸属性显著影响氨基酸与DNA结合,进而,基于参考蛋白质的这些氨基酸属性、其蛋白质-DNA的结合位点和待测蛋白质的这些氨基酸属性,能够准确地确定待测蛋白质的蛋白质-DNA结合位点。由此,利用根据本专利技术实施例的确定蛋白质-DNA结合位点的方法及装置能够准确地确定蛋白质-DNA结合位点,且步骤简单,操作方便,极大地降低了成本。为此,在本专利技术的一个方面,本专利技术提出了一种确定蛋白质-DNA结合位点的方法。根据本专利技术的实施例,所述方法包括:分别将参考蛋白质集的氨基酸序列和待测蛋白质的氨基酸序列拆分为具有预定氨基酸数目的多个候选单元;确定所述多个候选单元每一个的氨基酸属性,所述氨基酸属性包括选自下列的至少之一:残基平均非结合能、转移自由能cap-chx、氨基酸组成、参加短程和中程非结合能、分子量、转移自由能vap-oct、α-螺旋倾向性、高盐色谱RF值、残基平均体积、细胞色素合成蛋白氨基酸组成、主成分III、SD总蛋白的氨基酸组成、可及表面积、18个非冗余嗜温蛋白家族氨基酸分布以及表面可及性蛋白含量;以及基于所述候选单元中氨基酸的属性,确定所述待测蛋白质的蛋白质-DNA结合位点。专利技术人发现,上述氨基酸属性显著影响氨基酸与DNA结合,进而,基于参考蛋白质的这些氨基酸属性、其蛋白质-DNA结合位点和待测蛋白质的这些氨基酸属性,能够准确地确定待测蛋白质的蛋白质-DNA结合位点。另外,考虑到蛋白质序列上相邻的氨基酸残基之间可能存在相互作用,将参考蛋白质集的氨基酸序列和待测蛋白质的氨基酸序列拆分为具有预定氨基酸数目的多个候选单元,以便提高结果的准确性。由此,利用根据本专利技术实施例的确定蛋白质-DNA结合位点的方法能够准确地确定蛋白质-DNA结合位点,且步骤简单,操作方便,极大地降低了成本。根据本专利技术的实施例,上述确定蛋白质-DNA结合位点的方法还可以具有下列附加技术特征:根据本专利技术的实施例,所述预定氨基酸个数值为19。由此,利用根据本专利技术实施例的确定蛋白质-DNA结合位点的方法进一步准确地确定蛋白质-DNA结合位点。根据本专利技术的实施例,所述参考蛋白质集含有至少30个所述参考蛋白质。由此,利用根据本专利技术实施例的确定蛋白质-DNA结合位点的方法进一步准确地确定蛋白质-DNA结合位点。根据本专利技术的实施例,所述候选单元中的氨基酸具有下列至少之一的属性,是所述氨基酸为蛋白质-DNA结合位点的指示:残基平均非结合能为-26.17~-7.59;转移自由能cap-chx为-8.21~1.45;氨基酸组成为0.7~8.8;参加短程和中程非结合能为-14.42~-5.46;分子量为75.07~204.24;转移自由能vap-oct为-18.6~2.39;α-螺旋倾向性为-0.38~1.24;高盐色谱RF值为0.2~0.97;残基平均体积为67.5~237.2;细胞色素合成蛋白氨基酸组成为1.06~8.36;主成分III为-0.29~0.49;SD总蛋白的氨基酸组成为1.15~3.73;可及表面积为0~271.6;18个非冗余嗜温蛋白家族氨基酸分布为1~9.4;以及表面可及性蛋白含量为0~0.22。由此,利用根据本专利技术实施例的确定蛋白质-DNA结合位点的方法进一步准确地确定蛋白质-DNA结合位点。在本专利技术的另一方面,本专利技术提出了一种确定蛋白质-DNA结合位点的装置。根据本专利技术的实施例,所述装置包括:拆分组件,适于分别将参考蛋白质集的氨基酸序列和待测蛋白质的氨基酸序列拆分为具有预定氨基酸数目的多个候选单元;氨基酸属性确定组件,所述氨基酸属性确定组件与所述拆分组件相连,适于确定所述多个候选单元每一个的氨基酸属性,所述氨基酸属性包括选自下列的至少之一:残基平均非结合能、转移自由能cap-chx、氨基酸组成、参加短程和中程非结合能、分子量、转移自由能vap-oct、α-螺旋倾向性、高盐色谱RF值、残基平均体积、细胞色素合成蛋白氨基酸组成、主成分III、SD总蛋白的氨基酸组成、可及表面积、18个非冗余嗜温蛋白家族氨基酸分布以及表面可及性蛋白含量;以及确定组件,所述确定组件与所述氨基酸属性确定组件相连,适于基于所述候选单元中氨基酸的属性,确定所述待测蛋白质的蛋白质-DNA结合位点。由此,利用根据本专利技术实施例的确定蛋白质-DNA结合位点的装置能够准确地确定蛋白质-DNA结合位点,且步骤简单,操作方便,极大地降低了成本。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1显示了根据本专利技术一个实施例的确定蛋白质-DNA结合位点的方法的流程示意图;图2显示了根据本专利技术一个实施例的确定蛋白质-DNA结合位点的装置的结构示意图;图3显示了根据本专利技术一个实施例的实际确定的蛋白质-DNA结合位点及理论上蛋白质-DNA结合位点的对比分析示意图;以及图4显示了根据本专利技术一个实施例的预定氨基酸数目对结果影响的分析示意图。具体实施方式下面详细描述本专利技术的实施例。下面描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。本专利技术提出了确定蛋白质-DNA结合位点的方法及装置,下面将分别对其进行详细描述。确定蛋白质-DNA结合位点的方法在本专利技术的一个方面,本专利技术提出了一种确定蛋白质-DNA结合位点的方法。根据本专利技术的实施例,参见图1,该方法包括:S100拆分为多个候选单元在该步骤中,分别将参考蛋白质集的氨基酸序列和待测蛋白质的氨基酸序列拆分为本文档来自技高网...

【技术保护点】
1.一种确定蛋白质‑DNA结合位点的方法,其特征在于,包括:分别将参考蛋白质集的氨基酸序列和待测蛋白质的氨基酸序列拆分为具有预定氨基酸数目的多个候选单元;确定所述多个候选单元每一个的氨基酸属性,所述氨基酸属性包括选自下列的至少之一:残基平均非结合能、转移自由能cap‑chx、氨基酸组成、参加短程和中程非结合能、分子量、转移自由能vap‑oct、α‑螺旋倾向性、高盐色谱RF值、残基平均体积、细胞色素合成蛋白氨基酸组成、主成分III、SD总蛋白的氨基酸组成、可及表面积、18个非冗余嗜温蛋白家族氨基酸分布以及表面可及性蛋白含量;以及基于所述候选单元中氨基酸的属性,确定所述待测蛋白质的蛋白质‑DNA结合位点。

【技术特征摘要】
1.一种确定蛋白质-DNA结合位点的方法,其特征在于,包括:分别将参考蛋白质集的氨基酸序列和待测蛋白质的氨基酸序列拆分为具有预定氨基酸数目的多个候选单元;确定所述多个候选单元每一个的氨基酸属性,所述氨基酸属性包括选自下列的至少之一:残基平均非结合能、转移自由能cap-chx、氨基酸组成、参加短程和中程非结合能、分子量、转移自由能vap-oct、α-螺旋倾向性、高盐色谱RF值、残基平均体积、细胞色素合成蛋白氨基酸组成、主成分III、SD总蛋白的氨基酸组成、可及表面积、18个非冗余嗜温蛋白家族氨基酸分布以及表面可及性蛋白含量;以及基于所述候选单元中氨基酸的属性,确定所述待测蛋白质的蛋白质-DNA结合位点。2.根据权利要求1所述的方法,其特征在于,所述预定氨基酸个数值为19。3.根据权利要求1所述的方法,其特征在于,所述参考蛋白质集含有至少30个所述参考蛋白质。4.根据权利要求1所述的方法,其特征在于,所述候选单元中的氨基酸具有下列至少之一的属性,是所述氨基酸为蛋白质-DNA结合位点的指示:残基平均非结合能为-26.17~-7.59;转移自由能cap-chx为-8.21~1.45;氨基酸组成为0.7~8.8;参加短程和中程非结合能为-14.42~-5.46;分子量为75.07~204.24;转移自由能vap-o...

【专利技术属性】
技术研发人员:张德强司婧娜
申请(专利权)人:北京林业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1