越野他汀的生物合成基因簇及其应用制造技术

技术编号:8956334 阅读:283 留言:0更新日期:2013-07-25 01:21
本发明专利技术涉及越野他汀的生物合成基因簇,具体地,是由一种小单孢菌Micromonospora?sp.TP-A0468产生的具有抗肿瘤活性的蒽环类抗生素——越野他汀的生物合成基因簇的克隆、测序、分析、功能研究及其应用。整个基因簇共包含55个基因:17个II型聚酮合成酶(PKS)相关基因;8个非核糖体聚肽合成酶(NRPS)相关基因;9个糖基合成相关基因;6个特殊的后修饰基因;7个抗性基因;5个调节基因以及3个无明确功能的基因。通过对上述生物合成基因的遗传操作可阻断越野他汀的生物合成,或使其产量发生改变,或产生新的化合物。该基因簇可用于蒽环类化合物的基因工程、蛋白表达、酶催化反应等,也可用于寻找和发现用于医药、工业或农业的化合物或基因、蛋白。

【技术实现步骤摘要】

本专利技术属于微生物基因资源和基因工程领域,具体涉及抗肿瘤抗生素越野他汀(Kosinostatin)的生物合成基因簇的克隆、分析、功能研究及其应用。
技术介绍
越野他汀(Kosinostatin)是2002年由日本科学家Tamotsu Furumai从富山湾深海中分离得到的小单孢菌Micromonospora sp.TP-A0468所产生的具有良好抗肿瘤抗菌活性的天然产物[J.Antibiot.(Tokyo) 55, 128 - 133 (2002) ] 0 2007年埃及科学家El-Naggar, M.Y.再次从链霉菌 Streptomyces violaceusniger strain HAL64 中分离得到[J.Microbiol.45,262 - 267(2007)]。对于革兰氏阳性菌,越野他汀具有良好的生物活性(例如对于Bacillus subtilisATCC6633,MIC = 39ng/mL);对于革兰氏阴性菌和酵母,越野他汀具有中等的生物活性;对于肿瘤细胞,越野他汀具有良好的生物活性(IC50约为0.10 μ M),其抗肿瘤活性要优于阿霉素O越野他汀分子由三部分组成:蒽环骨架、含氮杂环以及酰基化的脱氧己糖单元。其中的蒽环骨架是以II型PKS的方式合成的。II型PKS由miniPKS以及相关的负责折叠、环化、氧化还原以及其他修饰的后修饰酶组成。阐明蒽环骨架的合成机理对于丰富人们对蒽环类天然产物的认识、改造蒽环类天然产物的合成路径以产生价值更高的“非天然”天然产物都有重要意义。分子的含氮杂环和脱氧糖基均是药效基团,而且结构比较新颖,但是目前的对其合成途径还不甚了解,推测其合成机制是比较独特的。因此,阐明这两个基团的合成过程,理解其生物合成的酶学机制,将大大提升人们对抗菌抗肿瘤天然产物构效关系及生物合成原理的认识。因此,本领域迫切需要阐明越野他汀生物合成的酶学机制,从而实现对越野他汀分子的改造,以期获得活性更高、专一性更强、毒性更低的中间体和衍生物。
技术实现思路
本专利技术涉及具有良好抗肿瘤活性的越野他汀的生物合成基因簇的克隆、测序、分析、功能研究及其应用。本专利技术第一方面,提供了越野他汀的生物合成基因簇,所述基因簇包括编码越野他汀生物合成所涉及的55个基因,具体为:I) II 型聚酮合成酶 PKS 相关基因:kstAl, kstA2, kstA3, kstDl, kstD2, kstD3,kstD4, kstD5, kstD6, kstD7, kstD8, kstD9, kstDIO, kstDll, kstD12, kstD13, kstD14 ;共 17个基因:kstAl位于基因簇核苷酸序列 第9943-11505位,编码腺苷酰化酶,长度为422个氨基酸;kstA2位于基因簇核苷酸序列第11507-11770位,编码肽酰载体蛋白(PCP),长度为402个氨基酸;kstA3位于基因簇核苷酸序列第26548-26805位,编码酰基载体蛋白,长度为85个氨基酸;kstDl位于基因簇核苷酸序列第9140-9946位,编码2,3_环环化酶,长度为268个氨基酸;kstD2位于基因簇核苷酸序列第20823-216026位,编码酮基还原酶,长度为259个氨基酸;kstD3位于基因簇核苷酸序列第22658-21699位,编码芳香化酶,长度为319个氨基酸;kstD4位于基因簇核苷酸序列第23481-22696位,编码C_9位酮基还原酶,长度为261个氨基酸;kstD5位于基因簇核苷酸序列第23591-24049位,编码单氧化酶,长度为152个氨基酸;kstD6位于基因簇核苷酸序列第26861-27295位,编码第四环环化酶,长度为144个氨基酸;kstD7位于基因簇核苷酸序列第27391-28233位,编码NAD (P)H:黄素氧化还原酶,长度为280个氨基酸;kstD8位于基因簇核苷酸序列第28260-29156位,编码单氧化酶,长度为298个氨基酸;kstD9位于基因簇核苷酸序列第32267-33358位,编码羧酸酯酶,长度为363个氨基酸;kstDIO位于基因簇核苷酸序列第32267-33358位,编码第四环环化酶,长度为150个氨基酸;kstDl I位于基因簇核苷酸序列第52203-51685位,编码脱氢酶,长度为172个氨基酸;kstD12位于基因簇核苷酸序列第54953-54498位,编码羟化酶,长度为151个氨基酸;kstD13位于基因簇核苷酸序列第60078-58579位,编码FAD依赖的或者包含BBE结构域的氧化还原酶,长度为499个氨基酸;kstD14位于基因簇核苷酸序列第60258-61118位,编码甲基转移酶,长度为286个氨基酸;2)非核糖体聚妝合成酶 NRPS 相关基因:kstBl, kstB2, kstEl, kstE2, kstE3,kstE4, kstE5, kstE6 ;共 8 个基因:kstBl位于基因簇核苷酸序列第9943-11505位,编码NRPS腺苷化酶,长度为520个氨基酸;kstB2位于基因簇核苷酸序列第11507-11770位,编码酰基载体蛋白,长度为87个氨基酸;kstEl位于基因 簇核苷酸序列第13618-13992位,编码L-ectoine合成酶,长度为124个氨基酸;kstE2位于基因簇核苷酸序列第14017-15156位,编码酰基辅酶A脱氢酶,长度为379个氨基酸;kstE3位于基因簇核苷酸序列第55079-55924位,编码羟化酶,长度为281个氨基酸;kstE4位于基因簇核苷酸序列第58555-57470位,编码双氧化酶,长度为361个氨基酸;kstE5位于基因簇核苷酸序列第61163-61852位,编码氨基转移酶,长度为229个氨基酸;kstE6位于基因簇核苷酸序列第63435-64280位,编码脱甲酰酶,长度为281个氨基酸;3)乙酸化的糖基合成相关基因:kstCl, kstC2, kstC3, kstC4, kstC5, kstC6,kstC7, kstC8, kstC9 ;共 9 个基因:kstCl位于基因簇核苷酸序列第19574-18678位,编码dTDP-葡萄糖合成酶,长度为298个氨基酸;kstC2位于基因簇核苷酸序列第19786-20775位,编码dTDP-葡萄糖_4,6_脱水酶,长度为329个氨基酸;kstC3位于基因 簇核苷酸序列第37944-37360位,编码3,5_表异构酶,长度为194个氨基酸;kstC4位于基因簇核苷酸序列第38165-39175位,编码糖基转移酶辅助蛋白,长度为336个氨基酸;kstC5位于基因簇核苷酸序列第39198-40496位,编码糖基转移酶,长度为432个氨基酸;kstC6位于基因簇核苷酸序列第40496-41992位,编码2,3_己糖脱水酶,长度为498个氨基酸;kstC7位于基因簇核苷酸序列第41989-43014位,编码丙酮酸脱氢酶α亚基,长度为341个氨基酸;kstC8位于基因簇核苷酸序列第43031-44068位,编码丙酮酸脱氢酶β亚基,长度为345个氨基酸;kstC9位于基因簇核苷酸序列第53344-52361位,编码己糖_3_酮基还原酶,长度为327个氨基酸;4)负本文档来自技高网
...

【技术保护点】
一种越野他汀的生物合成基因簇,其特征在于,所述基因簇包括编码越野他汀生物合成所涉及的55个基因,具体为:1)II型聚酮合成酶PKS相关基因:kstA1,kstA2,kstA3,kstD1,kstD2,kstD3,kstD4,kstD5,kstD6,kstD7,kstD8,kstD9,kstD10,kstD11,kstD12,kstD13,kstD14;共17个基因:kstA1位于基因簇核苷酸序列第9943?11505位,编码腺苷酰化酶,长度为422个氨基酸;kstA2位于基因簇核苷酸序列第11507?11770位,编码肽酰载体蛋白(PCP),长度为402个氨基酸;kstA3位于基因簇核苷酸序列第26548?26805位,编码酰基载体蛋白,长度为85个氨基酸;kstD1位于基因簇核苷酸序列第9140?9946位,编码2,3?环环化酶,长度为268个氨基酸;kstD2位于基因簇核苷酸序列第20823?216026位,编码酮基还原酶,长度为259个氨基酸;kstD3位于基因簇核苷酸序列第22658?21699位,编码芳香化酶,长度为319个氨基酸;kstD4位于基因簇核苷酸序列第23481?22696位,编码C?9位酮基还原酶,长度为261个氨基酸;kstD5位于基因簇核苷酸序列第23591?24049位,编码单氧化酶,长度为152个氨基酸;kstD6位于基因簇核苷酸序列第26861?27295位,编码第四环环化酶,长度为144个氨基酸;kstD7位于基因簇核苷酸序列第27391?28233位,编码NAD(P)H:黄素氧化还原酶,长度为280个氨基酸;kstD8位于基因簇核苷酸序列第28260?29156位,编码单氧化酶,长度为298个氨基酸;kstD9位于基因簇核苷酸序列第32267?33358位,编码羧酸酯酶,长度为363个氨基酸;kstD10位于基因簇核苷酸序列第32267?33358位,编码第四环环化酶,长度为150个氨基酸;kstD11位于基因簇核苷酸序列第52203?51685位,编码脱氢酶,长度为172个氨基酸;kstD12位于基因簇核苷酸序列第54953?54498位,编码羟化酶,长度为151个氨基酸;kstD13位于基因簇核苷酸序列第60078?58579位,编码FAD依赖的或者包含BBE结构域的氧化还原酶,长度为499个氨基酸;kstD14位于基因簇核苷酸序列第60258?61118位,编码甲基转移酶,长度为286个氨基酸;2)非核糖体聚肽合成酶NRPS相关基因:kstB1,kstB2,kstE1,kstE2,kstE3,kstE4,kstE5,kstE6;共8个基因:kstB1位于基因簇核苷酸序列第9943?11505位,编码NRPS腺苷化酶,长度为520个氨基酸;kstB2位于基因簇核苷酸序列第11507?11770位,编码酰基载体蛋白,长度为87个氨基酸;kstE1位于基因簇核苷酸序列第13618?13992位,编码L?ectoine合成酶,长度为124个氨基酸;kstE2位于基因簇核苷酸序列第14017?15156位,编码酰基辅酶A脱氢酶,长度为379个氨基酸;kstE3位于基因簇核苷酸序列第55079?55924位,编码羟化酶,长度为281个氨基酸;kstE4位于基因簇核苷酸序列第58555?57470位,编码双氧化酶,长度为361个氨基酸;kstE5位于基因簇核苷酸序列第61163?61852位,编码氨基转移酶,长度为229个氨基酸;kstE6位于基因簇核苷酸序列第63435?64280位,编码脱甲酰酶,长度为281个氨基酸;3)乙酰化的糖基合成相关基因:kstC1,kstC2,kstC3,kstC4,kstC5,kstC6,kstC7,kstC8,kstC9;共9个基因:kstC1位于基因簇核苷酸序列第19574?18678位,编码dTDP?葡萄糖合成酶,长度为298个氨基酸;kstC2位于基因簇核苷酸序列第19786?20775位,编码dTDP?葡萄糖?4,6?脱水酶,长度为329个氨基酸;kstC3位于基因簇核苷酸序列第37944?37360位,编码3,5?表异构酶,长度为194个氨基酸;kstC4位于基因簇核苷酸序列第38165?39175位,编码糖基转移酶辅助蛋白,长度为336个氨基酸;kstC5位于基因簇核苷酸序列第39198?40496位,编码糖基转移酶,长度为432个氨基酸;kstC6位于基因簇核苷酸序列第40496?41992位,编码2,3?己糖脱水酶,长度为498个氨基酸;kstC7位...

【技术特征摘要】
1.一种越野他汀的生物合成基因簇,其特征在于,所述基因簇包括编码越野他汀生物合成所涉及的55个基因,具体为:1)II 型聚酮合成酶 PKS 相关基因:kstAl, kstA2, kstA3, kstDl, kstD2, kstD3, kstD4,kstD5, kstD6, kstD7, kstD8, kstD9, kstDIO, kstDll, kstD12, kstD13, kstD14 ;共 17 个基因: kstAl位于基因簇核苷酸序列第9943-11505位,编码腺苷酰化酶,长度为422个氨基酸; kstA2位于基因簇核苷酸序列第11507-11770位,编码肽酰载体蛋白(PCP),长度为402个氨基酸; kstA3位于基因簇核苷酸序列第26548-26805位,编码酰基载体蛋白,长度为85个氨基酸; kstDl位于基因簇核苷酸序列第9140-9946位,编码2,3-环环化酶,长度为268个氨基酸; kstD2位于基因簇核苷酸序列第20823-216026位,编码酮基还原酶,长度为259个氨基酸; kstD3位于基因簇核苷酸序列第22658-21699位,编码芳香化酶,长度为319个氨基酸; kstD4位于基因簇核苷酸序列第23481-22696位,编码C-9位酮基还原酶,长度为261个氨基酸; kstD5位于基因簇核苷酸序列第23591-24049位,编码单氧化酶,长度为152个氨基酸; kstD6位于基因簇核苷酸序列第26861-27295位,编码第四环环化酶,长度为144个氨基酸; kstD7位于基因簇核苷酸序列第27391-28233位,编码NAD⑵H:黄素氧化还原酶,长度为280个氨基酸; kstD8位于基因簇核苷酸序列第28260-29156位,编码单氧化酶,长度为298个氨基酸; kstD9位于基因簇核苷酸序列第32267-33358位,编码羧酸酯酶,长度为363个氨基酸; kstDIO位于基因簇核苷酸序列第32267-33358位,编码第四环环化酶,长度为150个氨基酸; kstDll位于基因簇核苷酸序列第52203-51685位,编码脱氢酶,长度为172个氨基酸;kstD12位于基因簇核苷酸序列第54953-54498位,编码羟化酶,长度为151个氨基酸;kstD13位于基因簇核苷酸序列第60078-58579位,编码FAD依赖的或者包含BBE结构域的氧化还原酶,长度为499个氨基酸; kstD14位于基因簇核苷酸序列第60258-61118位,编码甲基转移酶,长度为286个氨基酸; 2)非核糖体聚妝合成酶NRPS 相关基因:kstBl, kstB2, kstEl, kstE2, kstE3, kstE4,kstE5, kstE6 ;共 8 个基因:kstBl位于基因簇核苷酸序列第9943-11505位,编码NRPS腺苷化酶,长度为520个氨基酸; kstB2位于基因簇核苷酸序列第11507-11770位,编码酰基载体蛋白,长度为87个氨基酸; kstEl位于基因簇核苷酸序列第13618-13992位,编码L-ectoine合成酶,长度为124个氨基酸; kstE2位于基因簇核苷酸序列第14017-15156位,编码酰基辅酶A脱氢酶,长度为379个氨基酸; kstE3位于基因簇核苷酸序列第55079-55924位,编码羟化酶,长度为281个氨基酸; kstE4位于基因簇核苷酸序列第58555-57470位,编码双氧化酶,长度为361个氨基酸; kstE5位于基因簇核苷酸序列第61163-61852位,编码氨基转移酶,长度为229个氨基酸; kstE6位于基因簇核苷酸序列第63435-64280位,编码脱甲酰酶,长度为281个氨基酸; 3)乙酸化的糖基合成相关基因:kstCl,kstC2, kstC3, kstC4, kstC5, kstC6, kstC7,kstC8, kstC9 ;共 9 个基因: kstCl位于基因簇核苷酸序列第19574-18678位,编码dTDP-葡萄糖合成酶,长度为298个氨基酸; kstC2位于基因簇核苷酸序列第19786-20775位,编码dTDP-葡萄糖-4,6-脱水酶,长度为329个氨基酸; kstC3位于基因簇核苷酸序列第37944-37360位,编码3,5-表异构酶,长度为194个氨基酸; kstC4位于基因簇核苷酸序列第38165-39175位,编码糖基转移酶辅助蛋白,长度为336个氨基酸; kstC5位于基因簇核苷酸序列第39198-40496位,编码糖基转移酶,长度为432个氨基酸; kstC6位于基因簇核苷酸序列第40496-41992位,编码2,3-己糖脱水酶,长度为498个氨基酸; kstC7位于基因簇核苷酸序列第41989-43014位,编码丙酮酸脱氢酶α亚基,长度为341个氨基酸; kstC8位于基因簇核苷酸序列第43031-44068位,编码丙酮酸脱氢酶β亚基,长度为345个氨基酸; kstC9位于基因簇核苷酸序列第53344-52361位,编码己糖_3_酮基还原酶,长度为327个氨基酸; 4)负责吡咯吡咯二并环形成的后修饰基因:kstFl,kstF2,kstF3,kstF4,kstF5,kstF6 ;共6个基因: kstFl位于基因簇核苷酸序列第11773-12807位,编码邻氨基苯甲酸磷酸核糖转移酶,长度为344个氨基酸;kstF2位于基因簇核苷酸序列第12800-13621位,编码色氨酸合成酶α亚基,长度为273个氨基酸; kstF3位于基因簇核苷酸序列第15160-15855位,编码邻氨基苯...

【专利技术属性】
技术研发人员:唐功利马宏敏周强张转
申请(专利权)人:中国科学院上海有机化学研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1