用于自动注释和筛选生物序列的系统和方法技术方案

技术编号:20759675 阅读:20 留言:0更新日期:2019-04-03 13:11
本公开内容描述了用于基于团体知识和参与的有效生物安全的软件工具。本文描述的注释工具为合成生物学团体跟踪关于个体蛋白质与负面后果之间的联系的新兴科学提供了帮助。本文描述的筛选工具使得团体能够拓宽对生物安全性的兴趣和有效实践,从而使从业者和生物序列或构建体提供者有能力评估订单请求的安全性,而不用等到合成或甚至表达。此外,本文描述的筛选工具能够筛选同一订单或多个订单中的多核苷酸中与来自参考数据库的有害生物序列相关的序列。

【技术实现步骤摘要】
【国外来华专利技术】用于自动注释和筛选生物序列的系统和方法交叉引用本申请要求于2016年6月10日提交的美国临时专利申请号62/348,786和于2016年8月16日提交的美国临时专利申请号62/375,858的权益,以上专利申请中的每一个通过引用以其全文并入。
技术介绍
我们关于能够对公共安全和/或环境构成潜在威胁的个体蛋白质和生物系统的总体知识正在非常快速地增长。然而,该知识广泛分布在不同的研究团体、机构、甚至期刊上。而对于给定蛋白质,缺乏专注于对其造成危害的可能性以及在何种情景下可能产生这种危害进行注释的集中信息源。因此,需要新的系统和方法来应对这一挑战。
技术实现思路
本文提供了用于提供增强的多核苷酸合成的计算机化系统,其包含用于托管数据库的服务器,其中所述数据库适于表示有害生物序列的列表;网络连接;以及包含用于通用计算机的指令的计算机可读介质,其中所述计算机化系统被配置用于以包括以下步骤的方法操作:1)接收一个或多个设计指令,其中所述设计指令包含多个生物序列,其中每个所述生物序列的长度不超过500个碱基,并且其中所述多个生物序列包括核酸或氨基酸序列;2)自动确定所述多个生物序列中的至少两个生物序列是否共同对应于所述数据库中的有害生物序列的至少20%;以及3)如果检测到所述有害生物序列的至少20%,则自动生成警报。本文进一步提供了这样的计算机化系统,其进一步包括其中如果没有生成警报,则合成一个或多个序列。本文进一步提供了这样的计算机化系统,其进一步包括接收关于改变所述多个生物序列中对应于所述有害生物序列的至少20%的所述至少两个生物序列以去除所述有害生物序列的指令。本文进一步提供了这样的计算机化系统,其中在一个或多个时间点接收所述多个接收的设计指令。本文进一步提供了这样的计算机化系统,其中所述多个接收的设计指令来自3个或更多个不同的来源。本文进一步提供了这样的计算机化系统,其中所述多个接收的设计指令来自5个或更多个不同的来源。本文进一步提供了这样的计算机化系统,其中所述多个接收的设计指令来自10个或更多个不同的来源。本文进一步提供了这样的计算机化系统,其中所述一个或多个生物序列的长度均不超过200个碱基。本文进一步提供了这样的计算机化系统,其中所述一个或多个生物序列的长度均不超过100个碱基。本文进一步提供了这样的计算机化系统,其中所述一个或多个生物序列的长度均不超过50个碱基。本文进一步提供了这样的计算机化系统,其中所述一个或多个生物序列的长度均不超过20个碱基。本文提供了用于提供增强的多核苷酸合成的方法,其包括:1)接收一个或多个设计指令,其中所述设计指令包含多个生物序列,其中每个所述生物序列的长度不超过500个碱基,并且其中所述多个生物序列包括核酸或氨基酸序列;2)自动确定所述多个生物序列中的至少两个生物序列是否共同对应于数据库中的有害生物序列的至少20%;以及3)如果检测到所述有害生物序列的至少20%,则自动生成警报。本文进一步提供了这样的方法,其进一步包括其中如果没有生成警报,则合成所述一个或多个序列。本文进一步提供了这样的方法,其进一步包括接收关于改变所述多个生物序列中对应于所述有害生物序列的至少20%的至少两个生物序列以去除有害生物序列的指令。本文提供了用于提供增强的多核苷酸合成的计算机化系统,其包含用于托管数据库的服务器,其中所述数据库适于表示序列列表;网络连接;以及包含用于通用计算机的指令的计算机可读介质,其中所述计算机化系统被配置用于以包括以下步骤的方法操作:1)接收一个或多个设计指令,其中所述设计指令包含多个生物序列,其中所述多个生物序列是载体序列和多个另外的插入序列;2)自动确定所述多个插入序列中的至少一个和所述载体是否共同对应于所述数据库中的有害生物序列的至少20%;以及3)如果检测到所述有害生物序列的至少20%,则自动生成警报。本文进一步提供了这样的计算机化系统,其中所述生物序列获自对实体核酸样品进行测序。本文进一步提供了这样的计算机化系统,其进一步包括其中如果没有生成警报,则合成所述一个或多个生物序列。本文进一步提供了这样的计算机化系统,其进一步包括接收关于改变对应于所述有害生物序列的至少20%的所述多个插入序列中的所述至少一个和所述载体以去除所述有害生物序列的指令。本文进一步提供了用于提供增强的多核苷酸合成的计算机化系统,其中在一个或多个时间点接收所述多个接收的设计指令。本文进一步提供了这样的计算机化系统,其中从不同的来源接收所述多个接收的设计指令。本文进一步提供了这样的计算机化系统,其中所述多个接收的设计指令来自3个或更多个不同的来源。本文进一步提供了这样的计算机化系统,其中所述多个接收的设计指令来自5个或更多个不同的来源。本文进一步提供了这样的计算机化系统,其中所述多个接收的设计指令来自10个或更多个不同的来源。本文进一步提供了这样的计算机化系统,其中所述一个或多个生物序列的长度均不超过200个碱基。本文进一步提供了这样的计算机化系统,其中所述一个或多个生物序列的长度均不超过100个碱基。本文进一步提供了这样的计算机化系统,其中所述一个或多个生物序列的长度均不超过50个碱基。本文进一步提供了这样的计算机化系统,其中所述一个或多个生物序列的长度均不超过20个碱基。本文提供了用于提供增强的多核苷酸合成的方法,其包括:1)接收一个或多个设计指令,其中所述设计指令包含多个生物序列,其中所述多个生物序列是载体序列以及多个另外的插入序列;2)自动确定所述多个插入序列中的至少一个和所述载体是否共同对应于数据库中的有害生物序列的至少20%;以及3)如果检测到所述有害生物序列的至少20%,则自动生成警报。本文进一步提供了这样的方法,其中所述生物序列获自对实体核酸或蛋白质样品进行测序。本文进一步提供了这样的方法,其进一步包括其中如果没有生成警报,则合成一个或多个生物序列。本文进一步提供了这样的方法,其接收关于改变对应于所述有害生物序列的至少20%的所述多个插入序列中的所述至少一个和所述载体以去除所述有害生物序列的指令。援引并入本说明书中所提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同特别地且单独地指出每个单独的出版物、专利或专利申请通过引用以其全文并入。附图说明在所附权利要求书中具体阐述了本公开内容的技术特征。通过参考以下对利用本公开内容原理的说明性实施方案加以阐述的详细描述和附图,将会获得对本公开内容的特征和优点的更好的理解,在这些附图中:图1图示了用户界面,其包括蛋白质序列和相关物种、宿主、病原体、危害途径、后果和蛋白质类型信息。还包括序列登录号、相同蛋白质的列表、指向具有序列记录的数据库的链接以及指向类似蛋白质的链接。图2图示了用户界面,其包括蛋白质变体和示例性蛋白质“血凝素神经氨酸酶-新城疫病毒”的部分列表。图3A描绘了流程图,其包括来自查询文件、蛋白质数据库、blast报告、受限列表(有害序列列表)和筛选报告的信息。图3B描绘了流程图,其包括各种形式的输入(核酸物质、核酸或蛋白质序列)、判定(受限列表、非受限列表、专家审查)和输出(发出警报)。图4图示了用户界面,其包括用于在筛选中搜索的数据库列表。包括角色(role)、类型、名称、描述、添加日期和活动状态列。图5图示本文档来自技高网...

【技术保护点】
1.一种用于提供增强的多核苷酸合成的计算机化系统:a)用于托管数据库的服务器,其中所述数据库适于表示有害生物序列的列表;b)网络连接;以及c)包含用于通用计算机的指令的计算机可读介质,其中所述计算机化系统被配置用于以包括以下步骤的方法操作:i)接收一个或多个设计指令,其中所述设计指令包含多个生物序列,其中每个所述生物序列的长度不超过500个碱基,并且其中所述多个生物序列包括核酸或氨基酸序列;ii)自动确定所述多个生物序列中的至少两个生物序列是否共同对应于所述数据库中的有害生物序列的至少20%;以及iii)如果检测到所述有害生物序列的至少20%,则自动生成警报。

【技术特征摘要】
【国外来华专利技术】2016.06.10 US 62/348,786;2016.08.16 US 62/375,8581.一种用于提供增强的多核苷酸合成的计算机化系统:a)用于托管数据库的服务器,其中所述数据库适于表示有害生物序列的列表;b)网络连接;以及c)包含用于通用计算机的指令的计算机可读介质,其中所述计算机化系统被配置用于以包括以下步骤的方法操作:i)接收一个或多个设计指令,其中所述设计指令包含多个生物序列,其中每个所述生物序列的长度不超过500个碱基,并且其中所述多个生物序列包括核酸或氨基酸序列;ii)自动确定所述多个生物序列中的至少两个生物序列是否共同对应于所述数据库中的有害生物序列的至少20%;以及iii)如果检测到所述有害生物序列的至少20%,则自动生成警报。2.根据权利要求1所述的系统,其进一步包括其中如果没有生成警报,则合成一个或多个序列。3.根据权利要求1所述的系统,其进一步包括接收关于改变所述多个生物序列中对应于所述有害生物序列的至少20%的所述至少两个生物序列以去除所述有害生物序列的指令。4.根据权利要求1或3所述的系统,其中在一个或多个时间点接收所述多个接收的设计指令。5.根据权利要求1至4中任一项所述的系统,其中所述多个接收的设计指令来自不同的来源。6.根据权利要求5所述的系统,其中所述多个接收的设计指令来自3个或更多个不同的来源。7.根据权利要求5所述的系统,其中所述多个接收的设计指令来自5个或更多个不同的来源。8.根据权利要求5所述的系统,其中所述多个接收的设计指令来自10个或更多个不同的来源。9.根据权利要求1至8中任一项所述的系统,其中所述一个或多个生物序列的长度均不超过200个碱基。10.根据权利要求9所述的系统,其中所述一个或多个生物序列的长度均不超过100个碱基。11.根据权利要求9所述的系统,其中所述一个或多个生物序列的长度均不超过50个碱基。12.根据权利要求9所述的系统,其中所述一个或多个生物序列的长度均不超过20个碱基。13.一种用于提供增强的多核苷酸合成的方法,其包括:a)接收一个或多个设计指令,其中所述设计指令包含多个生物序列,其中每个所述生物序列的长度不超过500个碱基,并且其中所述多个生物序列包括核酸或氨基酸序列;b)自动确定所述多个生物序列中的至少两个生物序列是否共同对应于数据库中的有害生物序列的至少20%;以及c)如果检测到所述有害生物序列的至少20%,则自动生成警报。14.根据权利要求13所述的方法,其进一步包括其中如果没有生成警报,则合成所述一个或多个序列。15.根据权利要求13所述的方法,其进一步包括接收关于改变所述多个生物序列中对应于所述有害生物序...

【专利技术属性】
技术研发人员:詹姆斯·迪甘斯
申请(专利权)人:特韦斯特生物科学公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1