当前位置: 首页 > 专利查询>卢森堡大学专利>正文

改进的计算设备制造技术

技术编号:26348751 阅读:31 留言:0更新日期:2020-11-13 21:46
基因组信息,例如,DNA、RNA和蛋白质,携带了大量的敏感信息,这些敏感信息的泄露有损害个人和公司的隐私和/或商业利益的风险。本发明专利技术公开了一种装置、系统和方法,用于在整个基因组工作流程中,在测序仪生成敏感基因组信息的同时或之后保护所述敏感基因组信息。根据敏感度对原始基因组数据(“读段”)进行检测和分类。通过切除所述读段中敏感度较低或非敏感的部分中的检测到的敏感碱基或碱基对的编号和类型来对所述读段进行分解。在所述基因组工作流程中,较佳在可信执行环境(trusted execution environment,TEE)中在本地或以分布式的方式对被切除的信息进行处理,以提高安全性。

【技术实现步骤摘要】
【国外来华专利技术】改进的计算设备
本专利技术涉及一种改进的计算设备,系统以及方法。本专利技术尤其涉及,但并非仅仅涉及,一种基因组信息设备,系统以及基因组信息处理方法或过程。
技术介绍
基因组信息,如,DNA,RNA以及蛋白质,携带了大量的敏感信息,这些敏感信息的泄露会有危及个人和公司的隐私和/或商业利益的风险。基因组信息由测序仪从生物样本中生成,通常为未经过滤的连续碱基或碱基对的序列形式的原始基因组数据,在本领域称为读段,并因此将每个样本的敏感信息进行编码。例如,敏感信息包括:疾病相关基因,人种志分组以及其他有区别的物理属性。该敏感信息的泄露可以指示个人易感某种疾病,允许个人的重新识别,和/或泄露关于基因修饰的商业秘密。许多现有技术已经得到发展并改进,以优化基因组信息处理或降低公开和/或传播所包含的敏感信息的可能性。此处,专利技术人参考了以下现有技术:[AGM+90]StephenFAltschul,WarrenGish,WebbMiller,EugeneWMyers,andDavidJLipman.本地对齐检索基本工具。Jour本文档来自技高网...

【技术保护点】
1.一种计算设备,包括:/n至少一个数据收集装置,所述数据收集装置包括至少一个传感器,用于将基因组信息解读为至少一个任意长度的读段,其中,所述或每个读段包括碱基序列;/n至少一个数据处理装置,用于过滤每个读段,从而检测出所述序列中的一个或多个敏感碱基,所述或每个数据处理装置还用于从所述或每个过滤后的读段切除每个检测出的敏感碱基,以输出非敏感序列;以及/n至少一个数据存储装置,用于存储所述解读读取的基因组信息。/n

【技术特征摘要】
【国外来华专利技术】20170926 LU LU1004491.一种计算设备,包括:
至少一个数据收集装置,所述数据收集装置包括至少一个传感器,用于将基因组信息解读为至少一个任意长度的读段,其中,所述或每个读段包括碱基序列;
至少一个数据处理装置,用于过滤每个读段,从而检测出所述序列中的一个或多个敏感碱基,所述或每个数据处理装置还用于从所述或每个过滤后的读段切除每个检测出的敏感碱基,以输出非敏感序列;以及
至少一个数据存储装置,用于存储所述解读读取的基因组信息。


2.根据权利要求1所述的计算设备,其特征在于,所述数据收集装置还会通过将各部分与预定的碱基进行对比,以确定一个或多个所述部分中的基因组信息是否属于所述设定的敏感程度还是属于其他敏感程度。


3.根据权利要求1或2所述的计算设备,其特征在于,所述数据收集装置、所述或每个处理装置和所述或每个存储装置:
彼此相邻设置和/或设置在单个或共用的外罩内或设置在共用的基板或板上;或
彼此隔开设置和/或通过局域网连接。


4.根据权利要求1或3所述的计算设备,其特征在于,所述设备的一个或多个所述装置中实现可信执行环境(trustedexecutionenvironment,TEE),以处理基因组信息。


5.根据权利要求4所述的计算设备,其特征在于,所述至少一个传感器用于为所述TEE提供安全的通信通道。


6.根据权利要求1至5中任一项所述的计算设备,用于将所述基因组信息解读为包括超过1,000个碱基的长读段。


7.根据权利要求1至6中任一项所述的计算设备,体现为基因组信息测序仪。


8.一种系统,例如,基因组信息测序系统,包括:
数据收集装置,所述数据收集装置包括至少一个传感器,用于将基因组信息解读为至少一个任意长度的读段,其中,所述或每个读段包括碱基序列;
数据处理装置,用于过滤每个读段,从而检测出所述序列中的一个或多个敏感碱基,所述或每个数据处理装置还用于从所述或每个过滤后的读段切除每个检测出的敏感碱基,以输出非敏感序列;以及
至少一个数据存储装置,用于存储所述解读读取的基因组信息。


9.根据权利要求8所述的系统,其特征在于,所述数据收集装置、所述数据处理装置以及所述数据存储装置包括多个彼此隔开设置且分别连接到网络的计算设备。


10.一种基因组信息处理方法,包括以下步骤:
从包括至少一个传感器的至少一个数据收集装置中读取基因组信息,并将所述基因组信息解读为至少一个任意长度的读段,其中,所述或每个读段包括碱基序列;
利用至少一个数据处理装置根据每个读段的长度选择性地对所述读段执行过滤过程,以检测所述序列中一个或多个敏感碱基;
利用所述至少一个数据处理装置对每个过滤后的读段执行切除过程,以从其中切除每个检测到的敏感碱基,并输出非敏感序列;以及
将所述解读读取的基因组信息存储到至少一个数据存储装置。


11.根据权利要求10所述的方法,其特征在于,所述或每个长读段包括超过30个碱基。


12.根据权利要求10或11所述的方法,其特征在于,所述方法还包括以下步骤:将所述或每个序列拆分成多个数据集,其中,至少一个数据集包括每个非敏感碱基,且至少一个数据集包括每个检测到的敏感碱基以及每个被切除的碱基在所述序列中的位置。


13.根据权利要求10至12中任一项所述的方法,其特征在于,在执行所述切除过程的步骤中,将所述序列拆分为非敏感程度和至少一个敏感程度。


14.根据权利要求12或13所述的方法,其特征在于,所述执行所述切除过程的步骤还包括:利用字符“N”替换一个或多个检测到的敏感碱基,有利于根据FASTA及FASTQ文件格式表示任何核苷酸。


15.根据权利要求12至14中任一项所述的方法,其特征在于,所述执行所述切除过程的步骤还包括:利用字符“@”替换一个或多个检测到的敏感碱基,有利...

【专利技术属性】
技术研发人员:杰里米·德古尚保罗·艾斯提维斯瓦里西莫玛利亚·佛南德斯马库斯·沃尔普
申请(专利权)人:卢森堡大学
类型:发明
国别省市:卢森堡;LU

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1