信息处理程序制造技术

技术编号:39865672 阅读:13 留言:0更新日期:2023-12-30 12:56
信息处理装置针对表示同一氨基酸的碱基序列的不同的多个密码子,基于表示密码子文件上的多个密码子的位置的第1索引,运算表示密码子文件上的氨基酸的位置的第2索引

【技术实现步骤摘要】
【国外来华专利技术】信息处理程序、信息处理方法和信息处理装置


[0001]本专利技术涉及信息处理程序等


技术介绍

[0002]正在不断进行人类基因组的碱基序列的研究,已知构成人类基因组的蛋白质的种类是3万种

另一方面,认为微生物等的蛋白质的种类是无限的,从目标碱基序列中发现大量重复表达的特异性密码子序列

例如,重复表达的特异性密码子序列被称为结构域

基序等,研究明白该特异性密码子序列是重要的

[0003]结构域在蛋白质的序列

构造的一部分中相对于其他部分独立地进化,以承担功能的方式存在

基序的特征是具有对称性的密码子序列


17
是示出基序的一例的图

如图
17
所示,在基序中存在
β
发夹
1a、
希腊键
1b、
β

1c(
孔蛋白

脂质运载蛋白
)


折叠是如下的物理过程:蛋白质链通过迅速且具有再现性的方法获取其原本的三维构造,通常是生物学功能构象
(
立体构造
)。
[0004]例如,作为从碱基序列中检索基序的技术,存在将具有汉明距离的置换碱基序列作为关键字来检索基序的现有技术

此外,存在如下现有技术:从
DNA(deoxyribonucleic acid
:脱氧核糖核酸
)
序列的转录开始点的上游提取直向同源物候选的多个序列截面,对基序候选进行判定

[0005]现有技术文献
[0006]专利文献
[0007]专利文献1:国际公开第
2005/096208

[0008]专利文献2:国际公开第
2020/049748

[0009]专利文献3:日本特开
2014

112307
号公报

技术实现思路

[0010]专利技术要解决的问题
[0011]然而,在上述现有技术中,存在如下问题:无法高效地进行重复表达的密码子序列的搜索

[0012]这里,
DNA

RNA(ribonucleic acid
:核糖核酸
)
的碱基为4种,由“A”、“G”、“C”、“T”或“U”的记号表示

此外,3个碱基序列为一组而决定
20
种氨基酸

各个氨基酸由“A”~“Y”的记号表示


18
是示出氨基酸与碱基及密码子之间的关系的图
。1
组3个碱基序列被称为“密码子”。
通过各碱基排列而决定密码子,在决定了密码子时,氨基酸被决定

[0013]如图
18
所示,一个氨基酸对应多种密码子

例如,氨基酸“丙氨酸
(Ala)”与密码子“GCU”、“GCC”、“GCA”、“GCG”对应,密码子“GCU”、“GCC”、“GCA”、“GCG”实质上是同一密码子

然而,在现有技术中,无法应对该密码子的特性,无法高效地进行重复表达的密码子序列的搜索

[0014]在一个方面,目的在于,提供能够高效地进行重复表达的密码子序列的搜索的信
息处理程序

信息处理方法和信息处理装置

[0015]用于解决问题的手段
[0016]在第1方案中,使计算机执行如下处理

计算机针对表示同一氨基酸的碱基序列的不同的多个密码子,基于表示密码子文件上的多个密码子的位置的第1索引,运算表示密码子文件上的氨基酸的位置的第2索引

计算机基于第2索引,分别确定密码子文件中重复表达的氨基酸序列的位置

计算机确定与密码子文件中重复表达的各氨基酸序列的位置对应的各密码子序列,作为分别具有同源性的密码子序列

[0017]专利技术的效果
[0018]能够高效地进行重复表达的密码子序列的搜索

附图说明
[0019]图1是用于说明本实施例1的信息处理装置的处理的图
(1)。
[0020]图2是用于说明本实施例1的信息处理装置的处理的图
(2)。
[0021]图3是示出本实施例1的信息处理装置的结构的功能框图

[0022]图4是示出分数表的数据结构的一例的图

[0023]图5是示出密码子文件的数据结构的一例的图

[0024]图6是示出密码子转置索引的数据结构的一例的图

[0025]图7是示出氨基酸转置索引的数据结构的一例的图

[0026]图8是用于说明确定部的处理的图
(1)。
[0027]图9是用于说明确定部的处理的图
(2)。
[0028]图
10
是用于说明确定部的处理的图
(3)。
[0029]图
11
是用于说明确定部的处理的图
(4)。
[0030]图
12
是示出搜索结果信息的数据结构的一例的图

[0031]图
13
是示出本实施例1的信息处理装置的处理步骤的流程图

[0032]图
14
是用于说明本实施例2的信息处理装置的处理的图
(1)。
[0033]图
15
是用于说明本实施例2的信息处理装置的处理的图
(2)。
[0034]图
16
是示出实现与实施例的信息处理装置同样的功能的计算机的硬件结构的一例的图

[0035]图
17
是示出基序的一例的图

[0036]图
18
是示出氨基酸与碱基及密码子之间的关系的图

具体实施方式
[0037]下面,基于附图对本申请公开的信息处理程序

信息处理方法和信息处理装置的实施例详细进行说明

另外,本专利技术不被该实施例限定

[0038]实施例1[0039]对本实施例1的信息处理装置的处理的一例进行说明

图1及图2是用于说明本实施例1的信息处理装置的处理的图

[0040]对图1进行说明

信息处理装置以密码子为单位对包含碱基序列的信息的密码子文件
141
进行扫描,生成密码子转置索引
142。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.
一种信息处理程序,其特征在于,使计算机执行如下处理:针对表示同一氨基酸的碱基序列的不同的多个密码子,基于表示密码子文件上的所述多个密码子的位置的第1索引,运算表示所述密码子文件上的氨基酸的位置的第2索引,基于所述第2索引,分别确定所述密码子文件中重复表达的氨基酸序列的位置,确定与所述密码子文件中重复表达的各氨基酸序列的位置对应的各密码子序列,作为分别具有同源性的密码子序列
。2.
根据权利要求1所述的信息处理程序,其特征在于,进一步执行如下处理:基于定义了氨基酸彼此的同源性的程度的表,来评价所述密码子文件中重复表达的氨基酸序列是否是具有同源性的氨基酸
。3.
根据权利要求1所述的信息处理程序,其特征在于,进一步使计算机执行如下处理:针对所述密码子文件中重复表达的氨基酸序列,从所述密码子文件中确定氨基酸序列的排列顺序相反的对称的氨基酸序列,确定与确定出的对称的氨基酸序列的位置对应的各密码子序列
。4.
根据权利要求1所述的信息处理程序,其特征在于,在进行所述运算的处理中,通过执行与所述多个密码子对应的第1索引的位图的逻辑和,来运算与所述多个密码子对应的某一个氨基酸的第2索引的位图
。5.
一种信息处理方法,其是由计算机执行的信息处理方法,其特征在于,执行如下处理:针对表示同一氨基酸的碱基序列的不同的多个密码子,基于表示密码子文件上的所述多个密码子的位置的第1索引,运算表示所述密码子文件上的氨基酸的位置的第2索引,基于所述第2索引,分别确定所述密码子文件中重复表达的氨基酸序列的位置,确定与所述密码子文件中重复表达的各氨基酸序列的位置对应的各密码子序列,作为分别具有同源性的密码子序列
。6.
根据权利要求5所述的信息处理方法,其特征在于,进一步执行如下处理:基于定义了氨基酸彼此的同源性的程度的表,来评价所述密码子文件中重复表达的氨基酸...

【专利技术属性】
技术研发人员:片冈正弘永浦良平茂栉薰
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1