当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于评分机制与LightGBM的CircRNA功能预测方法技术

技术编号：27747412 阅读：35 留言：0更新日期：2021-03-19 13:42

为克服现有技术的不足，本发明专利技术的目的在于利用评分机制结合LightGBM方法对circRNA的功能进行预测。本发明专利技术为解决其问题所采用的技术方案主要步骤是：(1)将大数据样本的circRNA以(.bed)文件形式输入。(2)将circRNA(.bed)文件映射到全人类基因组(hg19版本)上，得到circRNA序列信息(.fasta)文件。(3)提出了一种特征融合算法，对CircRNA特征进行融合。(4)将特征输入至A类判决系统，将编码蛋白型circRNA区分出来。(5)其它CircRNA分别经过三个模型，依照顺序判别CircRNA各项功能，得到预测概率值。(6)根据评分机制，将上述所得到的三个预测概率值，通过B类判决系统，得到最终的circRNA功能分类预测结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于评分机制与LightGBM的CircRNA功能预测方法
本专利技术涉及生物信息学
，特别是涉及CircRNA功能预测的领域。
技术介绍
CircRNA在生物学中具有多种功能，如富含miRNA结合位点，在细胞中起到了海绵体的作用；通过与蛋白质结合来调控蛋白质的活性；有些CircRNA甚至可以被翻译成蛋白质。因此它也成为了近年来比较重要的潜在生物标记物，而对于其功能的识别是一件繁琐的事情，传统方法常利用实验法根据CircRNA已存在的多种功能对新CircRNA的功能进行一一检验，这种方法费时费力，并且对于大批量的CircRNA功能识别十分困难。目前暂未有任何一种方法来提前预测CircRNA的功能，从而针对性地检验其某种功能，进而分析它在临床医学中的具体作用。
技术实现思路
为克服现有技术的不足，本专利技术的目的在于利用评分机制结合LightGBM方法对CircRNA的功能进行预测。它充分利用已发现的CircRNA各种功能的大数据信息，从机器学习的方法训练出模型，利用模型，可实现只需要简便输入需要进行功能预测的DNA或RNA相关序列，就可以预测出CircRNA具有哪一种具体的功能，经实验验证准确率高达85％以上，极大地省去了对新发现的CircRNA的所有功能—检验所浪费的实验时间和器材损耗的经济成本，能对实验项目的进行起到事半功倍的效果。本专利技术为解决其问题所采用的技术方案主要步骤是：S1.将大数据样本的CircRNA以(.bed)文件形式输入，其中包含染色体号、序列起始...

【技术保护点】
1.一种基于评分机制与LightGBM的CircRNA功能预测方法，其特征在于：/n此种方法包括了LightGBM算法和评分机制，并且首次提出利用机器学习的方法，将circRNA在生物体内所表达的功能进行分类预测，利用了lightGBM算法并与评分机制相结合对经多特征融合方法处理的原始实验验证的大数据样本进行训练，最终将得到的模型用于后续新的circRNA的功能预测。/n

【技术特征摘要】
1.一种基于评分机制与LightGBM的CircRNA功能预测方法，其特征在于：
此种方法包括了LightGBM算法和评分机制，并且首次提出利用机器学习的方法，将circRNA在生物体内所表达的功能进行分类预测，利用了lightGBM算法并与评分机制相结合对经多特征融合方法处理的原始实验验证的大数据样本进行训练，最终将得到的模型用于后续新的circRNA的功能预测。

2.根据权利要求1所述的一种基于评分机制与LightGBM的CircRNA功能预测方法，其特征在于，包括以下步骤：
S1.将大数据样本的circRNA以(.bed)文件形式输入，其中包含染色体号、序列起始位点、正负链标记。
S2.将circRNA(.bed)文件根据起始位点等相关信息映射到全人类基因组(hg19版本)上。得到具体的circRNA序列信息(.fasta)文件。
S3.提出了一种特征融合算法，用于根据circRNA所表达的具体功能作为特征标签，并且提取相应功...

【专利技术属性】
技术研发人员：邓怡云，王高平，戴宪华，
申请(专利权)人：中山大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人

相关技术

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术