【技术实现步骤摘要】
预测结果的生成方法、装置、设备、存储介质及程序产品
[0001]本申请涉及生物信息
,特别涉及一种预测结果的生成方法、装置、设备、存储介质及程序产品。
技术介绍
[0002]基于基因片段序列信息的研究可以分为基于统计学习的研究方法和基于机器学习的研究方法,由于对基因片段序列信息的深入研究,设计多种多样的研究任务。
[0003]相关技术中,通过采用基于非预训练深度学习的研究方法,针对不同的任务设计训练不同的深度学习模型。
[0004]然而,上述需要针对不同的任务类型特别设计对应的模型,模型对于任务的泛化性较差,预测效率较低。
技术实现思路
[0005]本申请实施例提供了一种预测结果的生成方法、装置、设备、存储介质及程序产品,能够提高模型的任务泛化性。所述技术方案如下。
[0006]一方面,提供了一种预测结果的生成方法,所述方法包括:
[0007]获取基因片段序列和任务指令,所述基因片段序列包括蛋白组片段序列和转录组片段序列中的至少一种,所述任务指令用于指示多种预测任务类型中的至少一种;
[0008]对所述基因片段序列和所述任务指令进行编码融合,得到第一编码序列,所述第一编码序列中包括所述基因片段序列对应的基因编码序列,以及所述任务指令对应的任务编码序列;
[0009]通过预先训练的基因语言模型对所述第一编码序列进行预测,得到预测结果,所述基因语言模型用于生成与所述任务指令中的至少一种预测任务类型对应的预测结果;
[0010]对所述预测结果进行 ...
【技术保护点】
【技术特征摘要】
1.一种预测结果的生成方法,其特征在于,所述方法包括:获取基因片段序列和任务指令,所述基因片段序列包括蛋白组片段序列和转录组片段序列中的至少一种,所述任务指令用于指示多种预测任务类型中的至少一种;对所述基因片段序列和所述任务指令进行编码融合,得到第一编码序列,所述第一编码序列中包括所述基因片段序列对应的基因编码序列,以及所述任务指令对应的任务编码序列;通过预先训练的基因语言模型对所述第一编码序列进行预测,得到预测结果,所述基因语言模型用于生成与所述任务指令中的至少一种预测任务类型对应的预测结果;对所述预测结果进行解码,得到目标结果,所述目标结果是按所述至少一种预测任务类型对所述基因片段序列进行预测得到的结果。2.根据权利要求1所述的方法,其特征在于,所述通过预先训练的基因语言模型对所述第一编码序列进行预测,得到预测结果,包括:将所述第一编码序列输入所述基因语言模型,通过迭代输出得到所述预测结果,其中,所述基因语言模型基于所述第一编码序列和前i个输出结果生成第i+1个输出结果,直到所述第i+1个输出结果符合预设的终止结果停止输出,i为正整数。3.根据权利要求1所述的方法,其特征在于,所述对所述基因片段序列和所述任务指令进行编码融合,得到第一编码序列,包括:按照预设的片段长度对所述基因片段序列进行片段划分,得到多个单位基因片段序列,所述片段长度用于指示所述单位基因片段序列中的碱基数量;对所述多个单位基因片段序列和所述任务指令进行编码融合,得到所述第一编码序列,所述第一编码序列中包括所述多个单位基因片段序列对应的多个单位基因编码序列,以及所述任务指令对应的任务编码序列。4.根据权利要求3所述的方法,其特征在于,所述对所述多个单位基因片段序列和所述任务指令进行编码融合,得到所述第一编码序列,包括:获取预设的基因编码映射表,所述基因编码映射表中包括所述蛋白组片段序列与基因编码序列之间的对应关系,以及所述转录组片段序列与基因编码序列之间的对应关系;基于所述基因编码映射表对所述多个单位基因片段序列进行编码,得到所述多个单位基因编码序列;获取预设的任务编码映射表,所述任务编码映射表中包括不同预测任务类型的任务指令与任务编码序列之间的对应关系;基于所述任务编码映射表对所述任务指令进行编码,得到所述任务编码序列;对所述多个单位基因编码序列和所述任务编码序列进行融合,得到所述第一编码序列。5.根据权利要求1至4任一所述的方法,其特征在于,所述通过预先训练的基因语言模型对所述第一编码序列进行预测,得到预测结果之前,还包括:获取样本基因片段序列、样本任务指令和预设的任务结果;对所述样本基因片段序列、所述样本任务指令和预设的任务结果进行编码融合,得到样本编码序列,所述样本编码序列中包括所述样本基因片段序列对应的多个样本基因编码序列、所述样本任务指令对应的样本任务编码序列,以及所述预设的任务结果对应的任务
结果编码;通过候选基因语言模型基于第j个样本基因编码序列,生成第j...
【专利技术属性】
技术研发人员:秦陈陈,张道安,姚建华,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。