肠道菌群移植的群组配型方法、系统、设备及存储介质技术方案

技术编号:33344548 阅读:14 留言:0更新日期:2022-05-08 09:36
本发明专利技术涉及肠道菌群移植技术领域,公开了一种肠道菌群移植的群组配型方法、系统、设备及存储介质,所述方法包括:获取肠道菌群的数据样本集;所述数据样本集包括待配型的受体和供体数据;对所述数据样本集进行聚类分析,得到若干菌群聚类簇;从每个菌群聚类簇内选择若干受体,并计算距离若干所述受体最近的供体,组成受体和供体的配型对。本发明专利技术无需标注训练数据,大大节约了成本,而且通过聚类方法能够得到形状不规则的聚类簇,不需要事先给定聚类簇数量,方便快捷,而且通过簇内计算,能够大大提高配型效率。提高配型效率。提高配型效率。

【技术实现步骤摘要】
肠道菌群移植的群组配型方法、系统、设备及存储介质


[0001]本专利技术涉及肠道菌群移植
,特别是涉及一种肠道菌群移植的群组配型方法、系统、计算机设备及可读存储介质。

技术介绍

[0002]粪菌移植(Human Microbiota Transplantation,HMT或FMT),又称为肠道菌群移植,其定义是健康人类粪便中的功能菌群,移植到患者胃肠道内,重新建立新的肠道菌群,实现肠道及肠道外疾病的治疗。
[0003]在进行肠道菌群移植时,需要对供体和受体的数据进行精准配型。目前的精准配型方法大都基于有监督学习(supervised learning),通过一定训练数据去训练生产AI匹配模型,然后通过AI匹配模型进行精准配型,然而,基于有监督学习的方法,为了生成AI匹配模型,需要大量的训练数据去训练,而训练数据有需要高水平和实践经验丰富的相关科研人员去标注,成本较高。并且目前的精准配型方法是单个受体跟所有供体进行匹配,效率低下。
[0004]因此,现有技术还有待进一步提升和改进。

技术实现思路

[0005]本专利技术要解决的技术问题是:通过无监督学习方法,克服现有有监督学习方法在肠道菌群移植的精准配型时因需人工标注所导致的成本较高、以及只能实现单个受体与供体间匹配的技术问题。
[0006]为了解决上述技术问题,第一方面,本专利技术提供了一种肠道菌群移植的群组配型方法,所述方法包括:
[0007]获取肠道菌群的数据样本集;所述数据样本集包括待配型的受体和供体数据;<br/>[0008]对所述数据样本集进行聚类分析,得到若干菌群聚类簇;
[0009]从每个菌群聚类簇内选择若干受体,并计算距离若干所述受体最近的供体,组成受体和供体的配型对。
[0010]进一步地,所述通过对所述数据样本集进行聚类分析,得到若干菌群聚类簇的步骤包括:
[0011]通过DBSCAN算法对所述数据样本集进行聚类分析,得到若干菌群聚类簇。
[0012]进一步地,所述通过DBSCAN算法对所述数据样本集进行聚类分析,得到若干菌群聚类簇的步骤包括:
[0013]确定所述数据样本集中每个数据点的EPS邻域;
[0014]统计每个数据点的EPS邻域内数据点数目,并将所述数据点数目超过密度阈值的数据点作为核心点;
[0015]将所述核心点中多个密度可达的核心点组成菌群聚类簇。
[0016]进一步地,所述从每个菌群聚类簇内选择若干受体,并计算距离至少一个所述受
体最近且等数量的供体的步骤包括:
[0017]在每个菌群聚类簇内,根据闵可夫斯基距离,计算若干所述受体距离最近的供体,组成若干一对一的配型对。
[0018]第二方面,本专利技术提供了一种肠道菌群移植的群组配型系统,所述系统包括:
[0019]数据采集模块,用于获取肠道菌群的数据样本集;所述数据样本集包括待配型的受体和供体数据;
[0020]聚类分析模块,用于对所述数据采集模块所获取的所述数据样本集进行聚类分析,得到若干菌群聚类簇;
[0021]群组配型模块,用于从每个菌群聚类簇内选择若干受体,并计算距离若干所述受体最近的供体,组成受体和供体的配型对。
[0022]进一步地,所述聚类分析模块采用DBSCAN算法对所述数据样本集进行聚类分析,得到若干菌群聚类簇。
[0023]进一步地,所述聚类分析模块包括:
[0024]邻域确定模块,用于确定所述数据样本集中每个数据点的EPS邻域;
[0025]筛选模块,用于统计每个数据点的EPS邻域内数据点数目,并将所述数据点数目超过密度阈值的数据点作为核心点;
[0026]聚类模块,用于将所述核心点中多个密度可达的核心点组成菌群聚类簇。
[0027]进一步地,所述群组配型模块还用于在每个菌群聚类簇内,根据闵可夫斯基距离,计算若干所述受体距离最近的供体,组成若干一对一的配型对。
[0028]第三方面,本专利技术提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
[0029]第四方面,本专利技术提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
[0030]本专利技术实施例一种肠道菌群移植的群组配型方法、系统、计算机设备及可读存储介质,通过采用无监督学习方法和DBSCAN基于密度的聚类方法,对菌群数据进行聚类分析,得到菌群聚类簇,通过菌群聚类内的距离计算,得到准确的配型对。与现有技术相比,其有益效果在于:无需标注训练数据,大大节约了成本,而且通过聚类方法能够得到形状不规则的聚类簇,不需要事先给定聚类簇数量,方便快捷,而且通过簇内计算,能够大大提高配型效率。
附图说明
[0031]图1是本专利技术实施例中肠道菌群移植的群组配型方法的应用场景示意图;
[0032]图2是本专利技术实施例中肠道菌群移植的群组配型方法的流程图;
[0033]图3是图2中步骤S200的具体流程图;
[0034]图4是本专利技术实施例中肠道菌群移植的群组配型系统的组成框图;
[0035]图5是图4中聚类分析模块的组成框图;
[0036]图6是本专利技术实施例中计算机设备的示意图。。
具体实施方式
[0037]为了使本申请的目的、技术方案和有益效果更加清楚明白,下面结合附图及实施例,对本专利技术作进一步详细说明,显然,以下所描述的实施例是本专利技术实施例的一部分,仅用于说明本专利技术,但不用来限制本专利技术的范围。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0038]本专利技术提供的肠道菌群移植的群组配型方法,可以应用于如图1所示的终端或服务器上。其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0039]在一个实施例中,如图2所示,本专利技术实施例优选实施例的一种肠道菌群移植的群组配型方法,所述方法包括步骤:
[0040]S100、获取肠道菌群的数据样本集;所述数据样本集包括待配型的受体和供体数据。
[0041]其中,为了实现对受体和供体的精准配型,本实施例首先获取肠道菌群,组成数据样本集,而为了减少疾病传播的风险,菌群需要严格筛选,必须排除任何可能通过菌群移植传播的疾病,尽量通过血清学以及粪便检测,筛查排除可能的感染源。
[0042]数据样本集可以通过现有肠道菌群数据库获取,也可以通过集中采样获取。当然,为了实现数据样本集的有效性,可以通过策略学习的神经网络模型,先对数据样本集进行学习训练,择优选择高效的样本数据,排除无效或低效样本,便于提升后续配型的精确度。
[0043]S200、对所述数据样本集进行聚类分析,得到若干菌群聚类簇。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种肠道菌群移植的群组配型方法,其特征在于,所述方法包括:获取肠道菌群的数据样本集;所述数据样本集包括待配型的受体和供体数据;对所述数据样本集进行聚类分析,得到若干菌群聚类簇;从每个菌群聚类簇内选择若干受体,并计算距离若干所述受体最近的供体,组成受体和供体的配型对。2.根据权利要求1所述的肠道菌群移植的群组配型方法,其特征在于,所述通过对所述数据样本集进行聚类分析,得到若干菌群聚类簇的步骤包括:通过DBSCAN算法对所述数据样本集进行聚类分析,得到若干菌群聚类簇。3.根据权利要求2所述的肠道菌群移植的群组配型方法,其特征在于,所述通过DBSCAN算法对所述数据样本集进行聚类分析,得到若干菌群聚类簇的步骤包括:确定所述数据样本集中每个数据点的EPS邻域;统计每个数据点的EPS邻域内数据点数目,并将所述数据点数目超过密度阈值的数据点作为核心点;将所述核心点中多个密度可达的核心点组成菌群聚类簇。4.根据权利要求1所述的肠道菌群移植的群组配型方法,其特征在于,所述从每个菌群聚类簇内选择若干受体,并计算距离至少一个所述受体最近且等数量的供体的步骤包括:在每个菌群聚类簇内,根据闵可夫斯基距离,计算若干所述受体距离最近的供体,组成若干一对一的配型对。5.一种肠道菌群移植的群组配型系统,其特征在于,所述系统包括:数据采集模块,用于获取肠道菌群的数据样本集;所述数据样本集包括待配型的受...

【专利技术属性】
技术研发人员:王科黄伟斌
申请(专利权)人:广州保量医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1