空间转录数据组织区域分析方法、系统、设备及存储介质技术方案

技术编号：38633517 阅读：14 留言：0更新日期：2023-08-31 18:31

本发明专利技术属于空间转录组测序技术领域，公开了一种空间转录数据组织区域分析方法、系统、设备及存储介质，包括获取空间转录组数据集以及组织图像，以及将组织图像进行图像区域分割得到区域掩码图像；根据空间转录组数据集、组织图像以及区域掩码图像，构建以空间转录组数据集中的spot为节点带权重的无向完全图；将无向完全图和空间转录组数据集中的基因表达矩阵输入预设的图卷积神经网络中，得到特征融合矩阵；以及将特征融合矩阵进行邻居特征聚合，得到空间转录组数据集中各spot的嵌入表示；根据各spot的嵌入表示进行各spot的聚合得到聚合结果。解决了空间转录组数据集信息利用不充分的问题以及提取图像特征不准确的问题，实现更高精度的组织区域分析。更高精度的组织区域分析。更高精度的组织区域分析。

全部详细技术资料下载

【技术实现步骤摘要】
空间转录数据组织区域分析方法、系统、设备及存储介质

[0001]本专利技术属于空间转录组测序
，涉及一种空间转录数据组织区域分析方法、系统、设备及存储介质。

技术介绍

[0002]传统的单细胞测序虽可以无偏定义细胞的类型和状态，但是却无法从组织中的生物分子和细胞中获取空间分布的信息，也无法深入了解不同细胞类型和细胞状态是如何在组织中分布，对理解单细胞相关功能和性状表现带来了巨大的挑战。伴随着高通量测序技术和测序精度的进步和发展，目前已经出现了可以捕捉组织空间位置特性的空间转录组测序技术。利用空间转录组测序技术可以从空间上探索组织分布，从而帮助研究人员更好地研究疾病病理等组织生理学过程，但是研究者感兴趣的组织区域和单细胞在图像中占比很小，区域识别和检测难度较大，如果直接完全地依赖人工标注成本高。如何结合图像信息和测序数据进行深度整合分析，进而自动地完成组织区域分割，还缺乏深入研究。
[0003]在空间转录组技术学技术出现之前，单细胞RNA测序(scRNA
‑
seq)是主流的技术。对于组织区域分割这个任务，常用的方法是以K
‑
means和Louvain为代表的传统聚类方法。这些方法直接将基因表达数据作为输入，从而将组织分割为不同的区域。尽管单细胞RNA测序已经使描述细胞类型和状态成为可能，并以前所未有的高分辨率研究细胞机制，但单细胞RNA测序无法获得细胞空间位置信息。由于算法本身以及单细胞RNA测序无法获得细胞空间信息的限制，上述算法在聚类过程中没有考虑细胞空间信息以及组...

【技术保护点】

【技术特征摘要】
1.一种空间转录数据组织区域分析方法，其特征在于，包括：获取空间转录组数据集以及组织图像，以及将组织图像进行图像区域分割得到区域掩码图像；根据空间转录组数据集、组织图像以及区域掩码图像，构建以空间转录组数据集中的spot为节点带权重的无向完全图；其中，无向完全图中节点之间的权重根据spot之间的距离计算得到；将无向完全图和空间转录组数据集中的基因表达矩阵输入预设的图卷积神经网络中，得到特征融合矩阵；以及将特征融合矩阵进行邻居特征聚合，得到空间转录组数据集中各spot的嵌入表示；根据各spot的嵌入表示进行各spot的聚合得到聚合结果。2.根据权利要求1所述的空间转录数据组织区域分析方法，其特征在于，所述根据空间转录组数据集、组织图像以及区域掩码图像，构建以空间转录组数据集中的spot为节点带权重的无向完全图前，还包括：将空间转录组数据集进行如下预处理：剔除在少于3个spot中有表达的基因，并通过下式对基因表达矩阵中的各基因表达值做归一化：其中，u
ij
为第i个spot中基因j的表达量，i＝1......N,j＝1......D，N为spot的数量，D为特异性分子标签的数量。3.根据权利要求1所述的空间转录数据组织区域分析方法，其特征在于，所述无向完全图中节点之间的权重通过如下方式得到：对于每个spot，以该spot为中心，裁取β
×
β像素值大小的组织图像，得到组织图像区域B
i
，并在相同位置的区域掩码图像中裁取β
×
β像素值大小的区域掩码图像区域M
i
，设定spot像素点所属的区域为k，根据区域掩码图像区域M
i
，通过下式优化组织图像区域B
i
，得到组织区域图像区域图像其中，M
i
＝＝k表示M
i
中的某一位置的值如果等于k，则对应位置为1，否则为0，该操作得到的矩阵形状与M
i
相同；表示对应位置元素相乘；对于组织区域图像计算组织区域图像中RGB三个通道的像素值均值(r
i
,g
i
,b
i
)，并通过下式得到第i个spot的添加值z
i
：其中，V
r
,V
g
,V
b
分别为所有spot在RGB三个通道均值的方差；通过下式对第i个spot的添加值z
i
进行尺度缩放，得到第i个spot的尺度缩放添加值
其中，μ
z
是所有spot的添加值的均值；σ
x
，σ
y
和σ
z
分别为所有spot的x，y和z的标准差；s为预设参数，表征添加值z在计算spot距离时的重要性；通过下式得到两个spot之间的距离：通过下式计算无向完全图中节点之间的权重：其中，w(i,j)为节点i和节点j之间的权重，l为超参数，用于控制相似度随着距离增大的衰减程度。4.根据权利要求1所述的空间转录数据组织区域分析...

【专利技术属性】
技术研发人员：付来义，丁益东，王莹，孙贺全，彭勤科，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人