文献追踪 |6 种空间转录组学(sST)方法大揭秘:空间转录组学的深度对比与评估

一
背景介绍
该研究选用小鼠胚胎眼睛、大脑海马区和嗅球等参考组织,对6种sST方法进行系统比较,生成跨平台数据cadasSTre,评估各技术性能,并更新scPipe处理sST数据。研究发现,不同sST技术在下游应用表现不同,还存在基因检测偏差。如分子捕获效率上,Slide-seq V2在控制测序深度后敏感性高,DBiT-seq较低;分子扩散受组织类型影响大;聚类分析中,Slide-seq V2和Stereo-seq识别细胞子集能力较强,BMKMANU S1000和Visium存在局限。
此研究为研究人员选择sST方法提供参考,构建了未来基准测试框架,推动评估标准标准化,对空间转录组学发展意义重大。

二
思路亮点
-
研究思路:

-
文章亮点:
1.多方法系统比较:首次对 6 种基于测序的空间转录组学(sST)方法进行系统比较,涵盖微阵列、基于珠子、基于 polony 或纳米球、微流控等多种技术类型,为全面评估 sST 技术提供依据。
2.构建评估框架:建立 cadasSTre 跨平台数据集,基于此评估各技术在空间分辨率、捕获效率、分子扩散等方面的性能,还更新 scPipe 对 sST 数据进行预处理和下采样,为技术评估提供统一框架。
3.明确关键影响因素:揭示分子扩散是影响实际分辨率的关键因素,且在不同方法和组织间存在差异,组织类型对扩散过程影响显著,为理解 sST 技术性能提供新视角。
4.剖析技术差异:发现不同 sST 技术在下游应用(聚类、区域注释和细胞间通讯分析)中能力不同,还存在基因检测偏差,如 Slide-seq V2 在控制测序深度后敏感性较高,Visium 存在基因捕获偏差等,为技术选择提供参考。
5.推动领域发展:研究成果有助于生物学家选择合适的 sST 平台,促进评估标准统一,为空间转录组学计算工具评估提供基础,推动该领域的发展。

图 1 展示了实验设计和数据处理流程。
a)选用成年小鼠海马体、E12.5 小鼠眼睛和成年小鼠嗅球作为参考组织,运用基于不同空间索引策略的空间转录组学(sST)技术(如基于微阵列、珠子、polony 或纳米球、微流体的方法)对其进行检测,并开展单细胞核 RNA 测序(snRNA-seq)。获取的 cadasSTre 数据集经一系列处理,包括生成空间条形码、保留特定区域读数、下采样、生成计数矩阵,以及进行细胞状态注释和细胞间通讯分析。
b)呈现各平台为参考组织生成数据集的总计数在空间维度的可视化结果,标注了各 sST 方法的点中心距离,反映平台物理分辨率,不同方法在捕获组织范围和形态上存在差异。
三
成果展示
基于测序的空间转录组学(sST)技术可在保留组织空间信息的同时进行转录组分析,但目前缺乏对不同平台的全面评估,也未建立统一的评价标准。本研究旨在通过对 6 种 sST 方法的系统比较,为该领域提供基准数据和指导。
-
实验设计
参考组织选择:选取成年小鼠大脑、E12.5 小鼠胚胎和成年小鼠嗅球作为参考组织,因其形态特征明确、基因表达异质,有助于评估方法性能。


H&E 染色图
实验技术:对比基于不同空间索引策略的 6 种 sST 方法,包括微阵列(10X Genomics Visium)、基于珠子的方法(HDST、BMKMANU S1000、Slide-seq)、基于 polony 或纳米球的技术(Stereo-seq、PIXEL-seq)和微流控技术(DBiT-seq)。
数据处理流程:构建标准流程,包括生成空间条形码、保留已知形态区域的读数、下采样以控制测序深度和成本差异,之后进行细胞状态注释和细胞间通讯分析。
-
实验结果
该研究系统性地对 6 种基于测序的空间转录组学(sST)方法展开比较,通过多种实验与分析获取了丰富结果,为深入了解 sST 技术提供了关键依据。下面从分子捕获效率、分子侧向扩散、聚类和细胞注释、标记基因检测这四个方面详细阐述实验结果。
1.分子捕获效率
不同平台捕获效率差异显著:研究人员获取成年小鼠大脑海马体和 E12.5 小鼠胚胎眼睛组织,经手动划定区域,用全部读数或下采样数据评估分子捕获效率。从下采样结果(图 2b、c)可知,各平台测序数据均未达饱和,意味着需更多测序数据提升性能。对比不同平台,Stereo-seq 原始测序深度下,相同区域测序读数多,总计数高;但控制测序深度后,Slide-seq V2 在眼睛和海马体组织中敏感性更高,DBiT-seq 则最低(图 2d、e)。

图 2 不同平台生成数据的敏感性比较
a) 示意图展示从成年小鼠海马体和 E12.5 小鼠眼睛的完整处理样本中提取已知形态区域的过程。各平台的总 UMI 计数随逐步下采样的测序深度变化而变化。
b - c) 数据分别来自小鼠海马体和 E12.5 小鼠眼睛区域,垂直黑色虚线表示用于生成后续下采样数据的读数计数。
d - e) 计算小鼠海马体和 E12.5 小鼠眼睛选定区域使用所有读数和下采样数据的总独特分子标识符(UMI)计数。
f - g) 展示小鼠海马体和 E12.5 小鼠眼睛中,五个 100µm×100µm 区域内标记基因的总 UMI 计数,附带均值和标准差。
h) 比较 Visium(x 轴)和 Stereo-seq(y 轴)检测到的基因的总 UMI 计数,每个黑点代表一个基因,在 Stereo-seq 中表达处于第 90 百分位但在 Visium 中处于第 10 百分位的基因以红色突出显示并标注基因符号。
i) 热图展示 E12.5 小鼠眼睛中,Visium 未捕获但 Stereo-seq 捕获的基因的 log₁₀转换后的表达情况。
标记基因表达差异反映平台特性:在检测特定区域标记基因 RNA 含量时,以海马体 CA3 区的 Prdm8、Prox1 和 Slc17a7,以及 E12.5 小鼠眼睛中的 Vit、Crybb3 和 Aldh1a1 等基因为例,在 100µm×100µm 区域内比较计数总和。结果显示,Slide-seq 在这些标记基因检测中敏感性最高,Visium 在预期表达区域的标记基因计数较少(图 2f、g)。进一步分析发现,Visium 存在基因捕获偏差,如在晶状体相关基因检测中,除 Visium 外,其他平台均能检测到 Crybb3 和 Cryaa 等基因表达,而 Visium 未检测到(图 2h、i),且该偏差并非由预处理流程和基因注释导致。
2.分子侧向扩散
不同组织中各平台扩散情况各异:为评估 mRNA 检测的空间准确性,研究人员采用绘制特定基因强度分布图和量化半高宽(LWHM)两种方法测量分子侧向扩散。在嗅球组织中,选择 Slc17a7 作为标记基因,其在 Mitral 和 Tufted(M/T)细胞及谷氨酸能神经元中特异性表达。从各 sST 数据集的 Slc17a7 表达图(图 3a 左)及 LWHM 测量结果可知,Stereo-seq V1 在嗅球中对 Slc17a7 的侧向扩散明显,而 Slide-seq V1.5 和 PIXEL-seq 控制较好(图 3b - d 左)。

图 3 不同平台生成数据的扩散比较
a) 展示选定的在特定区域高表达的标记基因的表达模式,包括小鼠嗅球中的 Slc17a7(左图)、小鼠大脑中的 Ptgds(中图)和 E12.5 眼睛中的 Pmel(右图),图基于原始计数绘制,黑色框为计算扩散的选定区域。
b) 将上述标记基因在嗅球(沿 50µm 每 10µm 汇总)、大脑(沿 500µm 每 10µm 汇总)和眼睛(沿 300µm 每 10µm 汇总)的表达水平聚合,UMI 计数经跨模态平均、平台归一化后以密度图呈现(曲线下面积设为 1)。
c) 给出各模态内上述标记基因的表达水平,黑色虚线为扩散计算边界。
d) 计算各模态中每个基因的左半峰宽(LWHM)并以箱线图展示,每个点代表一种模态的 LWHM 值,无法计算 LWHM 的模态已去除。
在大脑组织中,选取 Ptgds 作为标记基因,其在血管细胞特定位置表达。分析 Ptgds 的表达图和 LWHM 测量结果发现,Stereo-seq 数据存在严重侧向扩散,Slide-seq V2 和 BMKMANU S1000 控制相对较好(图 3a - d 中)。对 Stereo-seq 下采样数据的扩散分析表明,下采样无法解决其侧向扩散问题。在眼组织中,以 Pmel 为标记基因,其在黑色素细胞中特异性表达。结果显示,Stereo-seq 对 Pmel 的侧向扩散控制最佳,Slide-seq V2 次之(图 3a - d 右),这与在其他两种组织中的结果不同,表明组织类型对扩散过程影响较大。
3.聚类和细胞注释
聚类方法和 sST 平台影响细胞亚群识别:研究人员选择 E12.5 小鼠眼睛进行聚类和细胞注释分析,该组织具有独特结构。使用 Seurat、DR.SC 和 PRECAST 三种聚类方法对不同 sST 平台数据进行处理。从聚类结果来看,Seurat 仅基于转录组谱,DR.SC 和 PRECAST 结合空间信息。Seurat 在检测预期细胞亚群时表现稳定,但不同 sST 平台数据在识别细胞亚群能力上存在差异(图 4a)。其中,Slide-seq V2 和 Stereo-seq 数据能较好分离细胞亚群,实现全面注释;BMKMANU S1000 数据因侧向扩散问题,在识别黑色素细胞时面临挑战;Visium 数据受物理分辨率限制,检测预期细胞亚群存在困难,每个样本在眼区的可用点数较少(约 75 个),导致细胞混合,难以识别复杂细胞亚群。

图 4 下游性能比较
a) 展示各平台表达谱聚类结果,包括已知细胞类型标识、预期细胞状态分布及实际聚类标注,CM、pNR、LV 分别代表角膜间充质、推定神经视网膜、晶状体囊泡。
b) 对各平台下采样的眼睛数据聚类,热图呈现其与全数据聚类注释的对应关系(log10 转换后点数)。
c) Stereo-seq 数据示例,呈现 Aldh1a1 和 Aldh1a3 在 10µm 分辨率下的空间表达谱及表达点数。
d) snRNA-seq 数据中 Aldh1a1 和 Aldh1a3 的表达谱与细胞数。
e) 标记基因检测的细胞状态比较概述,以晶状体和黑色素细胞等为例,展示不同平台基因情况。
f) 不同 sST 方法在两对细胞亚群比较中,随读数变化的标记基因检测数量。
g) Upset 图展示不同 sST 方法在两对细胞亚群比较时标记基因的交集情况。
测序深度影响聚类结果一致性:测序深度影响空间转录组数据总计数,研究人员探究其对聚类结果的影响。对下采样数据聚类结果与全数据聚类结果进行比较,并计算聚类纯度(ECP)和准确性(ECA)的熵值(图 4b)。结果发现,下采样数据能检测到全数据中的大部分细胞亚群,但在评估 ECP 和 ECA 时,发现存在较高不一致性。这是因为部分细胞,如神经元视网膜细胞不同亚群之间,以及晶状体和晶状体囊泡细胞等表达谱相似的细胞,在聚类时出现分组差异。
sST 数据与 snRNA-seq 数据相互补充:在所有 sST 数据集中,Pmel、Crybb3、Atoh7、Enfa5、Aldh1a1 和 Aldh1a3 等基因呈现良好表达模式,这些基因是特定细胞类型的标记基因。snRNA-seq 数据在眼区检测到表达这些基因的细胞数量有限,且主要聚集在 UMAP 图的下角,难以进一步细分亚群(图 4d)。然而,snRNA-seq 数据可作为参考,辅助注释 sST 数据。例如,利用 Seurat 整合两种数据,可改善 Stereo-seq 数据中上皮细胞的注释,以及 BMKMANU S1000 数据中黑色素细胞和上皮细胞的分离。此外,sST 技术易受血液污染影响,Visium 和 BMKMANU S1000 受影响较大,Stereo-seq 与 snRNA-seq 的血液污染水平相近,Slide-seq V2 受污染程度最低。
4.标记基因检测
不同技术在标记基因检测上存在偏差:研究人员利用 Wilcoxon 秩和检验在 Seurat 中寻找聚类间的标记基因,发现不同技术在选择标记基因时存在技术特异性偏差。以 Pax6 基因为例,它是神经谱系的关键调节因子,在视网膜发育中起重要作用。Stereo-seq 数据仅在 pNR3 簇中突出显示 Pax6 表达,而 Slide-seq V2 和 BMKMANU S1000 数据显示其在整个神经视网膜(pNR1 - 4)均有表达,这与现有文献一致,表明技术选择会影响特定细胞类型或簇的顶级标记基因识别。类似地,在神经视网膜祖细胞中的 Hes 基因和 pNR1、pNR2 中的 Sox2 基因表达检测中,也观察到不同技术间的差异。
测序深度影响标记基因检测数量:分析下采样数据的聚类结果发现,减少测序读数仍可保留一般细胞亚群,但部分相似表达谱的亚群难以清晰分离。为进一步研究下采样影响,研究人员比较了下采样数据和全数据集的标记基因检测情况。选择 pNR4 和 pNR1(表达谱相似度较高)、晶状体和黑色素细胞(表达谱相似度较低)两对细胞亚群进行检测(图 4e)。
结果表明,随着读数增加,标记基因数量增多,且测序深度加深时增加更明显(图 4f)。在比较表达谱差异较大的细胞亚群时,Slide-seq V2 在标记基因检测性能上表现更优(图 4f 下)。此外,不同平台在各比较对中既有共同识别的标记基因,也有大量独特的标记基因(图 4g)。
5. sST 方法的结果和特点的总结
本研究对多种sST方法进行系统评估,结果呈现出各方法的独特性能与特点。在捕获效率方面,不同测序深度下表现各异。Stereo-seq在原始测序深度时捕获效率最佳,凭借大量测序 reads 获得较高总计数;而Slide-seq v2在标准化测序深度下更具优势,展现出良好的敏感性。不过,Visium平台存在基因捕获偏差,部分在其他技术中能稳定捕获的标记基因,在Visium数据中却未显示,这一现象值得关注。
空间分辨率受多种因素影响,点大小虽常作为衡量指标,但扩散才是影响实际分辨率的关键。不同技术在不同组织上的扩散情况差异明显。例如,Stereo-seq在小鼠胚胎组织上扩散控制良好,但在小鼠大脑组织中扩散伪影较强;Slide-seq V2等在部分组织上对扩散的控制相对较好。透化时间对分子扩散影响重大,是sST技术发展中需要重点优化的因素。
在下游分析中,不同sST方法在聚类和细胞注释方面表现不同。Slide-seq V2和Stereo-seq数据能较好地分离细胞子集,实现全面注释;BMKMANU S1000受侧向扩散影响,在检测特定细胞类型时存在困难;Visium则因物理分辨率较低,在检测预期细胞子集时面临挑战。此外,测序深度对聚类结果有影响,下采样数据虽能检测出大部分细胞子集,但存在一定程度的不一致性。在标记基因检测上,各平台存在技术特异性偏差,且随着测序 reads 增加,标记基因数量增多。总体而言,sST领域发展迅速,各技术性能不断优化,持续评估和深入研究对推动该领域发展至关重要 。

图 5 对 sST 方法的结果和特点进行了总结。左图依据性能对 sST 方法进行排序,通过颜色和点大小直观呈现各方法在不同类别中的表现;右图概述了所研究 sST 方法的关键特性,包括从无到有构建方法的难度等,为评估和选择 sST 方法提供参考。
下面的表格详细对比了 Stereo-seq、BMKMANU S1000、10X Genomics Visium 和 DBiT-seq 四种空间转录组学(sST)方法的实验流程、透化时间和文库构建等方面的差异,有以下的结论:
实验流程差异:四种方法在组织固定、染色、成像、透化时间优化及 cDNA 合成与处理等步骤上存在不同。例如,Stereo-seq 无前处理的组织固定和染色步骤,而 BMKMANU S1000 和 10X Genomics Visium 都有组织固定和 HE 染色等流程。
透化时间不同:不同方法在大脑和胚胎组织的透化时间有所不同。如 Stereo-seq 在大脑中透化时间为 12 分钟,胚胎中为 18 分钟;而 BMKMANU S1000 和 10X Genomics Visium 在胚胎中的透化时间均为 6 分钟。
文库构建区别:在空间表达实验的文库构建环节,各方法也存在差异。Stereo-seq 是在 Stereo 芯片上进行冰冻切片,后续有一系列的处理步骤;BMKMANU S1000 在 S1000 基因芯片上操作;10X Genomics Visium 在 Visium 基因表达载玻片上进行;DBiT-seq 的流程则更为独特,包括甲醛固定、与 ADTs 孵育、带有特定条形码的逆转录和连接等步骤。这些差异会影响实验的操作难度、数据质量以及最终的应用效果,为研究人员选择合适的 sST 方法提供了参考依据。
表1



四
讨论展望
在生物学研究中,评估空间转录组学方法比scRNA-seq更具挑战。其参考组织设计困难,细胞位置和状态不明且受认知限制,而scRNA-seq获取一致输入较易。同时,不同空间转录组学方法测量单位差异大,如Visium点直径大、Stereo-seq点小,增加了评估复杂性。 为此,本研究构建严谨基准测试体系。选用常用模式生物的稳定细胞类型、有特定标记基因且形态清晰的参考组织,制定切片协议保证数据可比。采用多指标和流程,结合全读数与下采样数据对比6种方法,生成cadasSTre数据集。
结果显示,空间转录组学数据远未饱和,Stereo-seq原始测序深度捕获效率最佳,Slide-seq v2标准化深度最优,Visium存在基因捕获偏差,扩散是影响实际分辨率关键因素且受透化时间影响,不同技术在不同组织扩散表现不同。 本研究虽建立首个系统基准测试方案,但仍有优化空间,如受小鼠眼睛发育认知限制影响胚胎数据构建。生成的数据集可用于比较计算工具,开发通用空间工具还需更多组织和数据。
研究发现空间数据聚类工具性能未必优于单细胞聚类方法,注释空间数据应综合考虑有无单细胞参考分析结果。鉴于空间转录组学发展迅速,持续评估很重要,空间多组学处于初期,社区驱动的基准测试联盟对其发展意义重大。
本研究揭示该领域优势与问题,建立比较标准,为空间多组学技术基准测试奠基。

(点击阅读原文获取文献)