万字综述 |单细胞组学:开启生命微观 “潘多拉魔盒” 的神奇钥匙

前 言 

生命科学的探索之旅中,单细胞组学恰似一把神奇钥匙,正逐步开启细胞微观世界的神秘大门。今天要探讨的这篇论文在生命科学研究征程中,单细胞组学技术是探索细胞微观世界的有力工具。《Single - cell omics: experimental workflow, data analyses and applications》于2024年6月发表在《SCIENCE CHINA Life Sciences》期刊,该文系统地阐述了单细胞组学技术,为科研人员提供了全面的技术指导。
细胞作为生命活动的基本单元,其独特的发育轨迹和分子特征蕴含着生命奥秘。单细胞测序技术近年来快速发展,从单细胞RNA技术逐步拓展到基因组、表观基因组、蛋白质组和代谢组等多个组学领域,同时融合了空间scRNA - seq和CRISPR筛选等技术,为深入理解复杂疾病的发病机制和生命过程提供了新的视角。本综述聚焦单细胞组学技术的方法学,旨在帮助研究人员选择合适的技术和数据分析方法,推动单细胞组学研究的深入发展。
 

Science China Life Sciences (IF 8.0

Pub Date : 2024-07-23 

DOI:10.1007/s11427-023-2561-0

 

文章思路和亮点

  • 文章思路:

  • 文章亮点:

单细胞RNA测序(scRNA - seq)技术自2009年诞生以来,已开发出60多种方案。它能在单细胞水平解析基因表达,为细胞分类、发育研究、个体差异分析以及疾病机制探索提供了独特的视角。scRNA - seq技术的发展不仅革新了转录组学研究,还带动了其他组学领域的技术探索,促进了多组学技术、空间scRNA - seq和CRISPR筛选等新技术的出现,这些新技术通过整合多组学数据,更全面地揭示细胞的复杂行为。

 

 
【图 1:单细胞测序技术示意图】展示自 2009 年首个 scRNA-seq 技术诞生后,单细胞测序技术在多组学层面的扩展及整合方法,涵盖转录组、基因组等多种组学及相关技术。

 

单细胞转录组测序(scRNA - seq)

单细胞 RNA 测序(scRNA-seq)技术是分析细胞复杂性和异质性的前沿手段,能为多领域提供丰富信息。自 2009 年首个方案推出后,该技术不断发展,在多环节优化以提升性能。本章将全面介绍该技术、相关分析方法及其应用,助力研究人员选择合适方案(图 2)。

【图 2:过去 10 年 scRNA-seq 领域的重要成果】黑色代表 scRNA-seq 技术;红色代表单细胞细胞核 RNA 测序(snRNA-seq)技术。

 

  3.1 scRNA - seq概述

scRNA-seq 主要包括四个步骤:(i)单细胞分离;(ii)逆转录(RT);(iii)cDNA 扩增;(iv)测序文库构建和测序(Hedlund 和 Deng,2018)。scRNA-seq 工作流程的主要步骤如图 3 所示。其关键在于单细胞分离及文库构建技术,这影响着实验的准确性与通量。

【图 3:scRNA-seq 工作流程的主要步骤】样本组织中的单细胞 / 细胞核悬浮液经过单细胞 / 细胞核分离、RNA 提取、逆转录、PCR 扩增、文库构建、测序,最后进行数据分析。

(i)单细胞分离 :早期分离方法如有限稀释法、手动显微操作法和激光捕获显微切割法,通量低、耗时且技术要求高,现多用于分析稀有细胞。常用的高通量技术如荧光激活细胞分选(FACS),虽可分离大量细胞,但对低标记表达细胞分离效果不佳。磁激活细胞分选(MACS)能高效分离特定细胞群体,不过存在局限性。基于微流控的单细胞操作技术成为主流,如微孔板法、液滴法和集成流体电路等,提升了分离效率与准确性(相关技术特点及优缺点详见补充信息表 S2)。

(ii)逆转录和(iii)cDNA 扩增cDNA扩增 :因单细胞中 mRNA 含量低,需扩增 cDNA。常见扩增方法有基于 PCR 的技术(如聚腺苷酸加尾和模板转换法)和基于体外转录(IVT)的线性扩增。PCR 扩增虽高效,但存在偏好性,易导致定量偏差和信息丢失;IVT 虽准确性高,但过程繁琐、耗时。此外,细胞条形码和 UMI 的应用可实现并行处理和准确转录本定量(图 3 展示了 scRNA-seq 工作流程的主要步骤)。

 

 3.2 现有单细胞 RNA 测序技术

scRNA-seq 技术多样,可分为低通量和高通量两类。低通量技术注重提升测序灵敏度和准确性,高通量技术则在其基础上发展而来。

低通量单细胞 RNA 测序技术

  • Tang’s protocol:2009 年由 Surani 团队开发,是 scRNA-seq 的开创性方法,可生成近全长 cDNA 并检测约 13,000 个基因,有助于发现新转录本和剪接异构体。但该方法只能捕获有 poly (A) 尾的 mRNA,测序灵敏度低且不具链特异性,因此使用受限。

  • STRT-seq:2011 年由 Islam 等人开发,可在 Illumina 平台实现高度多重化检测,能为细胞添加独特条形码以检测混合样本,但多轮 PCR 可能引入偏差。该技术在生物医学领域应用广泛。

  • Smart-seq:2012 年 Ramsköld 等人开发,可高效将 poly (A)+ RNA 转为全长 cDNA,提升了检测可变剪接外显子和低丰度转录本的能力。后续的 Smart-seq2 和 Smart-seq3 分别在产量、长度、灵敏度及全长转录本覆盖与 UMI 兼容性等方面进行了改进。Smart-seq-total 则可同时捕获多种 RNA 形式,但无法评估 circRNA 且会丢失转录本的内源性聚腺苷酸化状态。

  • CEL-seq:2012 年推出,利用线性扩增减少偏差,但无法检测某些转录本且难以区分可变剪接形式。改进后的 CEL-seq2 提高了灵敏度,降低了成本和操作时间。

  • SUPeR-seq:使用随机引物检测多种 RNA,但在高通量测序和分子计数方面存在挑战。

  • MATQ-seq:2017 年开发,可对多种 RNA 测序,减少了转录本偏差,能检测低丰度基因,但细胞分离方法限制了通量。

  • FLASH-seq:对 Smart-seq2 进行优化,缩短了时间和成本,可检测大量 SNPs,适合追求高效低成本的研究人员。

     

高通量单细胞 RNA 测序技术

  • 发展策略:早期 scRNA-seq 通量低,细胞特异性条形码出现后,实现了高通量并行测序,如 MARS-seq 结合 FACS 与自动液体处理技术提升通量,但基于板的方法分析细胞数量仍有限。微流控技术带来突破,2012 年 Fluidigm C1 系统可自动处理 96 个单细胞,但处理能力不足。2015 年基于液滴的技术能同时处理数千细胞,之后 sci-RNA-seq 和 SPLiT-seq 等组合索引方法进一步提升了技术优势。

  • 基于培养板的高通量 scRNA-seq 方法:

    Quartz-seq:Sasagawa 等人(2013)开发,优化了转录组扩增,整合实验步骤,具有高定量准确性等优点。Quartz-seq2(2018)是其扩展,提升了 cDNA 量和 UMI 转换效率 。

    MARS-seq:2014 年出现,自动化程度高,可对多种组织和器官进行研究。2019 年的 MARS-seq2.0 通量提升,成本降低,但在确定基因特定序列方面存在限制,不过在稀有细胞研究和多层面信息获取上有优势。

    SCRB-seq:Soumillon 等人(2014)基于 Smart-seq 开发,能以低成本对大量细胞的 mRNA 进行分析,相比 Smart-seq 增加了细胞条形码,提升了测序通量,但大规模测序仍有挑战。

  • 基于液滴的 scRNA-seq 技术:

    InDrop:将细胞包裹在含多种试剂和条形码水凝胶微球的液滴中,可扩展性强,但 mRNA 捕获效率低。

    Drop-seq:与 InDrop 类似,使用硬树脂珠子,条形码引物直接合成在珠子上,独特条形码数量多,利于高通量分析。

    10x Genomics:商业化平台,利用凝胶珠在液滴内进行反应,与 InDrop、Drop-seq 有相似处也有差异,如微球类型、引物释放方式等。

    MULTI-seq:采用不同的细胞条形码标记策略,通过脂质修饰的寡核苷酸标记质膜,样本处理少,可对多种细胞进行条形码标记。

  • 基于微流控的高通量 scRNA-seq 方法:

    Droplet - 和 microwell - 平台:是高通量 scRNA-seq 的主要技术,能在单次实验中分析约 10,000 个细胞的转录组,通过将细胞分隔在微纳升容器中进行 RT 反应,并结合细胞条形码策略提升通量和降低成本 。

    具体方法:包括 CytoSeq、Seq-Well、ICELL8 和 CellenONE-ICELL8 等。CytoSeq 可分析大量细胞,成本低且对细胞大小形状无限制;Seq-Well 适用于低样本输入,设备简单,可在资源有限环境使用;ICELL8 通过微芯片提高通量,CellenONE-ICELL8 则进一步提高了细胞捕获效率,并能检测非编码 RNA。

  • 基于组合索引的高通量 scRNA-seq 技术:

sci-RNA-seq:Cao 等人(2017)开发,通过双 UMI 条形码实现 3' 端覆盖和深度测序,可扩展性强,但实验流程繁琐、成本高且存在细胞损失。

SPLiT-seq:Rosenberg 等人(2018)设计,可分析固定组织,工作流程简单、温和且成本效益高,但样本固定可能导致 mRNA 化学修饰等问题。

 

 3.3 数据分析

scRNA-seq 原始数据多基于 FASTQ 文件,Illumina 平台数据需转换。其分析流程涵盖数据预处理、处理和下游扩展分析(图 4)。

【图 4:单细胞分析工作流程概述】涵盖从数据预处理、处理到下游分析的流程,涉及质量控制、细胞分型注释等多环节。

 

  • 数据预处理

质量控制:测序产生低质量数据,受仪器、操作等因素影响,存在空液滴、双细胞等问题。可通过设定 UMI 阈值、使用 DropEst、EmptyDrops 等工具过滤,还有基于深度学习的方法如 EmptyNN、CellBender 。合理质控需综合技术和生物学因素,如 ddqc 方法(图 4A 展示数据预处理形成细胞 - 基因矩阵的过程)。

读取比对和表达定量:将质控后的高质量细胞数据的短读长序列比对到参考基因组量化基因表达。RNA 比对分两步,早期有多种比对工具。如今,CellRanger 和 STARsolo 表现良好,STARsolo 速度更快(结合图 4 理解数据处理流程)。

  • 数据处理

主流分析流程有 Seurat 和 Scanpy,分别基于 R 和 Python。主要包括以下操作(图 4B-D 展示常规分析流程和预期结果 ):

归一化:因技术或细胞差异导致文库大小不同,需归一化。方法有全局缩放法(如 CPT、CPM )、基于内参法(如 GRM、BASiCS)、其他变换模型法(如 RLE、Dino、scTransform)。研究显示 scTransform 和 logCPM 稳定性较高。

批次效应校正:不同实验条件产生批次效应,需计算方法校正。主要方法有互近邻法(如 batchelor、Scanorama)、潜在空间法(如 harmony、ZINB-WaVE )、基于图的方法(如 BBKNN、OCAT)、深度学习法(如 INSCT、CLEAR)。实际应根据数据选方法,Harmony 和 Seurat V3 效果较好,但深度学习方法缺乏良好指标。

插补:测序数据零值多,干扰下游分析需插补。早期方法单独考虑细胞相似性或基因关系,如 MAGIC、SAVER。综合方法如 CMF-Impute、netNMF-sc 考虑两者联系。近年新方法不断,如 AutoClass、ALRA、scMOO、sc-PHENIX,但尚无最佳方法定论。

特征选择:为提升计算效率等,常选高变基因分析。早期方法有缺陷,新策略不断涌现,如基于基因表达分布矩阵法(SCMER、RgCop )、基于熵法(IEntropy、infohet)、综合聚类法(Triku、FEAST)。部分方法用其他特征代表数据集,如 scVEGs、scSensitiveGeneDefine 和 BASiCS 等。

降维:单细胞转录组基因多,需降维。分为线性降维(如 LDA、PCA 及变体)和非线性降维(如 t-SNE、UMAP 及改进方法)。PCA 应用广泛,Seurat 常依标准差 - PC 图等确定主成分数量。t-SNE 和 UMAP 需设超参数,改进方法如 den-SNE/densMAP、j-SNE/jUMAP 可优化可视化。

聚类:聚类划分细胞亚群,了解细胞类型和功能,受数据预处理影响。有基于距离聚类(如 K-means 用于 SCUBA 等,Louvain、Leiden 等基于共享最近邻图结构 )、密度聚类(如 DBSCAN、densityCut)、层次聚类(如 RCA cluster、HGC)、深度学习聚类(如 ADClust、DESC )等方法

细胞类型注释:分为参考依赖和非参考依赖方法。前者需预注释数据或先验知识,包括基于层次树、相似性、特征基因等方法及深度学习方法;后者用预训练模型直接分类,如 scDeepSort、Pollock,但受预训练数据集限制。目前主流方向是提高细胞注释工具在大平台和多细胞模式下统一分配细胞类型的能力。

差异表达分析(DEGs):统计检验常用,如 t 检验、Wilcoxon 检验等,对应工具如 limma、edgeR 和 DESeq2 。limma 在 RNA 计数分析中有较大误差,DESeq2 分析效果较好。单细胞转录组 DEGs 分析方法多样,包括早期基于零值的参数检验、非参数检验(如 Swish、IDEAS)及其他方法(如基于深度学习的 MRFscRNAseq ),应根据数据选择合适策略。

可视化:将分析结果以图展示,ggplot2 是常用 R 可视化工具,还有 ARL 专门用于展示标记基因关联图,能呈现各聚类中的特征。Complex Heatmap 等工具也常用于标记基因可视化,但此处不做详细介绍。HVG 可视化通常以火山图形式呈现,默认图的左右部分分别代表低表达和高表达基因,中间为恒定表达基因。Enhanced Volcano 是专门绘制火山图的 R 包,而 ggplot2 也能通过默认设置实现较好的绘图效果。

 

 3.4 技术应用

  • 胚胎发育研究:scRNA-seq 在胚胎发育研究中至关重要(图 1 展示单细胞测序技术可助力探索胚胎发育等过程)。Cao 等通过分析小鼠胚胎的单细胞,鉴定出多种细胞类型和亚型,构建了骨骼肌细胞的发育轨迹图,推动了哺乳动物发育生物学的发展 。Scialdone 等分析早期小鼠胚胎细胞,创建了基因表达谱并研究了关键转录因子的功能。Nestorowa 等通过 scRNA-seq 揭示了造血干细胞的分化轨迹 。此外,scRNA-seq 还可识别胚胎发育中的关键调控因子和信号通路,如 Mesp1 在心脏祖细胞特化中的作用,以及 Wen 等对人类造血中胚层细胞的研究 。

  • 肿瘤研究:scRNA-seq 在肿瘤研究中成果颇丰(可结合图 1 理解其在肿瘤研究方面的技术应用原理)。它能揭示肿瘤异质性,如 Hu 等鉴定出输卵管上皮细胞亚型和卵巢癌亚群,Liang 等分析卵巢癌免疫细胞异质性并开发预后分层方法,Zhang 等研究胃癌细胞的分化和异质性 。同时,该技术还可剖析肿瘤微环境,例如中国研究团队分析胃癌患者的细胞,揭示多种免疫细胞亚群及肿瘤免疫抑制微环境;Savas 等发现乳腺癌患者肿瘤内 T 细胞的异质性及与患者生存相关的细胞亚群 。此外,scRNA-seq 有助于指导治疗选择和监测,如 Tirosh 等发现黑色素瘤中与治疗耐药相关的细胞亚群,Jerby-Arnon 等揭示免疫检查点抑制剂耐药的机制 。

  • 免疫系统研究:在免疫系统研究中,scRNA-seq 发挥着重要作用(参考图 1 了解单细胞测序技术与免疫系统研究的关联)。它可以用于研究免疫细胞异质性,He 等分析老年斑马鱼大脑中的免疫细胞,揭示了小胶质细胞和 T 细胞在神经退行性过程中的关键作用;美国研究团队分析儿童系统性红斑狼疮患者的外周血单核细胞,鉴定出新的细胞亚群并揭示疾病相关的细胞特征 。此外,scRNA-seq 还能助力研究免疫疾病机制,如 Gaydosik 等研究系统性硬化症患者的 T 细胞亚群,Xu 等分析白癜风的发病机制 。

  • 药物研发:scRNA-seq 在药物研发的多个环节贡献显著(结合图 1 理解单细胞测序技术如何辅助药物研发)。在靶点发现阶段,通过分析疾病相关细胞的转录组,可识别潜在的治疗靶点,如 Abdelfattah 等在胶质母细胞瘤中发现 S100A4 为免疫治疗新靶点 。在药物筛选和优化环节,该技术可提高筛选效率和精准度,例如 Cao 等通过对康复患者的 B 细胞进行高通量单细胞 RNA 和 VDJ 测序,快速分离出针对 SARS-CoV-2 的中和抗体 。在药物作用机制研究方面,scRNA-seq 能揭示药物诱导的细胞和分子变化,如 Taukulis 等研究顺铂诱导的耳毒性,Zhang 等探究双氢青蒿素的免疫调节机制 。此外,在患者分层中,scRNA-seq 可通过分析细胞转录组,识别与疾病预后或治疗反应相关的标志物,如 Candelli 等对婴儿急性淋巴细胞白血病患者进行 scRNA-seq,用于预测疾病复发 。

 

单细胞全基因组测序

  • 技术方法

多种 WGA 方法各有千秋(表1):例如多重置换扩增(MDA),其优势是产量高,能获得大量的 DNA 扩增产物,但扩增均匀性欠佳,容易造成基因组某些区域的过度或不足扩增;而多次退火环状循环扩增技术(MALBAC),在减少扩增偏差方面表现出色,可更均匀地扩增全基因组,不同方法因各自特点适用于不同研究需求。

表1(部分)

高通量方法提升研究规模:可实现大规模单细胞测序,一次实验能够处理大量细胞,极大地加快研究进程,同时降低单个细胞测序成本,使大规模单细胞全基因组研究成为可能。

  • 技术应用

肿瘤研究中揭示关键信息助力科研人员发现肿瘤驱动基因,深入解析肿瘤异质性。通过对肿瘤单细胞全基因组的分析,能够清晰地了解肿瘤细胞基因组的变异情况,为肿瘤的精准诊断、个性化治疗方案制定以及预后评估提供关键依据 。

生育领域助力胚胎筛选:通过分析胚胎单细胞基因组,精准筛选出染色体正常、无遗传缺陷的优质胚胎,有效提高辅助生殖成功率,帮助更多家庭实现生育健康宝宝的愿望。

【图 5:单细胞全基因组扩增和测序技术发展时间线】上半部分呈现 scWGA 和低通量 scWGS 技术发展关键事件,下半部分展示通量方面的进展。

 

单细胞表观基因组测序 

  • 测序技术

甲基化测序方法各有特点:如全基因组亚硫酸氢盐测序(BS - seq),能够全面检测基因组中的甲基化位点,提供最为详尽的甲基化信息,但成本较高;而简化代表性重亚硫酸盐测序(RRBS),则聚焦于特定区域的甲基化检测,成本相对较低,适用于对特定基因区域甲基化研究需求的场景。

 

【图 6:单细胞表观基因组测序技术概述】单细胞表观基因组测序在 DNA 修饰等四个层面开展,不同颜色代表各层面相应测序方法。

多层面技术研究染色质相关特征:借助转座酶可及染色质测序(ATAC - seq)研究染色质的可及性,了解哪些区域的染色质容易被转录因子等结合;利用高通量染色体构象捕获技术(Hi - C)探究染色质的高级结构,从不同层面深入揭示表观遗传调控机制

  • 计算方法

数据处理涉及多方面操作:从数据比对开始,将测序得到的数据准确地定位到参考基因组上;接着进行甲基化位点识别,判断哪些位点发生了甲基化修饰;最后进行信号强度计算等,每个环节都紧密相扣,任何一个环节的处理不当都可能影响最终分析结果的准确性。

多种工具助力综合分析:像 Bismark 常用于甲基化数据比对,能高效准确地完成比对任务;MACS2 则主要用于分析染色质可及性数据,通过不同工具的协同作用,实现对表观基因组数据的深度挖掘和全面分析。

  • 技术应用

胚胎发育研究中揭示关键变化:在胚胎发育的动态过程中,深入研究表观遗传修饰的动态变化情况,有助于理解细胞分化和发育调控的深层次机制,明晰胚胎如何从一个单细胞逐渐分化成各种不同类型的细胞和组织器官。

肿瘤免疫研究里解析复杂机制:对肿瘤细胞和免疫细胞的表观基因组进行分析,能够探究肿瘤免疫逃逸的机制,了解肿瘤细胞如何逃避机体免疫系统的监视和攻击;同时也有助于揭示免疫治疗响应的机制,为开发更有效的肿瘤免疫治疗方法提供理论基础。神经生物学研究中探索大脑奥秘:通过研究神经元的表观基因组,深入揭示神经发育的过程,以及神经退行性疾病如阿尔茨海默病、帕金森病等的发病机制,为这些疾病的治疗和预防提供新的思路和靶点。

 

【图 7:单细胞表观基因组分析的主要步骤及相关计算方法概述】单细胞表观遗传数据分析分预处理、数据填补等 6 部分,涉及多种计算方法及不同功能流程。

基于质谱的单细胞蛋白质组学技术 

  • 技术流程

样本制备注重减少损失采用温和的细胞裂解方法,避免蛋白质的过度降解;同时运用高效的富集技术,最大程度地保留细胞内的蛋白质,确保样本中的蛋白质信息能够完整地被后续分析所利用 。

质谱分析从多方面优化:通过优化质谱仪器的参数,如离子源电压、质量分析器分辨率等,提高蛋白质检测的灵敏度;选择合适的离子化方式,如电喷雾离子化(ESI)或基质辅助激光解吸电离(MALDI),以适应不同类型蛋白质的检测需求,从而提高蛋白质检测的分辨率和准确性。

  • 前沿工具

集成工具整合多步骤功能(表2):出现了一些集成平台,将样本处理、质谱分析、数据分析等多个实验步骤整合在一起,不仅提高了实验效率,还能保证数据的一致性和连贯性,减少实验误差。

易用工具降低操作门槛:开发出一系列操作简单、界面友好的工具,使得更多科研人员,尤其是没有深厚质谱技术背景的人员,也能够便捷地开展单细胞蛋白质组学研究。

表 2(部分)

 

  • 技术应用

癌症研究揭示细胞异质性:对肿瘤单细胞的蛋白质组进行分析,能够发现不同肿瘤细胞之间蛋白质表达的差异,明确肿瘤细胞的异质性特征,为肿瘤的精准治疗提供更具针对性的依据。
【图 8:近期单细胞蛋白质组学(SCP)工具的工作流程】A 为 iPAD-1;B 为 OAD;C 为 nanoPOTS;D 为嵌套 nanoPOTS(N2 chip);E 为 proteoCHIP;F 为 iProChip;G 为 PiSPA。
 
生物标志物发现提供新途径:通过对单细胞蛋白质组的系统研究,筛选出与疾病发生、发展密切相关的蛋白质标志物,这些标志物可用于疾病的早期诊断、病情监测以及预后判断。细胞分化研究解析动态过程:在细胞分化过程中,实时监测蛋白质表达的动态变化,深入理解细胞分化的分子机制,揭示细胞如何在蛋白质水平上发生变化从而实现从一种细胞类型向另一种细胞类型的转变。
细胞周期分析助力深入理解:研究细胞周期不同阶段的蛋白质组变化,有助于探究细胞周期的调控机制,了解细胞是如何精确地调控自身的生长、分裂和分化过程。
 

【图 9:近期易用型 SCP 工具的工作流程】A 为 SCoPE2;B 为 WinO;C 为 Mad-CASP

单细胞代谢组技术

  • 研究技术

研究技术多种平台各有优势与局限核磁共振波谱(NMR)平台,其定量准确性高,能够对代谢物进行相对准确的定量分析,但灵敏度较低,对于低丰度代谢物的检测能力有限;液相色谱 - 质谱联用(LC - MS)平台,分离能力强,能够有效分离复杂的代谢物混合物,但在代谢物定性方面相对复杂,需要丰富的经验和专业知识;气相色谱 - 质谱联用(GC - MS)平台则在挥发性代谢物分析方面具有独特优势。

质谱技术应用广泛且关键质谱技术凭借其高灵敏度和高分辨率的特点,可检测多种代谢物。通过精确测量代谢物的质量数以及分析其碎片信息,能够准确鉴定代谢物的结构,在单细胞代谢组学研究中发挥着核心作用。

【图 10 - 12】:图 10 展示基于质谱的单细胞代谢组学中电离技术示例,包含 SIMS、MALDI 等多种技术;图 11 呈现该领域内容提取技术示例,如活单细胞质谱、微萃取策略等;图 12 为基于质谱的单细胞代谢组学分选和电离技术示例,涵盖无标记质谱细胞术、基于微阀的微流控装置等技术。

  • 技术应用

疾病研究中分析细胞代谢特征通过分析疾病相关细胞的代谢物变化,深入揭示疾病的发病机制,寻找潜在的治疗靶点,为疾病的治疗提供新的策略和方向。

植物研究助力作物遗传改良对植物单细胞代谢组进行研究,能够了解植物在生长发育、抗逆等过程中代谢物的变化规律,为作物品种改良提供理论支持,培育出更具优良性状的作物品种。 

单细胞多模态测序技术

  • 技术分类

多种技术实现多组学联合分析如单细胞三重测序技术(scTrio - seq),能够整合基因组、转录组和甲基化组测序,从多个层面获取细胞的遗传和表观遗传信息;单细胞转录组和甲基化组联合测序技术(scM&T - seq)则实现了转录组和甲基化组的同时分析,为深入研究细胞的分子调控机制提供了更全面的数据。

 

表 3

 

 

整合分析面临挑战且方法多样由于不同组学数据在数据类型、数据量、数据特征等方面存在较大差异,整合分析面临诸多挑战。为此,科研人员采用联合降维、数据融合模型等多种方法进行整合分析,以充分挖掘多组学数据之间的关联信息。

  • 技术应用

胚胎发育研究中整合多组学信息全面分析胚胎发育过程中的基因组、转录组、表观基因组等多组学信息,构建更加完整的胚胎发育调控网络,深入理解胚胎发育的分子机制和动态过程。

肿瘤研究里解析复杂调控机制综合分析肿瘤细胞的多组学数据,从基因、转录、表观遗传等多个层面揭示肿瘤发生、发展和转移的复杂调控机制,为肿瘤的精准治疗提供更深入的理论依据。

单细胞空间转录组学技术

  • 技术分类

微切割技术获取空间信息有局限例如激光捕获显微切割技术,它能够获取组织中特定区域细胞的转录组信息,但通量较低,操作过程较为复杂,难以满足大规模、高通量的研究需求。

条形码技术实现空间信息自动记录以 10x Visium 技术为代表,利用带有空间条形码的芯片,能够在对组织切片进行转录组测序时,自动记录每个转录本的空间位置信息,通量较高,适用于对组织空间转录组的大规模研究。

成像技术在原位分析基因表达如多重抗干扰荧光原位杂交技术(MERFISH)、序列荧光原位杂交技术(seqFISH)等,可在组织原位对基因进行高分辨率成像和表达分析,直观地展示基因在组织中的表达位置和表达水平。

  • 计算方法

数据处理多种方法应对噪声等问题采用降噪算法去除数据中的噪声干扰,通过空间校正等方法对空间位置信息进行准确校准,提高数据的质量和可靠性。

细胞分析多策略助力解析细胞特征通过细胞分割技术将组织中的细胞进行分离和识别,利用细胞类型注释策略确定每个细胞的类型,从而深入分析空间转录组数据中细胞的特征及分布情况。

基因分析多种方法挖掘基因相关信息运用差异表达分析方法筛选出在不同空间位置或不同细胞类型中差异表达的基因,通过构建基因共表达网络等方法挖掘基因之间的功能和调控关系。

  • 技术应用

健康组织研究中揭示发育和稳态机制对健康组织的空间转录组进行研究,能够清晰地了解细胞在组织中的分布和功能,揭示组织发育和稳态维持的分子机制,为理解正常生理过程提供重要依据。

神经系统研究里构建大脑空间图谱通过分析大脑的空间转录组,构建大脑细胞类型和基因表达的空间图谱,有助于深入理解神经功能和神经系统疾病的发病机制。

肿瘤研究中解析微环境特征和机制研究肿瘤的空间转录组,能够解析肿瘤微环境中细胞的组成和基因表达特征,探究肿瘤发生、转移和免疫逃逸的机制,为肿瘤的治疗提供新的靶点和策略。

【图 14】:展示空间转录组学及其他组学技术,包括显微切割、条形码、成像三类转录组学技术,以及 3D 基因组、表观基因组等其他组学的空间技术。

 

单细胞 CRISPR 筛选技术

  • 技术分类

转录组为基础应用广泛且不断优化:以单细胞转录组为基础,通过 CRISPR 技术对基因进行编辑,筛选与基因功能相关的转录本变化。同时,不断优化筛选策略和数据分析方法,提高筛选的准确性和效率。

表观基因组拓展研究领域但有局限从表观基因组层面筛选基因调控元件,拓展了研究领域,能够深入研究基因的表观遗传调控机制。然而,在检测技术和数据分析方面还存在一定的局限性,需要进一步发展和完善。

多模态提供更全面细胞特征分析结合多组学数据,如转录组、蛋白质组、代谢组等,全面分析细胞在基因编辑后的表型和分子特征变化,为深入理解基因功能提供更丰富的信息

  • 数据分析工具

多种工具聚焦数据不同处理环节例如 CRISPRcleanR 工具主要用于数据清洗,去除数据中的噪声和错误信息;CROP - IT 工具则专注于基因编辑效率分析,准确评估 CRISPR 技术对基因编辑的效果。

工具提升数据分析准确性和效率这些工具针对单细胞 CRISPR 筛选数据处理的不同环节,能够有效处理和分析数据,显著提高数据分析的准确性和效率。

  • 技术应用

揭示基因型和表型之间的联系通过基因编辑和单细胞分析,系统研究基因变化与细胞表型之间的因果关系,明确基因的功能和作用机制。

解析复杂的遗传调控关系研究基因之间的调控网络,探究基因之间如何相互作用、相互调控,从而深入理解复杂的遗传调控机制。

探索肿瘤和自闭症等疾病遗传机制在肿瘤和自闭症等疾病研究中,利用单细胞 CRISPR 筛选技术筛选与疾病相关的基因和调控元件,为探索这些疾病发病的遗传机制提供重要线索。

 

【图 15】:空间转录组学分析流程概述,以空间基因表达数据为基础,结合相关图像,运用概率建模或图构建方法,开展去噪、细胞类型注释等分析。

十一

讨论

单细胞组学技术近年来发展迅速,自2009年单细胞RNA测序(scRNA-seq)技术取得关键突破后,研究范畴从转录组不断拓展至基因组、表观基因组、蛋白质组、代谢组等多个层面,还涵盖了多组学整合及空间转录组学等领域。scRNA-seq技术解决了细胞异质性研究难题,为临床疾病尤其是肿瘤的个性化治疗开辟新路径,有力推动了精准医学发展。然而,它存在捕获效率低、数据噪声大等局限,数据分析方法也有待优化。其他单细胞组学技术,如单细胞全基因组测序(scWGS)、单细胞表观基因组测序、单细胞蛋白质组学和单细胞代谢组学技术,在各自研究方向意义重大,但面临数据丢失、技术复杂、通量低等挑战。多组学技术和空间转录组学技术虽为复杂生物过程研究提供更全面视角,但同样需克服技术和分析方法上的诸多困难。

展望未来,单细胞技术主要朝着提高单细胞分选效率和通量、增强测序覆盖度和灵敏度、实现高通量多组学研究以及开发更自动化的技术平台等方向发展。这些发展将降低单细胞技术的成本和技术门槛,推动其在科研和临床领域广泛应用。在科研方面,有助于深入探究细胞分化、发育和衰老等基本生物学过程的分子机制;在临床应用中,有望实现疾病早期诊断、个性化治疗方案制定及治疗效果实时监测。此外,单细胞技术与人工智能、基因编辑技术等新兴技术的融合,将为生命科学研究和医学实践带来更多突破与创新,对健康监测、疾病诊断和治疗产生深远影响。           

                  (点击阅读原文获取文献)                         
 
>>>👇👇👇关注,不迷路<<<
 
 
上海达澈生物科技有限公司,专注于生命科学和生命健康领域,致力于成为领先的产品和服务提供者。
我们的NGS产品线覆盖如下:
 
 
 
 
基因组:WGSCircle-seq(eccDNA);
转录组:mRNA、miRNA、lncRNA、circRNA、tRNA测序;
表观组:ATAC-seq,CUT&Tag、ChIP-seqWGBSDAP-seqTBSHi-C;
蛋白和RNA互作:RIP-seq和eCLIP-seq;
翻译组:Ribo-seq;
单细胞测序:scRNA-seq、scCUT&Tag、scATAC-seq、scV(D)J-seq;
空间表观转录组测序:Spatial RNA-seq 、Spatial ATAC-RNA-seq、Spatial CUT&Tag-RNA-seq;
RNA修饰类:m6A、m1A、m7G、m5C、ac4C、Ψ假尿嘧啶;
基因编辑脱靶检测:GUIDE-seq、CIRCLE-seq、dCas9-ChlP-seq、DISCOVER-seq等基于靶向测序的脱靶检测。