概念¶
理解空间转录组分析。
什么是空间转录组?¶
空间转录组在保留组织中细胞物理位置的同时测量基因表达。与传统单细胞 RNA 测序不同,它告诉你细胞在哪里,而不只是表达什么。
关键洞见:位置很重要。肿瘤细胞的行为会随着其周围是免疫细胞还是成纤维细胞而改变。
核心分析类型¶
空间区域¶
作用:基于相似的基因表达模式对组织区域进行分组。
何时使用:预处理后的第一步。用于识别组织结构,如肿瘤区域、免疫浸润区或组织分层。
方法选择:
数据类型 |
推荐方法 |
|---|---|
Visium + H&E 图像 |
SpaGCN(使用组织学图像) |
高分辨率(Xenium、MERFISH) |
STAGATE 或 GraphST |
快速探索分析 |
Leiden 聚类 |
细胞类型注释 vs 去卷积¶
这两个概念常被混淆。区别如下:
注释 |
去卷积 |
|
|---|---|---|
输出 |
“这个 spot 是 T 细胞” |
“这个 spot 中 T 细胞占 60%,巨噬细胞 30%,成纤维细胞 10%” |
适用场景 |
单细胞分辨率数据 |
基于 spot 的数据(Visium) |
假设 |
每个 spot 只有一种细胞类型 |
每个 spot 可能包含多种细胞类型 |
经验法则:
Xenium、MERFISH、CosMx:用注释(单细胞分辨率)
Visium、Slide-seq:用去卷积(每个 spot 多细胞)
细胞通讯¶
作用:通过配体-受体相互作用识别哪些细胞类型在相互“对话”。
关键概念:细胞 A 表达配体(信号分子),细胞 B 表达受体;如果它们空间上足够接近,可能存在通讯。
物种很重要:请选择正确的数据库:
人类:
liana_resource="consensus"小鼠:
liana_resource="mouseconsensus"
RNA Velocity(RNA 速度)¶
作用:通过比较 spliced 与 unspliced RNA 预测未来的细胞状态。
关键洞见:如果某基因的 unspliced RNA 更多,通常表示正在上调;如果 spliced 更多,表示正在下调。这反映了细胞变化的“方向”。
要求:数据中必须包含 spliced 与 unspliced layers(来自 velocyto、kallisto 或 STARsolo)。
方法选择¶
去卷积方法¶
方法 |
速度 |
准确性 |
适用场景 |
|---|---|---|---|
FlashDeconv |
快 |
良好 |
默认选择,快速探索 |
Cell2location |
慢 |
极佳 |
最终分析、用于发表 |
RCTD |
快 |
良好 |
R 用户、批量处理 |
CARD |
中等 |
良好 |
需要空间插补 |
准确性 vs 速度的权衡:探索阶段先用 FlashDeconv,出最终图时再用 Cell2location。
注释方法¶
方法 |
需要 |
最适合 |
|---|---|---|
Tangram |
参考 scRNA-seq |
当参考与组织匹配时最准确 |
scANVI |
参考 scRNA-seq |
大数据集且有 GPU |
CellAssign |
marker 基因列表 |
当你已知细胞类型 marker |
mLLMCelltype |
无 |
快速自动注释 |
空间统计¶
分析 |
回答的问题 |
|---|---|
Moran's I |
“这个基因是否空间聚集?”(全局) |
Local Moran's I |
“聚集发生在哪里?”(局部热点) |
Getis-Ord Gi* |
“高/低表达热点在哪里?” |
邻域富集 |
“这些细胞类型是否共定位?” |
共现分析 |
“共定位如何随距离变化?” |
结果解读¶
解读去卷积结果¶
好的去卷积结果通常表现为:
每个 spot 的细胞类型比例之和约为 1.0
能看到已知的组织结构(例如上皮 vs 基质)
比例与组织学特征相关
警示信号:
某一种细胞类型在几乎所有位置占主导(>80%)
比例与预期组织组成不符
不同方法得到的结果差异过大
解读空间统计结果¶
Moran's I 解释:
I > 0:聚集(相似值彼此相邻)
I ≈ 0:随机
I < 0:离散(不相似值彼此相邻)
p-value:检验该模式相对于随机是否显著。
常见坑¶
1. Skipping Preprocessing¶
很多分析失败是因为没有运行预处理。务必先预处理:
"Preprocess the data"
2. Wrong Species Parameter¶
细胞通讯分析需要正确的物种设置:
# Human data
species="human"
# Mouse data
species="mouse", liana_resource="mouseconsensus"
3. Expecting Single-Cell Resolution from Visium¶
Visium 的一个 spot 含 1–10 个细胞。请用去卷积估计比例,而不是用注释强行赋予单一类型。
4. Using GPU Methods Without GPU¶
像 Cell2location 这类方法在没有 GPU 时会慢 10–100 倍。你可以:
显式设置
use_gpu=False使用更适合 CPU 的替代方案(FlashDeconv、RCTD)
工作流模式¶
标准探索工作流¶
Load → Preprocess → Domains → Markers → Visualize
适用于:新数据集的初步探索。
基于参考数据的工作流¶
Load spatial → Load reference → Preprocess both → Deconvolve → Communicate
适用于:你有匹配的单细胞参考数据时。
发表级工作流¶
Load → Preprocess → Domains → Deconvolve → Statistics → Communication → Velocity
适用于:面向发表的全面分析。