概念

理解空间转录组分析。


什么是空间转录组?

空间转录组在保留组织中细胞物理位置的同时测量基因表达。与传统单细胞 RNA 测序不同,它告诉你细胞在哪里,而不只是表达什么。

关键洞见:位置很重要。肿瘤细胞的行为会随着其周围是免疫细胞还是成纤维细胞而改变。


核心分析类型

空间区域

作用:基于相似的基因表达模式对组织区域进行分组。

何时使用:预处理后的第一步。用于识别组织结构,如肿瘤区域、免疫浸润区或组织分层。

方法选择

数据类型

推荐方法

Visium + H&E 图像

SpaGCN(使用组织学图像)

高分辨率(Xenium、MERFISH)

STAGATE 或 GraphST

快速探索分析

Leiden 聚类


细胞类型注释 vs 去卷积

这两个概念常被混淆。区别如下:

注释

去卷积

输出

“这个 spot 是 T 细胞”

“这个 spot 中 T 细胞占 60%,巨噬细胞 30%,成纤维细胞 10%”

适用场景

单细胞分辨率数据

基于 spot 的数据(Visium)

假设

每个 spot 只有一种细胞类型

每个 spot 可能包含多种细胞类型

经验法则

  • Xenium、MERFISH、CosMx:用注释(单细胞分辨率)

  • Visium、Slide-seq:用去卷积(每个 spot 多细胞)


细胞通讯

作用:通过配体-受体相互作用识别哪些细胞类型在相互“对话”。

关键概念:细胞 A 表达配体(信号分子),细胞 B 表达受体;如果它们空间上足够接近,可能存在通讯。

物种很重要:请选择正确的数据库:

  • 人类:liana_resource="consensus"

  • 小鼠:liana_resource="mouseconsensus"


RNA Velocity(RNA 速度)

作用:通过比较 spliced 与 unspliced RNA 预测未来的细胞状态。

关键洞见:如果某基因的 unspliced RNA 更多,通常表示正在上调;如果 spliced 更多,表示正在下调。这反映了细胞变化的“方向”。

要求:数据中必须包含 splicedunspliced layers(来自 velocyto、kallisto 或 STARsolo)。


方法选择

去卷积方法

方法

速度

准确性

适用场景

FlashDeconv

良好

默认选择,快速探索

Cell2location

极佳

最终分析、用于发表

RCTD

良好

R 用户、批量处理

CARD

中等

良好

需要空间插补

准确性 vs 速度的权衡:探索阶段先用 FlashDeconv,出最终图时再用 Cell2location。


注释方法

方法

需要

最适合

Tangram

参考 scRNA-seq

当参考与组织匹配时最准确

scANVI

参考 scRNA-seq

大数据集且有 GPU

CellAssign

marker 基因列表

当你已知细胞类型 marker

mLLMCelltype

快速自动注释


空间统计

分析

回答的问题

Moran's I

“这个基因是否空间聚集?”(全局)

Local Moran's I

“聚集发生在哪里?”(局部热点)

Getis-Ord Gi*

“高/低表达热点在哪里?”

邻域富集

“这些细胞类型是否共定位?”

共现分析

“共定位如何随距离变化?”


结果解读

解读去卷积结果

好的去卷积结果通常表现为:

  • 每个 spot 的细胞类型比例之和约为 1.0

  • 能看到已知的组织结构(例如上皮 vs 基质)

  • 比例与组织学特征相关

警示信号:

  • 某一种细胞类型在几乎所有位置占主导(>80%)

  • 比例与预期组织组成不符

  • 不同方法得到的结果差异过大


解读空间统计结果

Moran's I 解释:

  • I > 0:聚集(相似值彼此相邻)

  • I ≈ 0:随机

  • I < 0:离散(不相似值彼此相邻)

p-value:检验该模式相对于随机是否显著。


常见坑

1. Skipping Preprocessing

很多分析失败是因为没有运行预处理。务必先预处理:

"Preprocess the data"

2. Wrong Species Parameter

细胞通讯分析需要正确的物种设置:

# Human data
species="human"

# Mouse data
species="mouse", liana_resource="mouseconsensus"

3. Expecting Single-Cell Resolution from Visium

Visium 的一个 spot 含 1–10 个细胞。请用去卷积估计比例,而不是用注释强行赋予单一类型。

4. Using GPU Methods Without GPU

像 Cell2location 这类方法在没有 GPU 时会慢 10–100 倍。你可以:

  • 显式设置 use_gpu=False

  • 使用更适合 CPU 的替代方案(FlashDeconv、RCTD)


工作流模式

标准探索工作流

Load → Preprocess → Domains → Markers → Visualize

适用于:新数据集的初步探索。

基于参考数据的工作流

Load spatial → Load reference → Preprocess both → Deconvolve → Communicate

适用于:你有匹配的单细胞参考数据时。

发表级工作流

Load → Preprocess → Domains → Deconvolve → Statistics → Communication → Velocity

适用于:面向发表的全面分析。


下一步