方法参考¶
全部 20 个 ChatSpatial 工具及其参数与选项。
快速索引¶
分类 |
工具 |
|---|---|
数据 |
|
空间 |
|
细胞 |
|
基因 |
|
动态 |
|
多样本 |
|
输出 |
|
数据管理¶
load_data¶
加载空间转录组数据。
参数 |
类型 |
说明 |
|---|---|---|
|
str |
文件或文件夹路径 |
|
str |
|
|
str |
可选的数据集名称 |
支持的格式:H5AD、10X Visium 文件夹、H5、MTX
preprocess_data¶
归一化、过滤并准备数据。
参数 |
默认值 |
说明 |
|---|---|---|
|
|
|
|
2000 |
高变基因数 |
|
30 |
主成分数 |
|
15 |
邻居图 |
|
1.0 |
Leiden 聚类 |
|
3 |
每个基因的最小细胞数 |
|
30 |
每个细胞的最小基因数 |
|
20.0 |
线粒体比例上限(%) |
|
False |
PCA 前缩放到单位方差 |
高级选项:
参数 |
默认值 |
说明 |
|---|---|---|
|
False |
启用 doublet 检测(适用于单细胞分辨率数据) |
|
None |
每个细胞的目标计数(None=中位数,1e4=Visium,1e6=MERFISH) |
|
True |
从高变基因中排除线粒体基因 |
|
|
用于批次感知归一化的 batch 列 |
compute_embeddings¶
计算降维结果与聚类。
参数 |
默认值 |
说明 |
|---|---|---|
|
True |
计算 PCA |
|
True |
计算 UMAP |
|
True |
Leiden 聚类 |
|
True |
空间图 |
|
30 |
主成分数 |
|
1.0 |
聚类分辨率 |
|
False |
若已存在则重新计算 |
export_data / reload_data¶
导出数据集以供外部脚本使用,并在修改后重新加载。
参数 |
默认值 |
说明 |
|---|---|---|
|
必填 |
数据集 ID |
|
auto |
自定义路径(默认: |
空间分析¶
analyze_spatial_statistics¶
分析空间模式与自相关。
参数 |
默认值 |
说明 |
|---|---|---|
|
|
见下方类型 |
|
None |
分组分析需要该参数 |
|
None |
指定要分析的基因 |
|
20 |
要分析的高变基因数量(未指定 genes 时) |
|
8 |
空间邻居数 |
分析类型:
类型 |
分类 |
需要 cluster_key |
|---|---|---|
|
基因 |
否 |
|
基因 |
否 |
|
基因 |
否 |
|
基因 |
否 |
|
基因 |
否 |
|
分组 |
是 |
|
分组 |
是 |
|
分组 |
是 |
|
分组 |
是 |
|
网络 |
可选 |
find_spatial_genes¶
识别空间变异基因。
参数 |
默认值 |
说明 |
|---|---|---|
|
|
|
|
None |
返回的基因数量(None=返回所有显著基因) |
identify_spatial_domains¶
识别组织区域与空间微环境。
参数 |
默认值 |
说明 |
|---|---|---|
|
|
|
|
7 |
期望的区域数量 |
|
0.5 |
聚类分辨率 |
细胞分析¶
annotate_cell_types¶
分配细胞类型。
参数 |
默认值 |
说明 |
|---|---|---|
|
|
见下方方法 |
|
None |
参考数据集(用于 label transfer 方法) |
|
None |
参考数据中的细胞类型列 |
|
None |
marker 字典(用于 CellAssign) |
方法:
Method |
需要参考数据 |
备注 |
|---|---|---|
|
是 |
空间映射 |
|
是 |
深度学习迁移 |
|
否 |
基于 marker |
|
否 |
自动(R) |
|
否 |
基于参考(R) |
|
否 |
基于 LLM |
deconvolve_data¶
估计每个 spot 的细胞类型比例。
参数 |
默认值 |
说明 |
|---|---|---|
|
|
见下方方法 |
|
必填 |
参考数据集 |
|
必填 |
参考数据中的细胞类型列 |
方法:
Method |
Speed |
GPU |
备注 |
|---|---|---|---|
|
快 |
否 |
默认,推荐 |
|
慢 |
是 |
高准确性 |
|
快 |
否 |
基于 R |
|
中等 |
是 |
scvi-tools |
|
慢 |
是 |
替代的深度学习方法 |
|
中等 |
是 |
空间映射 |
|
快 |
否 |
基于 R |
|
快 |
否 |
基于 R,含插补 |
analyze_cell_communication¶
分析配体-受体相互作用。
参数 |
默认值 |
说明 |
|---|---|---|
|
|
|
|
必填 |
|
|
必填 |
细胞类型列 |
|
|
配体-受体(LR)数据库(小鼠用 |
基因分析¶
find_markers¶
寻找差异表达基因。
参数 |
默认值 |
说明 |
|---|---|---|
|
必填 |
分组列 |
|
None |
第一组(None=每组 vs 其余) |
|
None |
第二组 |
|
|
|
|
50 |
每组 top 基因数 |
compare_conditions¶
比较实验条件(pseudobulk DESeq2)。
参数 |
默认值 |
说明 |
|---|---|---|
|
必填 |
条件列 |
|
必填 |
处理组 |
|
必填 |
对照组 |
|
必填 |
样本/患者列 |
|
None |
按细胞类型分层 |
|
50 |
Top 差异基因数 |
analyze_enrichment¶
基因集富集分析。
参数 |
默认值 |
说明 |
|---|---|---|
|
必填 |
|
|
|
|
|
|
见下方数据库 |
数据库:GO_Biological_Process、GO_Molecular_Function、KEGG_Pathways、Reactome_Pathways、MSigDB_Hallmark
动态¶
analyze_velocity_data¶
RNA velocity 分析。
参数 |
默认值 |
说明 |
|---|---|---|
|
|
|
|
|
|
需要:spliced 与 unspliced layers
analyze_trajectory_data¶
轨迹与伪时间推断。
参数 |
默认值 |
说明 |
|---|---|---|
|
|
|
|
None |
起始细胞 |
注意:CellRank 需要 velocity 数据
analyze_cnv¶
拷贝数变异(CNV)检测。
参数 |
默认值 |
说明 |
|---|---|---|
|
|
|
|
必填 |
细胞类型列 |
|
必填 |
正常细胞类型 |
多样本¶
integrate_samples¶
批次整合。
参数 |
默认值 |
说明 |
|---|---|---|
|
必填 |
数据集 ID 列表 |
|
|
|
|
|
批次列 |
register_spatial_data¶
对齐空间切片。
参数 |
默认值 |
说明 |
|---|---|---|
|
必填 |
源数据集 |
|
必填 |
目标数据集 |
|
|
|
可视化¶
visualize_data¶
生成所有类型的图。
参数 |
默认值 |
说明 |
|---|---|---|
|
|
见下方类型 |
|
None |
可视化子类型 |
|
None |
要展示的基因或列 |
|
|
|
|
None |
分组列 |
|
|
配色方案 |
|
300 |
分辨率 |
|
|
|
图形类型与子类型:
类型 |
子类型 |
用途 |
|---|---|---|
|
— |
在 spatial 或 UMAP 上展示基因/元数据 |
|
|
汇总表达 |
|
|
细胞比例 |
|
|
LR 相互作用 |
|
— |
空间 LR 配对 |
|
|
伪时间 |
|
|
RNA velocity |
|
|
空间统计 |
|
|
通路结果 |
|
|
CNV 结果 |
|
|
整合质控 |
GPU 加速¶
对以下方法设置 use_gpu=True:
分类 |
方法 |
|---|---|
预处理 |
scVI 归一化 |
注释 |
Tangram, scANVI |
去卷积 |
Cell2location, DestVI, Stereoscope, Tangram |
区域 |
STAGATE, GraphST |
速度 |
VeloVI |
整合 |
scVI |
CNV |
inferCNVpy |