monocle3算法

用途

利用monocle3 算法对空间转录组和单细胞数据进行轨迹推断,自动输出多种轨迹相关结果。

运行方式

  • 使用细胞注释后的h5ad,准备rds文件

SDAS dataProcess h5ad2rds -i st.h5ad -o outdir 
  • 运行monocle3

SDAS trajectory monocle3 -i st.rds -o outdir --root_key anno_spotlight --root CAF_DES \
--gene_symbol_key real_gene_name \
--batch_key sampleID

输入参数说明

参数
是否必须
默认值
描述

-i / --input

rds文件,要求有原始表达矩阵

-o / --output

输出文件夹

--root_key

meta.data中根节点所在的列名称

--root

设置为根节点的名称

--assay

rds文件中用于分析的assay名称,若不设置则用当前默认assay

--gene_symbol_key

real_gene_name

rds文件中基因名(symbol)的列名(meta.features),_index 表示用矩阵的列名

--batch_key

进行批次校正的meta.data列名,不输入则不做去批次

--resolution

leiden聚类的resolution参数,不输入则算法会自适配

--use_existing_umap_cluster

使用rds已有的umap和cluster信息

--umap_key

umap

输入rds存储umap信息的名称

--cluster_key

leiden

输入rds存储cluster信息的名称

--deg

分析随拟时序变化的差异基因则输入”--deg”

--n_cpus

8

多线程数

--top_gene_num

5

随拟时序变化的top差异基因数目的表达图

--gene_file

自定义基因列表文件路径,画基因随拟时序变化的表达趋势图

--gene_color_label

pseudotime

基因图展示的列的名称

--pval_cutoff

0.05

差异基因筛选p值

--qval_cutoff

0.05

差异基因筛选q值

--seed

42

随机种子

输出结果展示

结果文件
描述

<input_name>_dimension.png/pdf

降维图,展示细胞在低维空间的分布结构

<input_name>_dimension_color_by_batch.png/pdf

以批次信息展示的降维图(有做批次校正时输出),用于评估批次效应

<input_name>_cluster.png/pdf

聚类图,展示细胞聚类分布情况

<input_name>_roots.png/pdf

root图,显示轨迹分析的根节点位置

<input_name>_pseudotime.png/pdf

拟时序图,展示细胞的拟时序分布

<input_name>_top_genes_in_pseudotime.png/pdf

拟时序变化的top基因表达趋势图

<input_name>_custom_genes_in_pseudotime.png/pdf

拟时序变化的自定义基因表达趋势图

<input_name>_monocle3.rds

包含轨迹分析结果的rds文件

<input_name>_pseudotime.csv

细胞的拟时序结果,记录每个细胞的拟时序值

<input_name>_deg_trajectory.xls

随拟时序变化的所有基因的结果

  • 降维图<input_name>_dimension.png/pdf 展示细胞在低维空间的分布结构,反映整体异质性和分群结构

  • 聚类图<input_name>_cluster.png/pdf 展示细胞聚类分布,反映整体异质性和分群结构

  • root图<input_name>_roots.png/pdf 展示轨迹分析的根节点,标记轨迹推断的起始点(根节点),用于后续拟时序排序

  • 拟时序图<input_name>_pseudotime.png/pdf 展示细胞拟时序分布,细胞按推断的发育/转化顺序着色,反映动态变化过程

  • 拟时序变化的top基因表达趋势图<input_name>_top_genes_in_pseudotime.png/pdf 展示拟时序变化最显著的top基因表达趋势

  • 拟时序变化的自定义基因表达趋势图<input_name>_custom_genes_in_pseudotime.png/pdf 展示用户指定基因在拟时序过程中的基因表达趋势

调参建议

monocle3的轨迹分析一般需以细胞亚型精准注释为前提。通过亚型划分,算法可排除无关细胞干扰,聚焦于具有发育连续性的细胞群体,从而推断符合生物学逻辑的分化路径。实际分析中,推荐选取特定细胞群体,不要使用全片进行分析,同时可降低运行时间和内存。

Last updated