简介

时空转录组测序能够在指定的分辨率下揭示细胞间的异质性。差异表达分析用于识别在不同细胞群体或条件下表达显著变化的基因(Differential Expression Gene, DEG)。它同时为基因集富集分析蛋白互作网络分析公共数据库验证在内的多种下游分析提供基因集基础。

根据数据特性和分析目标,常用的差异分析方法主要分为两大类:单细胞水平方法pseudobulk方法

  • 单细胞水平方法(t-test、Wilcoxon、MAST):适用于没有生物学重复,关注细胞亚群间差异,或样本量有限的场景。

  • pseudobulk方法(DESeq2、edgeR):当有多个生物学重复时,可将同一组内细胞的表达量汇总(如求和或取均值),形成"伪体积"(pseudobulk)表达矩阵,再用bulk RNA-seq的差异分析方法(DESeq2、edgeR)进行分析,能更准确反映生物学变异,降低假阳性率。

模块算法整体介绍

分析模块
单片或多片
差异分析场景
可用的分析方法

DEG

单片

1-vs-1

t-test, wilcoxcon, MAST

DEG

单片

1-vs-n

t-test, wilcoxcon, MAST

DEG

没有生物学重复样本的多片

1-vs-1

t-test, wilcoxcon, MAST

DEG

没有生物学重复样本的多片

1-vs-n

t-test, wilcoxcon, MAST

DEG

有生物学重复样本的多片

1-vs-1

DESeq2, edgeR

DEG

有生物学重复样本的多片

1-vs-n

DESeq2

参考文献

  • Finak, G., McDavid, A., Yajima, M., Deng, J., Gersuk, V., Shalek, A. K., ... & Gottardo, R. (2015). MAST: a flexible statistical framework for assessing transcriptional changes and characterizing heterogeneity in single-cell RNA sequencing data. Genome biology, 16(1), 278.

  • Hao, Y., Stuart, T., Kowalski, M. H., Choudhary, S., Hoffman, P., Hartman, A., ... & Satija, R. (2024). Dictionary learning for integrative, multimodal and scalable single-cell analysis. Nature biotechnology, 42(2), 293-304.

  • Robinson, M. D., McCarthy, D. J., & Smyth, G. K. (2010). edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. bioinformatics, 26(1), 139-140.

  • Wolf, F. A., Angerer, P., & Theis, F. J. (2018). SCANPY: large-scale single-cell gene expression data analysis. Genome biology, 19(1), 15.

Last updated