# monocle3算法

## 用途

利用monocle3 算法对空间转录组和单细胞数据进行轨迹推断，自动输出多种轨迹相关结果。

## 运行方式

* **使用细胞注释后的h5ad，准备rds文件**

```bash
SDAS dataProcess h5ad2rds -i st.h5ad -o outdir 
```

* **运行monocle3**

```bash
SDAS trajectory monocle3 -i st.rds -o outdir --root_key anno_spotlight --root CAF_DES \
--gene_symbol_key real_gene_name \
--batch_key sampleID
```

## 输入参数说明

| 参数                             | 是否必须  | 默认值              | 描述                                                   |
| ------------------------------ | ----- | ---------------- | ---------------------------------------------------- |
| **-i / --input**               | **是** |                  | rds文件，要求有原始表达矩阵                                      |
| **-o / --output**              | **是** |                  | 输出文件夹                                                |
| **--root\_key**                | **是** |                  | meta.data中根节点所在的列名称                                  |
| **--root**                     | **是** |                  | 设置为根节点的名称                                            |
| --assay                        | 否     |                  | rds文件中用于分析的assay名称，若不设置则用当前默认assay                   |
| --gene\_symbol\_key            | 否     | real\_gene\_name | rds文件中基因名(symbol)的列名（meta.features），\_index 表示用矩阵的列名 |
| --batch\_key                   | 否     |                  | 进行批次校正的meta.data列名，不输入则不做去批次                         |
| --resolution                   | 否     |                  | leiden聚类的resolution参数，不输入则算法会自适配                     |
| --use\_existing\_umap\_cluster | 否     |                  | 使用rds已有的umap和cluster信息                               |
| --umap\_key                    | 否     | umap             | 输入rds存储umap信息的名称                                     |
| --cluster\_key                 | 否     | leiden           | 输入rds存储cluster信息的名称                                  |
| --deg                          | 否     |                  | 分析随拟时序变化的差异基因则输入”--deg”                              |
| --n\_cpus                      | 否     | 8                | 多线程数                                                 |
| --top\_gene\_num               | 否     | 5                | 随拟时序变化的top差异基因数目的表达图                                 |
| --gene\_file                   | 否     |                  | 自定义基因列表文件路径，画基因随拟时序变化的表达趋势图                          |
| --gene\_color\_label           | 否     | pseudotime       | 基因图展示的列的名称                                           |
| --pval\_cutoff                 | 否     | 0.05             | 差异基因筛选p值                                             |
| --qval\_cutoff                 | 否     | 0.05             | 差异基因筛选q值                                             |
| --seed                         | 否     | 42               | 随机种子                                                 |

## 输出结果展示

| 结果文件                                              | 描述                              |
| ------------------------------------------------- | ------------------------------- |
| `<input_name>_dimension.png/pdf`                  | 降维图，展示细胞在低维空间的分布结构              |
| `<input_name>_dimension_color_by_batch.png/pdf`   | 以批次信息展示的降维图（有做批次校正时输出），用于评估批次效应 |
| `<input_name>_cluster.png/pdf`                    | 聚类图，展示细胞聚类分布情况                  |
| `<input_name>_roots.png/pdf`                      | root图，显示轨迹分析的根节点位置              |
| `<input_name>_pseudotime.png/pdf`                 | 拟时序图，展示细胞的拟时序分布                 |
| `<input_name>_top_genes_in_pseudotime.png/pdf`    | 拟时序变化的top基因表达趋势图                |
| `<input_name>_custom_genes_in_pseudotime.png/pdf` | 拟时序变化的自定义基因表达趋势图                |
| `<input_name>_monocle3.rds`                       | 包含轨迹分析结果的rds文件                  |
| `<input_name>_pseudotime.csv`                     | 细胞的拟时序结果，记录每个细胞的拟时序值            |
| `<input_name>_deg_trajectory.xls`                 | 随拟时序变化的所有基因的结果                  |

* **降维图**：`<input_name>_dimension.png/pdf` 展示细胞在低维空间的分布结构,反映整体异质性和分群结构

<figure><img src="/files/poqY9ialqDe22kdOMnFh" alt="" width="375"><figcaption></figcaption></figure>

* **聚类图**：`<input_name>_cluster.png/pdf` 展示细胞聚类分布，反映整体异质性和分群结构

<figure><img src="/files/tn9sLCDR1dkYG2zIoGWg" alt="" width="375"><figcaption></figcaption></figure>

* **root图**：`<input_name>_roots.png/pdf` 展示轨迹分析的根节点，标记轨迹推断的起始点（根节点），用于后续拟时序排序

<figure><img src="/files/NaNGh56QoAlXFCVmXX1U" alt="" width="375"><figcaption></figcaption></figure>

* **拟时序图**：`<input_name>_pseudotime.png/pdf` 展示细胞拟时序分布,细胞按推断的发育/转化顺序着色，反映动态变化过程

<figure><img src="/files/jNIS3H6d7ofT0K30KH7E" alt="" width="375"><figcaption></figcaption></figure>

* **拟时序变化的top基因表达趋势图**：`<input_name>_top_genes_in_pseudotime.png/pdf` 展示拟时序变化最显著的top基因表达趋势

<figure><img src="/files/lUVm3zBO7SHTm0H1b1wB" alt="" width="375"><figcaption></figcaption></figure>

* **拟时序变化的自定义基因表达趋势图**：`<input_name>_custom_genes_in_pseudotime.png/pdf` 展示用户指定基因在拟时序过程中的基因表达趋势

<figure><img src="/files/lUVm3zBO7SHTm0H1b1wB" alt="" width="375"><figcaption></figcaption></figure>

## 调参建议

monocle3的轨迹分析一般需以细胞亚型精准注释为前提。通过亚型划分，算法可排除无关细胞干扰，聚焦于具有发育连续性的细胞群体，从而推断符合生物学逻辑的分化路径。**实际分析中，推荐选取特定细胞群体，不要使用全片进行分析，同时可降低运行时间和内存。**


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://mysite.gitbook.io/sdas_manual_cn/readme/04_manual/trajectory/03_monocle3.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
