# Hotspot算法

## 用途

使用Hotspot算法进行空间基因共表达基因集识别

## 运行方式

```bash
SDAS coexpress hotspot -i st.h5ad -o outdir --bin_size 100 \
--layer raw_counts \
--selected_genes top5000 \ 
--moran_path ./moran.csv \
--n_cpus 8 \
--seed 42  \
--fdr_cutoff 0.05 \
--model bernoulli
```

## 输入参数说明

| 参数                | 是否必须  | 默认值     | 描述                                                     |
| ----------------- | ----- | ------- | ------------------------------------------------------ |
| **-i / --input**  | **是** |         | Stereo-seq h5ad，要求有原始表达矩阵                              |
| **-o / --output** | **是** |         | 输出文件夹                                                  |
| **--bin\_size**   | **是** | 50      | 分辨率Bin大小（20, 50, 100, 200, cellbin），与输入h5ad一致，画图与计算均需要 |
| --layer           | 否     |         | 指定h5ad中原始表达矩阵的layer层 （例如layers\[‘raw\_counts’]         |
| --selected\_genes | 否     | top5000 | 基因列表（topn高变基因, full全部基因）                               |
| --moran\_path     | 否     |         | 已计算好的基因莫兰指数列表路径                                        |
| --n\_cpus         | 否     | 8       | 并行计算进程数                                                |
| --seed            | 否     | 42      | 随机种子                                                   |
| --fdr\_cutoff     | 否     | 0.05    | 统计检验空间高变基因与共表达基因集的FDR矫正阈值                              |
| --model           | 否     | normal  | 统计检验假设（normal, bernoulli, danb, none）                  |

## 输出结果展示

| 结果文件                                                | 描述                                                        |
| --------------------------------------------------- | --------------------------------------------------------- |
| `<input_name>_hotspot.module.csv`                   | 空间高变基因（gene symbol+gene id）对应的共表达基因集（module）的共表达基因集的结果csv |
| `<input_name>_hotspot.h5ad`                         | 含有共表达基因集结果的h5ad文件（adata.obsm\[‘module\_score\_hotspot’])  |
| `<input_name>_hotspot_module_score_hotspot.png/pdf` | 共表达基因集的基因集打分空间热图                                          |
| `<input_name>_hotspot.all_coex_heatmap.png/pdf`     | 共表达基因集的相似性热图                                              |
| `<input_name>_hotspot.moran.csv`                    | 如果使用topn计算，输出全部基因的莫兰指数以及P值                                |

* **共表达基因集的结果csv**：`<input_name>_hotspot.module.csv`，以逗号分隔。Hotspot识别的空间高变基因对应的共表达基因集（module）

| geneid          | real\_gene\_name | FDR | Module   |
| --------------- | ---------------- | --- | -------- |
| ENSG00000163209 | SPRR3            | 0.0 | Module-1 |
| ENSG00000151632 | AKR1C2           | 0.0 | Module-1 |
| ENSG00000170345 | FOS              | 0.0 | Module-1 |
| ENSG00000164433 | FABP5            | 0.0 | Module-1 |
| ENSG00000120129 | DUSP1            | 0.0 | Module-1 |

* **共表达基因集的基因集打分空间热图**`<input_name>_hotspot_module_score_hotspot.png/pdf`：可视化所有共表达基因集（Module）的空间分布模式。图中颜色强度表示共表达基因集表达量的高低

<figure><img src="https://2512275466-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FaaKaKxoqTIFT7FAUUQFl%2Fuploads%2FvYYzVAs99FIeBo3JK1f1%2F%E5%85%B1%E8%A1%A8%E8%BE%BE%E5%9F%BA%E5%9B%A0%E9%9B%86%E7%9A%84%E5%9F%BA%E5%9B%A0%E9%9B%86%E6%89%93%E5%88%86%E7%A9%BA%E9%97%B4%E7%83%AD%E5%9B%BE.png?alt=media&#x26;token=4c7bc3d9-9244-40fe-99cb-f28080420ef1" alt=""><figcaption></figcaption></figure>

* **共表达基因集的相似性热图**`<input_name>_hotspot.all_coex_heatmap.png/pdf`：展示不同共表达基因集（Module）之间的相似性聚类关系。图中颜色表示不同共表达基因集的相似度，红色为高度相似

<figure><img src="https://2512275466-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FaaKaKxoqTIFT7FAUUQFl%2Fuploads%2FiApTJ5vUKp2aQGUw55po%2F%E5%85%B1%E8%A1%A8%E8%BE%BE%E5%9F%BA%E5%9B%A0%E9%9B%86%E7%9A%84%E7%9B%B8%E4%BC%BC%E6%80%A7%E7%83%AD%E5%9B%BE.png?alt=media&#x26;token=23728f68-3950-4a47-81b7-9805960ddd05" alt="" width="375"><figcaption></figcaption></figure>

## 结果解读说明

* 共表达基因集从Module1开始，Module-1/没有Module为不符合共表达基因集聚类要求的基因。

## 调参建议

* 若样本bin20/50基因数低于200，或其他特殊样本，识别的空间高变基因/共表达基因集较少，建议将`model`参数从normal改为bernoulli，并将`fdr_cutoff`设置为0.05。
