# SPOTlight算法

## 用途

使用SPOTlight做解卷积细胞注释

## 运行方式

```bash
SDAS cellAnnotation spotlight -i st.h5ad -o outdir --reference sc.h5ad --bin_size 20 --label_key annotation2 \ 
--input_gene_symbol_key _index
```

## 输入参数说明

| 参数                         | 是否必须  | 默认值              | 描述                                                              |
| -------------------------- | ----- | ---------------- | --------------------------------------------------------------- |
| **-i / --input**           | **是** |                  | Stereo-seq h5ad，要求有原始表达矩阵                                       |
| **-o / --output**          | **是** |                  | 输出文件夹                                                           |
| **--reference**            | **是** |                  | 单细胞ref h5ad，要求有原始表达矩阵                                           |
| **--label\_key**           | **是** |                  | 单细胞ref h5ad.obs中表示细胞类型的列的名称                                     |
| **--bin\_size**            | **是** |                  | Bin大小，用于控制图中点的大小，不用于计算,比如20,50,100, cellbin (等效于20)             |
| --input\_layer             | 否     |                  | Stereo-seq h5ad存放raw counts的layer                               |
| --ref\_layer               | 否     |                  | 单细胞ref h5ad存放raw counts的layer                                   |
| --input\_gene\_symbol\_key | 否     | real\_gene\_name | Stereo-seq h5ad.var中表示基因名(symbol)的列的名称                          |
| --ref\_gene\_symbol\_key   | 否     | \_index          | 单细胞ref h5ad.var中表示基因名(symbol)的列的名称 (\_index 表示使用h5ad.var.index) |
| --slice\_key               | 否     | sampleID         | 多片h5ad.obs中表示片编号的列的名称，用于画图                                      |
| --filter\_rare\_cell       | 否     | 100              | 如果某些细胞类型在单细胞ref中细胞数小于此值，则过滤掉这些细胞类型                              |
| --n\_cells                 | 否     | 100              | 单细胞ref中每个细胞类型随机选取的细胞数，用于训练spotlight模型                           |
| --n\_hvg                   | 否     | 3000             | 单细胞ref中的高变基因个数，高变基因和marker基因共同作为基因集                             |
| --auc\_threshold           | 否     | 0.5              | 用于过滤单细胞ref中每个细胞类型marker基因的AUC阈值，高变基因和marker基因共同作为基因集            |
| --norm\_sc                 | 否     | False            | 是否用logNormCounts函数处理单细胞ref数据                                    |
| --norm\_sp                 | 否     | False            | 是否用logNormCounts函数处理Stereo-seq数据                                |
| --seed                     | 否     | 42               | 指定随机种子                                                          |
| --n\_threads               | 否     | 8                | 使用的线程数                                                          |

## 输出结果展示

<table><thead><tr><th width="358.0001220703125">结果文件</th><th>描述</th></tr></thead><tbody><tr><td><code>&#x3C;input_name>_anno_spotlight.csv</code></td><td>每个spot的注释结果，包括每种细胞类型的分数</td></tr><tr><td><code>&#x3C;input_name>_anno_spotlight.h5ad</code></td><td>输入h5ad+注释结果。每个细胞类型的分数存在obsm['anno_score_spotlight']中，分数最高的类型存在obs['anno_spotlight']中</td></tr><tr><td><code>&#x3C;input_name>_anno_spotlight.png/pdf</code></td><td>总体注释结果图，多片情况下每片画一张图，同时输出png和pdf</td></tr><tr><td><code>&#x3C;input_name>_anno_spotlight_split.png/pdf</code></td><td>每个细胞类型分开展示图，多片情况下每片画一张图，同时输出png和pdf</td></tr><tr><td><code>&#x3C;input_name>_anno_score_spotlight.png/pdf</code></td><td>每个细胞类型的分数图，多片情况下每片画一张图，同时输出png和pdf</td></tr></tbody></table>

详细说明与具体结果展示可参考以下[链接](https://mysite.gitbook.io/sdas_manual_cn/readme/04_manual/03_cell2location/02_anno#shu-chu-jie-guo-zhan-shi)。(cell2location算法-->细胞注释-->输出结果展示)。
