运行命令说明
用途与运行方式
mergeAdata: 多片h5ad合并
将多个h5ad文件合并为一个h5ad文件
SDAS dataProcess mergeAdata -i mult.csv -o outdirh5ad2rds: h5ad转rds
将h5ad格式数据转换为rds格式
SDAS dataProcess h5ad2rds -i st.h5ad --run_mode stRNA -o outdirh5mu2h5ad: h5mu转h5ad
将h5mu格式数据转换为h5ad格式
SDAS dataProcess h5mu2h5ad -i st.h5mu -o outdirprintAdataInfo: 打印adata信息
输出h5ad文件的详细信息到shell或指定目录
SDAS dataProcess printAdataInfo -i st.h5ad -o outdir
SDAS dataProcess printAdataInfo -i st.h5ad subsetAdata: h5ad子集提取
根据指定条件提取h5ad的子集,支持数值区间或列表筛选
数值筛选:
列表筛选:
输入参数说明
-i / --input
是
输入文件,支持h5ad、h5mu、csv(mergeAdata进行多片合并时,输入为csv,首行为表头)
--label_key
是
subsetAdata时使用,提取adata子集指定的obs或者var的列名
-o / --output
否
输出文件夹,printAdataInfo不加-o时,将adata信息输出到shell
--run_mode
否
h5ad2rds时使用,输入数据类型,stRNA或scRNA,默认为stRNA
--gene_symbol_key
否
mergeAdata时使用,指定h5ad.var中基因名的列名(_index表示用h5ad.var.index)
--layer
否
h5ad2rds和subsetAdata时使用,指定h5ad存储raw counts的layer层
--list_include
否
subsetAdata时使用,label_key为列表时需提取的元素,如Fibroblast,B,NK
--list_exclude
否
subsetAdata时使用,label_key为列表时不需提取的元素
--min
否
subsetAdata时使用,label_key为数值时的最小值
--max
否
subsetAdata时使用,label_key为数值时的最大值
输出结果展示
<input_name>.h5ad
h5mu转换的h5ad
<input_name>_subset.h5ad
subsetAdata得到的子集h5ad
combine.h5ad
多片合并后的h5ad
<input_name>.rds
h5ad转换的rds文件
<input_name>_adata_info.txt
adata的详细信息
adata的详细信息
<input_name>_adata_info.txt该文件用于快速了解AnnData对象的结构、包含哪些主要信息,以及标签的分布情况。文件主要输出以下几类信息:AnnData对象的基本维度(观测数n_obs × 特征数n_vars)
obs(观测/样本)和var(特征/基因)包含的字段名称
uns、obsm、layers、obsp等存储的分析结果或元数据类型
obs和var的列数统计, obs_names和var_names的前5个值
obs中每个分类字段的唯一值数量和具体取值(如leiden聚类标签、样本信息等)
Last updated