单细胞分析FAQ汇总

测序饱和度取决于文库的复杂度和测序深度。不同的细胞类型有不同数量的RNA，因此最终文库中不同转录本的总数也不同(也称为文库复杂性)。随着测序深度的增加，可以检测到更多的基因，但根据细胞类型的不同，在不同的测序深度，这一过程会达到饱和相关服务:单细胞测序

1、使用cutoff值，识别高RNA含量的细胞；2、选择一组具有低UMI计数的barcode，表示“空 GEM”分区，建立背景模型。相关服务:单细胞测序

小提琴图反映了该cluster的细胞中，某一个基因的表达情况，及密度分布。小提琴图的最大宽度取决于给定cluster内基因在细胞内的表达丰度，与cluster内细胞数、cluster间细胞数差异无关；基因在cluster的大多数细胞表达为0，小提琴图的最大宽度在基因丰度为0时实现，这样高表达

各cluster中差异高表达的基因，UMI count＞1，log2foldchang＞0，p-value≤0.1。 p-value：基于负二项检验，p值表示的是差异显著性的度量，报告中显示的p值是经过多次Benjamini-Hochberg校正的。相关服务:单细胞测序

Graph-based是基于图的聚类算法，通过构建稀疏邻近的图，然后在图中寻找高度连接的Louvain算法。k值是细胞数量值取对数得到；在聚类的过程中，若cluster中没有差异基因，则会进行进一步的层次聚类，直到没有可以合并的cluster。可以理解为系统自动分群。相关服务:单细胞测序

k-means的算法是将数据构建k个子集，然后计算每个类的中心点，向中心点聚集，直到聚类结果不再变化时停止，可以理解为人为规定手动进行分群。分析流程默认K-means为10，最大可以做到50。相关服务:单细胞测序

10x的UMI是随机序列序列，V2试剂10bp，V3试剂12bp，因此存在4^10或4^12种可能性。以物种人为例，其参考基因组注射已经非常完善，总基因数不足4万，所以10x UMI的种类足以覆盖细胞中全部mRNA。相关服务:单细胞测序

理论上是可以的，但需要注意aggr不能矫正不同试剂带来的影响。对单细胞RNA-seq数据中的系统效应或批量效应进行归一化和校正是目前比较活跃的研究领域，目前10x 还没有一个具体的建议。从文献中可以看出，R中有许多包，比如Seurat、scran和scone，试图解决这些问题。相关服务:单细

推荐使用手肘法(SSE)与轮廓系数法(Silhouette Coefficient)结合，判断最优K值。相关服务:单细胞测序

不需要。10x 也不建议如此相关服务:单细胞测序

12 13 14 15 16

提交需求

How to order?