发布日期:2025-12-22 17:25 点击次数:84

图片国产美女在线A片
序言Hello小伙伴们环球好,我是生信手段树的小学徒”我才不吃蛋黄“。连着三天手术日,拖更了一天。神话生信夜班侠在执行室被背刺(血浆和肿瘤组织的多组学分析揭示了三阴性乳腺癌抗PD-L1免疫诊治的中枢卵白),见了见世面,深感轸恤。夜班侠是刚从临床到执行室,我是刚从执行室莅临床。我相比走时,来到了一个谐和的科室和一个歧视超等好的组,免去了许多东说念主际上的短长。然则在临床上,你还会面对其他各式问题。各式辛酸,逐步说念来,加油吧,东北老铁!!!加油吧,诸位执行室和临床的同(niu)行(ma)!!!
那么,要如何从一堆 HTML 标签文本中挖出自己想要的数据呢?
好了,黑货夹带收尾,开动参预正题。
今天是肺腺癌单细胞数据集GSE189357复现系列第二期。第一期咱们走了Seurat V5标准经由,阁下harmony整合去批次后,按标准经由进行了降维聚类分群。本期,咱们将在第一期基础上选定符合的差别率,对细胞亚群进行看重。
1.配景先容细胞看重是单细胞分析的魂,是一切分析的基石,咱们后续的总计分析齐是围绕细胞亚群张开的。然则岂论是关于生手已经老手来说,细胞看重齐充满了用功与挑战。
为什么说细胞看重难,个东说念主合计有以下几点:
一是看重的范例多:咱们不错使用SingleR、Cellassign等器具,这些器具不错通过相比未知样本与已知细胞类型的参考数据集来自动看重细胞类型。也不错进行手动看重,基于Marker基因的看重:通过识别特定细胞类型的标记基因(Marker genes)来手动看重细胞类型;基于数据库的看重:阁下如CellMarker、PanglaoDB、CancerSEA等数据库,这些数据库提供了不同细胞类型的标记基因联接。
二是准确度不好把控:单细胞细胞看重的准确度受多种要素影响,包括数据质地、分析范例、使用的标记基因(marker genes)数据库、以及商议东说念主员的专科学问等。影响要素变量多,准确度就难以把控。
三是无法定名的细胞的搞定问题:在单细胞测序数据分析中,有技能会遭受无法径直定名的细胞群体,这可能是因为这些细胞群体是新的或未知的细胞类型,未必是由于数据的复杂性导致的。搞定无法定名的细胞群体是一个复杂的过程,时时需要多方面的分析和考据。在某些情况下,这些细胞群体可能代表了新的细胞类型,其发现可能对科学范围有遑急的孝敬,而生手(致使是老手)时时可能会径直把这一部分细胞忽略未必过滤掉。
四是亚群看重定名的些许问题:亚群看重定名神志有许多,当今枯竭结伙的表率。细胞具有各样性,同期,由于咱们对细胞类型的意志仍相对处于相对低级阶段,因此准确的亚群看重仍说念阻且长。
五是莫得参考数据库奈何看重:举例生僻肿瘤、新测组织类型、新物种等等。
六是比例较低的细胞类型的看重问题:质控严格与否?
2.细胞看重常见的分群细胞过甚Maker:
# T Cells (CD3D, CD3E, CD8A), # B cells (CD19, CD79A, MS4A1 [CD20]), # Plasma cells (IGHG1, MZB1, SDC1, CD79A), # macrophages (CD68, CD163),# 'CCL3L1' , #M2# 'FABP4', #M1# Monocytes (CD14),# NK Cells (FGFBP2, FCG3RA, CX3CR1), # Photoreceptor cells (RCVRN), # Fibroblasts (FGF7, MME), # Neutrophil ('G0S2', 'S100A9','S100A8','CXCL8')# Endothelial cells (PECAM1, VWF). # epi or tumor (EPCAM, KRT19, PROM1, ALDH1A1, CD24).# immune (CD45+,PTPRC), epithelial/cancer (EpCAM+,EPCAM), # stromal (CD10+,MME,fibo or CD31+,PECAM1,endo) 时时咱们第一档次降维聚类分群,不错将细胞分为三大类,包括:
immune (CD45+,PTPRC),epithelial/cancer (EpCAM+,EPCAM),stromal (CD10+,MME,fibro or CD31+,PECAM1,endo)原文中提供的齐是常见的细胞群:上皮细胞(EPCAM、KRT19、CLDN4)、基质(PECAM1、CLO1A2、VWF)、增殖性(MKI67、STMN1、PCNA)、T(CD3D、CD3E、CD2)、B(CD79A,IGHG1,MS4A1),NK(KLRD1、GNLY、KLRF1)和髓系(CSF1R、CSF3R、CD68)细胞。
座谈少说,开动今天的代码运行:
2.1 率先加载R资源和单细胞数据,并建树差别率:rm(list=ls())source('scRNA_scripts/lib.R')source('scRNA_scripts/mycolors.R')sce.all.int = readRDS('2-harmony/sce.all_int.rds') sel.clust = "RNA_snn_res.0.5"sce.all.int <- SetIdent(sce.all.int, value = sel.clust)table(sce.all.int@active.ident) colnames(sce.all.int@meta.data) 2.2 创建新的文献夹,建树需要可视化的Maker,绘图分群气泡图:dir.create("./3-Celltype")setwd("./3-Celltype")scRNA=sce.all.intgenes_to_check = c('EPCAM','KRT19','CLDN4','SCGB1A1', #上皮 'PECAM1' , 'CLO1A2', 'VWF', #基质 'CDH5', 'PECAM1', 'VWF','CLDN5', #内皮 'LUM' , 'FGF7', 'MME', #成纤维 'CD3D', 'CD3E', 'CD8A', 'CD4','CD2', #T 'AIF1', 'C1QC','C1QB','LYZ', #巨噬 'MKI67', 'STMN1', 'PCNA', #增殖 'CPA3' ,'CST3', 'KIT', 'TPSAB1','TPSB2',#魁梧 'GOS2', 'S100A9','S100A8','CXCL8', #中性粒细胞 'KLRD1', 'GNLY', 'KLRF1','AREG', 'XCL2','HSPA6', #NK 'MS4A1','CD19', 'CD79A','IGHG1','MZB1', 'SDC1', #B 'IGHD', #MALT B 'CSF1R', 'CSF3R', 'CD68') #髓系library(stringr) genes_to_check=str_to_upper(genes_to_check)genes_to_checkp = DotPlot(scRNA, features = unique(genes_to_check), assay='RNA' ) + coord_flip()p#ggsave('check_last_markers.pdf',height = 11,width = 11)图片
2.3 望望选定的resolution的umap散播情况####构建左下角坐标轴source('../scRNA_scripts/Bottom_left_axis.R')result <- left_axes(scRNA)axes <- result$axeslabel <- result$labelumap =DimPlot(scRNA, reduction = "umap",cols = my36colors,pt.size = 0.8, group.by = "RNA_snn_res.0.5",label = T,label.box = T) + NoAxes() + theme(aspect.ratio = 1) + geom_line(data = axes, aes(x = x,y = y,group = group), arrow = arrow(length = unit(0.1, "inches"), ends="last", type="closed")) + geom_text(data = label, aes(x = x,y = y,angle = angle,label = lab),fontface = 'italic')+ theme(plot.title = element_blank())umapggsave('RNA_snn_res.0.5_umap.pdf',width = 9,height = 7)图片
2.4 望望样天职组的umap##图中的标签和方框齐是不错自界说的,举例底下这副删掉label和label.boxsample_umap =DimPlot(scRNA, reduction = "umap",cols = my36colors,pt.size = 0.8, group.by = "sample") + NoAxes() + theme(aspect.ratio = 1) + geom_line(data = axes, aes(x = x,y = y,group = group), arrow = arrow(length = unit(0.1, "inches"), ends="last", type="closed")) + geom_text(data = label, aes(x = x,y = y,angle = angle,label = lab),fontface = 'italic')+ theme(plot.title = element_blank())sample_umapggsave('sample_umap.pdf',width = 9,height = 7)图片
umap+sample_umap
图片
2.5 东说念主工肉眼看重亚群#####细胞生物学定名celltype=data.frame(ClusterID=0:22, celltype= 0:22) # 这里激烈依赖于生物学配景,看dotplot的基因抒发量情况来东说念主工审查单细胞亚群名字celltype[celltype$ClusterID %in% c(3,6,9,13,14,15,16,20,22 ),2]='Myeloid'celltype[celltype$ClusterID %in% c( 5,11,12,17,19 ),2]='Epithelial'celltype[celltype$ClusterID %in% c(0,1,21),2]='T&NK'celltype[celltype$ClusterID %in% c( 8 ),2]='Fibro'celltype[celltype$ClusterID %in% c( 18 ),2]='Proliferative'celltype[celltype$ClusterID %in% c( 10 ),2]='Plasma'celltype[celltype$ClusterID %in% c( 2),2]='B'celltype[celltype$ClusterID %in% c( 7 ),2]='Endothelial'celltype[celltype$ClusterID %in% c( 4),2]='Mast'table(scRNA@meta.data$RNA_snn_res.0.5)table(celltype$celltype)scRNA@meta.data$celltype = "NA"for(i in 1:nrow(celltype)){ scRNA@meta.data[which(scRNA@meta.data$RNA_snn_res.0.5 == celltype$ClusterID[i]),'celltype'] <- celltype$celltype[i]}table(scRNA@meta.data$celltype)th=theme(axis.text.x = element_text(angle = 45, vjust = 0.5, hjust=0.5)) library(patchwork)celltype_umap =DimPlot(scRNA, reduction = "umap",cols = my36colors,pt.size = 0.8, group.by = "celltype",label = T) + NoAxes() + theme(aspect.ratio = 1) + geom_line(data = axes, aes(x = x,y = y,group = group), arrow = arrow(length = unit(0.1, "inches"), ends="last", type="closed")) + geom_text(data = label, aes(x = x,y = y,angle = angle,label = lab),fontface = 'italic')+ theme(plot.title = element_blank())celltype_umapggsave('umap_by_celltype.pdf',width = 9,height = 7)图片
saveRDS(scRNA, "sce_celltype.rds")setwd('../')结语本期,咱们选定resolution=0.5对肺腺癌单细胞数据集GSE189357进行了手工细胞分群看重。细胞看重的神志有许多,细目请参照单细胞全国前期推文:单细胞测序最佳的教程(六):细胞类型看重。下一期,咱们将在本期基础上对细胞类型及基因进行可视化,使用多种可视化范例,绘图DimPlot,FeaturePlot,ggplot,DoHeatmap图,接待环球握续追更,谢谢!
图片
本站仅提供存储就业,总计实质均由用户发布,如发现存害或侵权实质,请点击举报。