如果是一组基因来把病人进行分组，可以······

2024-07-31 05:39:07

如果是一组基因来把病人进行分组，可以取基因集的第一主成分来把病人样本分组。

生存分析最重要的就是分组，来检验你的分组的那个标准或者指标是否能区分生存，比如下面的代码，根据表达量高低进行分组：

dat=merge(cxb6_expr,meta,by='gsm') head(dat) table(dat$study)

生存分析的数据如下：

> head(dat) gsm value group month event study 1 GSM107072 6.610591 low 49.68 1 GSE1456 2 GSM107073 4.871095 low 97.80 0 GSE1456 3 GSM107074 5.838876 low 26.64 0 GSE1456 4 GSM107075 7.389684 high 98.76 0 GSE1456 5 GSM107076 5.332938 low 66.60 0 GSE1456 6 GSM107077 4.724775 low 99.60 0 GSE1456 >

其实只需要3列，就是group month event 即可，如下：

library(survival) library(survminer) # 利用ggsurvplot快速绘制漂亮的生存曲线图 #dat=dat[dat$study==1,] sfit <- survfit(Surv(month, event)~group, data=dat) sfit summary(sfit) ggsurvplot( sfit, risk.table = TRUE, ggtheme = theme_bw(), pval = TRUE, pval.coord = c(0, 0.03) )

出图如下：

如果是一个基因突变与否，也很容易区分成两个组别。

但如果是一组基因的表达量呢？

这时候可以对着一组基因来取第一主成分，使用其第一主成分来对病人进行分组。

只要分组了，那么生存分析或者其它，就是水到渠成的事情咯。

赞 (0)

R语言GEO数据挖掘01-数据下载及提取表达矩阵

欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA.GEO数据挖掘. 这一节的内容包括应用 GEOquery包下载芯片数据,提取表达矩阵,提取m ...
Python从零开始第五章生物信息学①提取差异基因

目前来说,做生物信息学的人越来越多,但是我觉得目前而言做生信的主要有三类人:老本行是做实验的,做生信可能是为了辅助研究或者是为了发paper(有非常多的临床生选择趟生信这波水)主要是做生信的,主要涵盖 ...
GEO（Gene Expression Omnibus）：高通量基因表达数据库

#GEO是什么? GEO全称Gene Expression Omnibus data base,由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库(通过NCBI首页,All Database ...
科研 | Nucleic Acids Res.：综合多组学分析揭示一组在lncRNA EPR直接转录靶标中由TGF-β调控的基因

编译:杨丽军,编辑:Emma.江舜尧. 原创微文,欢迎转发转载. 导读近年来,在哺乳动物基因组中发现了大量的长非编码RNA(lncRNAs).最近的研究指出lncRNAs是生物学基本方面的调节因子, ...
甲状腺BRAF基因检测有用吗?真的有必要吗？是浪费病人钱吗？

"再做一个BRAF基因检测吧" --"医生,为什么还要做BRAF基因检测呢?" --"这不是已经确诊是甲状腺癌了吗,还有什么用呢?" --& ...
100篇泛癌研究文献解读之病毒感染及整合到肿瘤病人基因里

为了分析不同类型.组织起源肿瘤的共性.差异以及新课题.TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划.参考:https://www.ncbi.nlm.nih.gov ...
狼人变身是恶灵附体，还是基因变异？驱魔事件背后竟是可怜的病人

狼人变身是恶灵附体，还是基因变异？驱魔事件背后竟是可怜的病人
数百万年前大麦捕获的源自Panicum的染色体片段仍保留了一组与胁迫相关的基因

种内变异是物种进化成功的基石.从遥远的来源获得遗传物质是细菌的一种重要适应机制,但在真核生物中也可以发挥作用. 本文研究了大麦属(Pooideae)种核基因组中圆锥花序(禾本科,圆锥花序科)起源染色体 ...
指定病人的指定基因的突变全景瀑布图

我们在前面的教程:不是maf格式的somatic突变数据就没办法读入到maftools了么,提到了假如小伙伴们是在在 https://xenabrowser.net/datapages/ ,找到 G ...
有敏感基因突变的晚期肺癌病人，靶向治疗耐药后能用免疫治疗吗？

孙先生是个晚期肺癌病人,肺腺癌骨转移,有EGFR 19外显子突变,2017年开始吃易瑞沙,吃了两年多耐药,换三代奥西替尼,上个月复查CT,发现病情进展,主要是骨转移病灶增多,肾上腺发现新增结节. 总体 ...
肿瘤病人同病不同命为哪般？除分期、分类影响外，还有基因分型！

影响癌症病人预后的因素比较多,分期早晚或是最.最主要的因素,还有肿瘤病理类型.癌细胞分化程度.治疗以及病人的身体状况等因素. 临床上也常常发现分期.病理类型.组织分级等等情况大致相同,但,病人或有不同 ...
KRAS基因[可帮助医生选择对肿瘤病人最有效的治疗方法]

KRAS基因(K-ras,p21)检测是目前医生了解大肠癌患者癌基因状况最直接.最有效的方法,通过检测不仅可以深入了解癌基因的情况,更重要的是筛选出针对抗表皮生长因子受体靶向药物治疗有效的大肠癌患者, ...