按照列筛选数据框不容易那么按照行就容易吗

前面我出过一个考题,是对GEO数据集的样本临床信息,根据列进行筛选,比如:

rm(list=ls())
options(stringsAsFactors = F)
library(GEOquery)
eset=getGEO('GSE102349',getGPL = F)
pd=pData(eset[[1]])

就会下载一个表达矩阵,有113个病人(行),记录了57个临床信息(列),很明显,有一些临床信息列是后续的数据分析里面(主要是分组)没有意义的,病人总共时间日期,所有的病人可能都是一样的。

那么就需要去除,一个简单的按照列进行循环判断即可!

pd=pd[,apply(pd,2,function(x){
  length(unique(x))>1
})]

但是,仔细看临床信息表格会发现,还是有问题:

就是仍然是需要去除无效行,就是去掉临床信息为N/A、Unknown、Not evaluated的行,需要检查全部的列哦~

给一个参考答案

pd=pd[apply(
  apply(pd,2,function(x){
  grepl('N/A',x)
}),1,sum)==0,]

友情推广

如果你也对学徒培养或者实习职位感兴趣,想在我们的指导下完成肿瘤外显子等NGS数据分析,可以先看看我是如何培养学徒的:

当然了,学徒培养看缘分!发邮件给我申请:jmzeng1314@163.com

(0)

相关推荐

  • Python数据分析,办公自动化,如何数据分组与透视?

    数据分组是对相同类别的数据进行汇总,而数据透视表是通过对行或列的不同组合对数据进行汇总,所使用的汇总方法有求和.计数.平均值.标准差等,本文使用Python对数据进行数据分组和数据透视,下面一起来学习 ...

  • 2018ASCO成果转译:PD1增敏上的突破

    2018ASCO大会,在美国继续大批量释放癌症治疗的最前沿成果和数据,华哥继续转译其中与软组织肉瘤相关的重要信息: 免疫疗法PD1,一起效就能持续很多年时间,令无数肿瘤患者都想碰碰运气,然而,PD1单 ...

  • 行心医联体系统(介绍)

    行心医联体系统以"医养云数据中心"为理念,采用"统一规范.统一接口.统一运行"的方式,以医疗协同,分级诊疗为指导的思想,集中部署,分级享用的方式,建设医联体云数 ...

  • Pandas 的这个知识点,估计 80% 的人都得挂!

    拆分前的数据情况,如下图红色标注所示: 拆分后,如下图所示: 这个案例中,Lemon 使用的数据来自 akshare ,在开始前,引入相关 package : import pandas as pd ...

  • 使用sklearn预测共享单车出行情况

    近期文章 文本数据分析文章汇总(2016-至今) python爬虫与文本数据分析 系列课 当文本分析遇到乱码(ง'⌣')ง怎么办? Loughran&McDonald金融文本情感分 ...

  • R数据框:按列索引按列名称删除指定的列数据

    读取数据集后,发现某些数据并不需要,如果想让数据看着简单些,可以考虑删除某些指定的列 数据源 雇员数据employee 本号后台回复[雇员]下载数据,欢迎读者朋友自行实践. 按索引号删除某列 bdat ...

  • 如何修改R数据框的列名称?

    现在我们预览一下[犯罪数据], 有两个列的名称,也就是两个变量名称中间含有空格,这在未来的统计分析中容易造成一些不必要的操作错误. 另外,变量名称也不宜太长,建议用英文缩写来表示,短英文字符是最好的. ...

  • 学徒讨论-在数据框里面使用每列的平均值替换NA

    最近学徒群在讨论一个需求,就是用数据框的每一列的平均数替换每一列的NA值.但是问题的提出者自己的代码是错的,如下: 他认为替换不干净,应该是循环有问题.希望我们帮忙检查,我通常是懒得看其他人写的代码, ...

  • 不会VBA,你也可以玩这样的控件筛选——数据透视表切片器

    哇,如此高大上的动态图表,是不是一定得用VBA才能实现呀?也许你会说我不会VBA啊.别怕,不用VBA,用Excel简单易用的数据透视表就可以实现,操作步骤如下: Step1:原始表格有产品名称.季度. ...

  • Excel高级筛选数据功能,快速归类查找数据

    前面有给大家分享过Excel的筛选功能,今天给大家分享高级筛选查询数据,直接将需要的数据筛选到其他单元格. 1.Excel根据人员信息筛选 在众多的数据中,我们要将关键人员的信息数据查询复制出来,比较 ...

  • Excel切片器快速筛选数据

    Excel切片器快速筛选数据

  • 生成两表(列)数据全部组合的极简方法

    在<PQ-综合实战:根据关键词匹配查找对应内容>里,为了拼出两个表数据的全部组合,使用的方法是先分别给每个表添加一列,然后再用合并查询的方法来完成,而且合并完成后还得再把添加的列给删掉,步 ...

  • 怎么将多行多列的数据变成一列?4个解法。

    - 问题 -怎么将这个多行多列的数据变成一列? - 1 - 不需保持原排序选中所有列逆透视,一步搞定 - 2 - 保持原排序:操作法一思路直接,为保排序,操作麻烦2.1 添加索引列 2.2 替换nul ...

  • 如何将间隔的多行多列的数据汇总到一个单元格

    有时我们为方便查看数据,会将归属一个人或一个机构的事项汇总到一起,比如下面的例子: 大家可以看到数据之间是用"/"进行间隔,一看有点懵逼,如果是少量的我们可以用"& ...