dplyr函数
主要包含两个变量:
select()#选取某一列
mutate()#添加一列
配合select()进行使用的函数:
starts_with()
ends_with()
contains()
matches()
num_range()
one_of()
everything()
创建数据框
library
(dplyr)
x<-
data.frame
(id=1:6,
name=
c
(
"wang"
,
"zhang"
,
"li"
,
"chen"
,
"zhao"
,
"song"
),
shuxue=
c
(89,85,68,79,96,53),
yuwen=
c
(77,68,86,87,92,63),
shengwu=
c
(85,68,78,68,98,96))
x
select
(x,name) #选择name列
select
(x,
starts_with
(
"s"
)) #选择以s开头的列,置于前面
select
(x,
ends_with
(
"e"
)) #选择以e结尾的列,置于前面
select
(x,
matches
(
".e."
)) #匹配中间有e的列,不能在开头-结尾
select
(x,
contains
(
"e"
)) #匹配包含e的列,可以在开头-中间-结尾
select
(x,-name) #去掉name的列
select
(x,1:3) #提取前三列
select
(x,mz=name) #将name改名为mz
select
(x,cmm=
starts_with
(
"s"
)) #提取s开头的列,命名为cmm
select
(x,name,
everything
()) #提取name在前,其余列依次显示
mutate
(x,yingyu=shuxue*1.2) #增加一列:英语(默认置于最后),分数为数学✖1.2倍
transmute
(x,yingyu=shuxue*1.2) #新建数据框:英语,分数为数学✖1.2倍
mutate
(x,shuxue=
NULL
) #将数学一列取消,把NULL赋值给列,已达到删除列的效果
赞 (0)