学习R:识别缺失值与将指定数据编码为缺失值
基础不牢,大厦将倒。今天再来练习一个基础操作,在数据框中发现缺失值,以及将指定数据重编码为缺失值。
雇员数据原本是SPSS格式,其中以往经验这个变量有一小部分取值为0的,即无经验,假设我们现在要将其认定为缺失值,需要重新将数字0认定为缺失值。
第一,查看当前数据有无缺失值
summary(is.na(data))
或者
sum(is.na(data))
# [1] 0
该数据总共474case,结果显示,整个data没有系统缺失值。
但实际需求是,我们要将prevexp变量中的数字0设定为缺失值,应该强行定义。
第二,指定值冲编码为缺失值
data$prevexp[data$prevexp == 0] <- NA
或
data$prevexp[which(is.na(data$prevexp))]<-0
此时0经验已经被我们强行编码为系统缺失值NA。
第三,识别缺失值
summary(is.na(data))
来看现在的结果:
有24个0被我们强行定义为NA即缺失值。
本文完
文/图=数据小兵
更多R统计文章
按列索引按列名称删除指定的列数据
R语言Levene方差齐次检验
table函数:分类数据的频数与频率统计
R语言带文字标签的散点图
如何获取R自带数据集与R包数据集说明文档?
如何修改R数据框的列名称?
二元正态分布及双变量相关分析简单案例演示
ggplot2统计图形:常见的4种散点图
R语言scale()函数实现数据标准化
用R语言做单因素方差分析及多重比较
用R语言自动智能化创建时间序列ARIMA模型
Fleiss' Kappa系数处理多个观察者一致性检验
练习R:用ggpubr包ggline绘制线图
双因素方差分析如何做非参数检验替代方法?
dplyr包实现分组描述统计
连续数据探索性统计可视化函数EDA
用lm.ridge()做岭回归分析
lm+plot+abline+text函数绘制线性拟合散点图
END
赞 (0)