学习R:识别缺失值与将指定数据编码为缺失值

基础不牢,大厦将倒。今天再来练习一个基础操作,在数据框中发现缺失值,以及将指定数据重编码为缺失值。

雇员数据原本是SPSS格式,其中以往经验这个变量有一小部分取值为0的,即无经验,假设我们现在要将其认定为缺失值,需要重新将数字0认定为缺失值。

第一,查看当前数据有无缺失值

summary(is.na(data))

或者

sum(is.na(data))# [1] 0

该数据总共474case,结果显示,整个data没有系统缺失值。

但实际需求是,我们要将prevexp变量中的数字0设定为缺失值,应该强行定义。

第二,指定值冲编码为缺失值

data$prevexp[data$prevexp == 0] <- NA

data$prevexp[which(is.na(data$prevexp))]<-0

此时0经验已经被我们强行编码为系统缺失值NA。

第三,识别缺失值

summary(is.na(data))

来看现在的结果:

有24个0被我们强行定义为NA即缺失值。

本文完

文/图=数据小兵

更多R统计文章

R语言单一样本t检验案例实现

R语言的正态密度曲线很美

R自带pairs函数矩阵散点图

car包spm函数矩阵散点图
用R语言pie函数做饼图

ggplot2统计图形:常见的4种箱线图

ggplot2统计图形:常见的4种直方图

按列索引按列名称删除指定的列数据
R语言Levene方差齐次检验
table函数:分类数据的频数与频率统计

jiebaR包中文分词及词云制作

R语言带文字标签的散点图
如何获取R自带数据集与R包数据集说明文档?

如何修改R数据框的列名称?
二元正态分布及双变量相关分析简单案例演示

R语言相关系数、显著性检验及可视化的尝试

ggplot2统计图形:常见的4种散点图
R语言scale()函数实现数据标准化
用R语言做单因素方差分析及多重比较
用R语言自动智能化创建时间序列ARIMA模型

用R对连续数据做描述统计
R语言主成分分析

shapiro.test()与ggqqplot()做正态分布检验
Fleiss' Kappa系数处理多个观察者一致性检验
练习R:用ggpubr包ggline绘制线图
双因素方差分析如何做非参数检验替代方法?
dplyr包实现分组描述统计
连续数据探索性统计可视化函数EDA
用lm.ridge()做岭回归分析
lm+plot+abline+text函数绘制线性拟合散点图
分类自变量的线性回归
factor函数为有序分类变量创建值标签

END

(0)

相关推荐

  • 也谈R语言的嵌套和还原

    所谓的嵌套函数可用于将指定列的对应元素'折叠'为list,缩小原有数据框的大小.Tidyr提供两个函数进行嵌套合并操作,nest()将分组数据框转换为嵌套数据框,即包含列表列的数据框,转换后分组列只会 ...

  • 数据清洗(一)丨处理缺失数据

    其实数据分析中80%的时间都是在数据清理部分,而为什么要进行数据清洗呢? 因为在实际生产环境中,存在大量"脏"数据 ✔ 不完整数据:缺少感兴趣属性,感兴趣属性缺少部分属性值. ✔ ...

  • R语言 | 数据操作tidyr包

    [更新~]Python网络爬虫与文本数据分析 tidyr包 类似于上图成行成列的表数据是干净数据(tidy data),一般每一行表示一条观测记录,每一列表示一个字段(变量)tidyr包是用来操作ti ...

  • 在R语言中实现Logistic逻辑回归

    原文链接 http://tecdat.cn/?p=2652 逻辑回归是拟合回归曲线的方法,当y是分类变量时,y = f(x).典型的使用这种模式被预测Ÿ给定一组预测的X.预测因子可以是连续的,分类的或 ...

  • 【R语言学习7】R语言基本数据管理方法简介

    【R语言学习7】R语言基本数据管理方法简介

  • Current Biology:人类运动学习的识别记忆

    我们对运动行为的记忆保持程度的了解几乎全部来自于一些行为复现的研究.在这些研究中,被试需要根据记忆重复出他们之前学习过的动作内容.在人类言语记忆中,这种类似的记忆保持测试,称之为记忆的回忆测试.这种测 ...

  • 为什么要学R语言?如何学习R语言?

    ☞开始学R语言?这是我的建议 ☞零基础入门R语言数据分析指南 ☞写给想学习R语言的人一些建议 ☞R语言学习中什么时候是突飞猛进? ☞关于如何学习R ☞经管/统计专业的同学该如何学好R语言? ☞为什么R ...

  • 职场小白一起来学习这个识别图像文字操作

    小编在工作中是经常需要用到识别图像文字的操作的,因为有很多时候我都需要整理一下文档图片,而这些文档有很多都是pdf或者图片形式,而我要将其整理这些文档的内容的话,我如果不用识别图像文字操作,就得需要自 ...

  • 华清大学、京北大学联合发现:#学习R语言之数据挖掘可抑制新型冠状病毒#

    (纯属娱乐,不过技能是真) 2020年2月1日从华清北联合研究院获悉,该所研究初步发现,传统艺能#学习R语言之数据挖掘可抑制新型冠状病毒#.此前,华清北联合攻关组启动由带节奏师兄牵头的抗新型冠状病毒感 ...

  • 开发人工智能为什么要用Python?|python|机器学习|编程语言|深度学习|r语言

    导读:大家一定看腻了诸如Python简单易用.灵活性高之类好像说了很多,又好像什么都没说的介绍.我们说点接地气的--风头正劲的Python. 今天聊一个有意思的话题,开发人工智能为什么要用Python ...

  • PNAS:通过DystoniaNet深度学习平台识别用于肌张力障碍诊断的微结构神经生物标志物

    孤立性肌张力障碍是一种异质性病理生理学神经障碍,它引起无意识肌收缩,导致异常的运动和姿势.由于缺乏生物标志物或金标准诊断测试,对它的精确诊断极具挑战性.这导致临床医师之间很难达成共识, 可能有高达50 ...

  • 学习R语言&生物信息不可错过的资料合集

    啥话也不说了,接在公众号下面回复就可以啦!关键词随便挑: 一下四行对应着输入试试:(每行逗号分隔开来的随便挑一个输入就行) 自动回复均已为大家编写编号:放手撸代码吧!

  • 深度学习人脸识别核心技术—框架和优化目标

    注:本文选自人脸图像资深工程师言有三出版的新书<深度学习之人脸图像处理:核心算法与案例实战>(机械工业出版社出版)的6.2节,略有改动.经授权刊登于此. 人脸识别本质上是一个人脸验证和匹配 ...

  • OpenCV深度学习人脸识别示例——看大佬如何秀恩爱

    PyImageSearch博主Adrian Rosebrock昨日发表博文,展示如何使用OpenCV的深度学习工具在小库上进行人脸识别.昨天是我们中国人的传统佳节--中秋节, Adrian推送博文时也 ...