作者:农夫
编辑:妮妮、久久酱
小伙伴们,大家好,我是专治各种疑难杂「数」的农夫~
今天,我就为大家介绍一种高效的数据清洗方法,助你告别熬夜加班,拥抱美好的夜晚时光~
日常工作中,我们经常需要将其他同事发来的 Word 文件中的数据提取出来。
但粘贴进 Excel 表格后,数据就成了介个样子,出现很多空行、重复的标题行、多个相同的部门数据等~
看到这样的表格,大家的内心可能是这样的~
如果我们想处理成下图这样规整的数据,应该如何操作呢?
那么,现在请大家先思考几秒~~~
现在关注【秋叶 Excel】
回复关键词【模板】
即可免费领取 100 实用 Excel 图表模板
👇👇👇
秋叶Excel
和秋叶一起学Excel,免费获取Excel模板大全、插件合集!还有Excel真人视频、图文教程,助你轻松掌握Excel函数、图表、透视表……一起成为办公效率达人!
662篇原创内容
公众号
Word 中的数据表格,基本上不能直接操作计算,在数据处理上被认为是张「死表」。
(而且 Word 中常常有合并的行列、重复的标题行,「无脑复制粘贴」容易出现格式问题。)
而 Excel 中的数据相当于数据仓库,我们可以随意取部分数据,或者全部数据进行计算、合并、数据透视等,这类表格我们称之为「活表」。
知道了这些可能存在的问题,接下来,我们就需要逐个击破,把 Word 中的「死表」变成 Excel 中的「活表」。
应该怎么做呢?小伙伴们请随农夫走进本期的「数据农场」~❶ 数据处理数据之前,我们需要先将原表进行备份,保留原始数据。
备份原始数据是处理数据中很重要的习惯。不然,原始数据被修改了,想要从头再来,你可能只能哭了~❷ 删除不需要的行,即「分部」和「投诉受理量」列。数据清理中,根据自己处理需求保留或增添数据列,不要让无效数据列影响到数据清理。❸ 删除列中的无用行,包括 Word 中合并单元格形成的大量空行,及设置「重复标题行」形成的多个标题行。这些数据是 Word 粘贴进入 Excel 之后,生成的冗余数据。首先,去除列中空值行,选中整列—【F5】快捷键进入【定位】条件页面—点击「定位条件」—勾选空值—确定。即可选中列中所有空值,然后右键,选择【删除整行】即可!其实,空值也可视为重复值。数据选项卡下的【删除重复值】按钮,也可以删除列中重复值。但是,考虑到某些部门办件数量相同,因此本次不用这个方法。点击【数据】选项卡—【筛选】—勾选带有「部门」的行。选中除第一行之后的其他部门行,右键删除,最后取消筛选。还是基于上面刚刚说的原因,没有使用【删除重复值】功能。好了,下面我们继续进行数据处理,也是本次数据清洗最为关键的操作。
数据错行:即第二列的第一行数据引用的是前一列或后一列的第二行数据,以次类推。
即当填充 B 列第 2 行的时候,我们在 B2 单元格中引入 A3 单元格的数值。下拉单元格即可填充整列,或使用快速填充功能,双击即可自动填充整列。选中填充好的办件量列,复制—单击【右键】—粘贴为【值】。如果不进行这个操作,最后的数据全部都会出现#REF 错误哦!
因为在后续操作中,我们会把部门列中所有数字全部删除。
❻ 数据清洗进行过半,我们再次删除第一列中的无用行。点击数据选项卡—选中「部门列」—选中带有「件」字关键词的行—选中全部—删除。取消筛选,这样的数据形式,是不是和最终数据有七八分像了呢?但是,数据中咋出现了重复部门呢?就连办件量都是一模一样。❼ 存在这样重复的数据,是 Word 中的手动拆分单元格造成的。在 Word 中一个页面无法容纳一个部门的多个分部,就会自动将数据分割到两页。所以,粘贴进入 Excel,就会出现一个部门重复多行的数据。选中部门列—点击【数据】选项卡—删除重复行—选择删除重复项警告页面的【扩展选定区域】——确定。当命令执行完成,Excel 会贴心提示,删除重复值的数量和保留多少唯一值。新建最终数据列——手动把第一行第二行的数据写下来。然后,双击第二行的填充柄
进行快速填充,即可提取所有数据。
PS:快速填充适用于 Office 2013 及以上版本、WPS 2019 及以上版本~今天也是干货满满的一天~好了,小伙伴赶紧打开电脑操作一番吧!毕竟这种实操性的东西,眼睛看会了可不等于手会了哦!没关系!为感谢同学们对秋叶 Excel 的陪伴和支持,我们专门为大家准备了 《3天Excel集训体验营》,读者粉丝仅需1元秒杀~报名后你将获得3天Excel社群模式学习,各类福利资料干货分享发放,助力大家提升办公效率哦~
《秋叶Excel 3天集训营》
课程原价99 元
当下限时1 元秒杀!!
仅需 3天,实操练习 名师带学
提升你的Excel能力,助你早下班!
报名即送【35个常用函数说明】,赶紧扫码预约吧!👇👇👇