Excel数据清洗之八 规范英文的大小写

今天说一下,数据中英文的大小写不一致的问题。

这份数据中,相同颜色标注的都是同一个产品,尽管它们的大小写是不一致的。

严格的说,这不算数据错误,甚至都不算不规范的数据。因为除了看上去有点奇怪外,我们通过函数或者数据透视表进行分析时,基本上它们都会被归为一类。下面是数据透视表的结果,

用函数统计也没问题,

这是因为Excel中绝大部分工具和函数都是大小写不敏感的。

但是,有一些例外,比如我们前面讲过的函数SUBSTITUTE,就是大小写敏感的,

在上图中,我们希望通过函数SUBSTITUTE将所有名称前有Tr的产品修改为"Product-Tr",我们期望的结果是,

tropic → Product-Tropic

Tropic → Product-Tropic

但是,由于SUBSTITUTE是大小写敏感的,所有第一条数据“tropic”并没有按照我们的期望得到正确的结果。

因此,尽管不一致的大小写并不影响分析结果,它们却有可能影响我们进行其他数据清洗操作的结果。我们最好还是将它们统一了。

三个函数

Excel中,有三个处理英文大小写的函数,分别是:

  • LOWER - 将英文全部转换为小写

  • UPPER - 将英文全部转换为大写

  • PROPER - 将每个单词的开头的英文字母转换为大写,其余转换为小写

下面是几个例子:

LOWER函数的例子
A2单元格的值 公式 结果
tropic =LOWER(A2) tropic
Tropic =LOWER(A2) tropic
TROPIC =LOWER(A2) tropic

UPPER函数的例子

A2单元格的值 公式 结果
tropic =UPPER(A2) TROPIC
Tropic =UPPER(A2) TROPIC
TROPIC =UPPER(A2) TROPIC

PROPER函数的例子

A2单元格的值 公式 结果
tropic =PROPER(A2) Tropic
Tropic =PROPER(A2) Tropic
TROPIC‍ =PROPER(A2) Tropic
tropic dashboard‍ =PROPER(A2) Tropic Dashboard
tropic-dashboard‍ =PROPER(A2) Tropic Dashboard

怎么进行大小写的数据清洗工作

进行英文大小写的清洗工作很简单。首先插入一列:

然后在新加入的列中输入公式:

公式填充到最后,

复制,然后再B列选择性粘贴,粘贴为数值,

删掉添加的临时辅助列,得到结果,

(0)

相关推荐

  • Excel教程:6个表格字母数值大小写转换技巧

    一.首字母转为大写 函数公式:=PROPER(A1) 二.英文单词大写 函数公式:=UPPER(A1) 三.英文单词小写 函数公式:=LOWER(A1) 四.中文小写数值 函数公式:=NUMBERST ...

  • 跟Excel里又不一样,PQ文本筛选还要分大小写?怎么办?

    - 1 - 上次关于PQ空文本筛选不出来的文章里,有的朋友提到,Power Query在筛选时,不光是空文本的筛选跟Excel里不一样,大小写的处理也不一样啊! 在Excel里,筛选包含Power内容 ...

  • Excel如何批量设置英语句子的首字母大写

    在外企的职场人士对英文字母的整理,相信大部分人都是依靠手动修改的,可想效率会有多低,掌握Excel中专门对英文字母大小写批量整理的函数(LOW.UPPER.PROPER),将大大提高工作效率,如图3- ...

  • Excel全角半角转换及大小写转换,职场中防“转”晕!

    Excel情报局 Excel职场联盟 生产挖掘分享Excel基础技能 Excel爱好者大本营 用1%的Excel基础搞定99%的职场问题 做一个超级实用的Excel公众号 Excel是门手艺玩转需要勇 ...

  • 多Excel文件数据汇总,列名大小写不一致咋办!!!

    小勤:最近收到一份数据,需要对多个Excel工作簿的内容进行汇总,真是麻烦! 大海:多个Excel工作簿内容汇总用Power Query不是很简单的事情吗?前面我不仅推送了大量文章<用PQ自动汇 ...

  • Excel数据清洗实例智能填充应用

    Excel数据清洗实例智能填充应用

  • 【UN】Excel数据清洗之一 基础

    什么是数据清洗 数据清洗是我们在进行任何数据汇总分析之前的必备工作. 很多人已经认识到了,在我们拿到的原始数据中有大量的错误数据和不规范数据.也有很多人没有意识到这个问题.如果我们直接拿这样的原始数据 ...

  • Excel数据清洗之二 纠正错误的表格格式

    不规范的源数据中有一类是格式错误,我们清洗数据的第一步是纠正这些错误的格式. 空行或空列 其中一种非常常见的类型就是数据之间有空行或者空列. 这份数据中,橙色的竖线表示空列,蓝色的横线表示空行. 这份 ...

  • Excel数据清洗之三 横表转竖表(逆透视)

    前面我们介绍了对格式错误进行数据清洗的步骤,得到了结果--一个横表: 实际上,有可能我们一开始拿到的就是这样的"横表" 横表的问题我们可以通过下面的数据透视来为大家展示一下: 在这 ...

  • Excel数据清洗之四 清除错误值

    错误值在Excel中非常常见.我们在以前的文章中给大家做过介绍(参见#Div/0! Excel中的那些错误值们!),这些错误值都是用公式计算时产生的,大家都司空见惯了. 正因为大家都习以为常了,所以错 ...

  • Excel数据清洗之五 去除多余的字符

    今天介绍数据清洗需要处理的第二类问题,分类要一致. 我们先看分类不一致的结果, 上图中,很明显我们看到一个编号为"CA1001101"的客户,但是分别被归类到不同的客户中. 造成这 ...

  • Excel数据清洗之六 去除不可见字符

    造成分类不统一的原因还有一种,叫做"不可见字符". 先看下面的例子.假设我们数据如下: 表中所有数据都是同一个ID,如果我们用数据透视表汇总它们的数量,我们期望会得到一个这样的结果 ...