对比Excel的10个功能,学习SQL好像也快了?

SQL,数据分析岗的必备技能,你可以不懂Python,R,不懂可视化,不懂机器学习。但SQL,你必须懂。要不然领导让你跑个数据来汇......,哦不,你不懂SQL都无法入职数据分析岗,更别说领导了。

SQL难吗?说实话,要写好,很难很难。但要通过SQL笔试这关,并不难。相信大伙都使用过Excel,用SQL实现excel 常用操作去学,感觉会比较具体。我自身也刚入数据岗不久,本文也是为自己巩固一下SQL。
数据是网上找到的销售数据,命名为sale,长这样:
01. 关联公式:Vlookup
vlookup是excel几乎最常用的公式,一般用于两个表的关联查询等。所以我先创建一个新表:复制sale表并筛选出地区仅为广州的,命名为sale_guang。
create table sale_guang SELECT * from sale where city='广州';
需求:根据订单明细号关联两表,并且sale_guang只有订单明细号与利润两列
SELECT * from sale ainner JOIN(SELECT ordernum,profit from sale_guang) b style='margin: -0.8em 0px; color: rgb(26, 26, 26); font-family: -apple-system, BlinkMacSystemFont, 'Helvetica Neue', 'PingFang SC', 'Microsoft YaHei', 'Source Han Sans SC', 'Noto Sans CJK SC', 'WenQuanYi Micro Hei', sans-serif; font-size: medium;              background-color: rgb(255, 255, 255);  '>
02. 对比两列差异
需求:对比sale的订单明细号与sale_guang订单明细号的差异;
SELECT * from sale aWHERE a.ordernum not in (SELECT b.ordernum from sale_guang b);
03. 去除重复值
需求:去除业务员编码的重复值
SELECT * FROM salewhere salesnum not in (SELECT salesnum from sale GROUP BY salesman HAVING COUNT(salesnum)>1)
04. 缺失值处理
需求:用0填充缺失值或则删除有地区名称缺失值的行。
#用0填充:update sale set city = 0 where city = NULL#删除有缺失值的行:delete from sale where city = NULL;
05. 多条件筛选
需求:想知道业务员张爱,在北京区域卖的商品订单金额大于等于6000的信息。
SELECT * from sale where salesman = '张爱' and city = '北京'and orderaccount >=6000;
06. 模糊筛选数据

需求:筛选存货名称含有'三星'或则含有'索尼'的信息。

SELECT * from sale where inventoryname like '%三星%' or 存货名称 like '%索尼%';
07. 分类汇总

需求:北京区域各业务员的利润总额。

SELECT city,sum(`profit`) from saleWHERE city = '北京'GROUP BY `city`;
08. 条件计算
需求:存货名称含“三星字眼”并且税费高于1000的订单有几个?这些订单的利润总和和平均利润是多少?
#有多少个?SELECT COUNT(*) from sale where inventoryname like '%三星%'and `tax` > 1000 ;
#这些订单的利润总和和平均利润是多少?SELECT `ordernum`,SUM(profit),AVG(`profit`) from sale where inventoryname like '%三星%'and `tax` > 1000 GROUP BY `ordernum`;
09. 删除数据间的空格
需求:删除存货名称两边的空格。
SELECT trim(inventoryname) from sale;
10. 合并与排序列
需求:计算每个订单号的成本并从高到低排序(成本 = 不含税金额 - 利润)
SELECT city,ordernum,(Nontaxamount - profit) as cost from saleorder by cost DESC;
总结:结构化查询语言(Structured Query Language)简称SQL,果然和它名字一样,查询起来得心应手,但做想做数据处理方面,能明细感受到比Python和excel吃力(也可能是我还没学好orz)。
(0)

相关推荐