从大量文件中提取自己需要的数据,这个需要是如此的常见,以至于经常收到小伙伴的求助,今天我们就唠一唠,5毛的应该基本就能搞定!希望大家都能掌握并应用起来!案例数据:85种水果,每种水果一个文件,汇总了销售金额推荐版本:office2016、365、2019。2007及以下版本不可用案例截图,每个文件三列,合计金额第三列,合计位置所在行不固定所以我们不能根据位置提取!文件有很多,演示使用数量85个我们来看看PQ是如何处理的,可以说简单到没有朋友!数据-来自文件-从文件夹-浏览,选择存放文件的文件夹,确定-转换数据,加载进入PQ编辑器,其他版本大同小异,只要找到从文件夹基本就OK!
> 选择Name和Content列,右击删除其他列
> 选中Name列,转换-拆分列-按分隔符,删除掉后缀名列即可
我们要的内容是表名和文件中的数据,其他都不需要
基本固定用法: Excel.Workbook(二进制列,首行是否是标题)其实有第三参数,一般用不到,这里不提,二进制列,一般默认都是Content列2、Excel.Workbook转换后并不是就直接能得到数据,只有其中Data列是其中的所有工作表数据,这里就是[Data]这样获取到的是所有工作表的集合,我们只要第一个,那就是{0},这里解释一下,PQ中行是从0开始的,这个有点编程的味道
= Table.AddColumn(删除的列, "自定义", each Excel.Workbook([Content],true)[Data]{0})
我们这里 {[ 销售员="总计"]}就是销售员是合计的整行内容,但是我们要的只是金额,所以再[金额]即可最后我们只需要删除不必要的列,修改标题,点击主页-加载到,选择加载的表位置,确定即可!
本案例中除了一个Excel.Workbook函数外,都是PQ最最最基本的基础知识,但是就是这基础帮我们搞定了难道无数人的问题。PQ定位数据的抽取-转换-加载(ETL),此案例尽数应用到。题外话:最近忙到头掉,希望本篇大家能应用起来,这是真的干货,可以为你节约海量的时间,另本篇如果“在看”超过1000(挑战不可能),小编将“肝”一个PQ入门系列分享给大家!不说了,今天的事情还没忙完,可能又要忙到明天了~俺去忙去了~狗头二摆~