200万行数据折腾了一星期,来看我的大数据必杀技

超过100万行数据的,大多数是从系统导出的数据,导出的时候肯定可以选择文件类型。卢子就以文件导出类型为记事本、Access为例进行说明。

1.导出类型为记事本

Excel的上限是100万行,肯定是没法直接存放200万行数据,只能加载到数据模型里,才能存放。

Step 01 点数据,获取数据,自文件,从文本/CSV,找到刚刚的记事本,导入。

Step 02 用记事本导入的时候,有时会乱码,可以选择文件原始格式为无,点转换数据,进入PQ编辑器。

Step 03 点关闭并上载至,选择仅创建连接,勾选将此数据添加到数据模型,确定。稍等片刻,加载过程需要点时间。

Step 04 PP这个功能,很多人应该是第一次用到,需要加载才有。在开发工具,COM加载项,找到PP这个功能,确定。

现在这个新功能就出来了。

Step 05 点管理,进入PP编辑器,选中里面的透视表,确定后,勾选负责人、金额、人数。整个操作过程非常流畅,200万行就跟20行的数据一样快。

2.导出类型为Access

Access本身就可以处理大数据,不过这里演示将数据导入到Excel里面。

在数据库Access中,存放着200万行的数据,现在要借助Excel统计每个区域的金额。

今天让你见识多软件协同工作,让Excel更强大。

Step 01 新建一个新工作簿,点数据→新建查询→从数据库→从Access数据库,找到数据库,导入。

Step 02 在导航器选中200万的工作表,点转换数据(版本不同叫法略有差异),稍等片刻就进入PQ编辑器。

Step 03 点关闭并上载至,勾选仅创建连接,将此数据添加到数据模型,加载。

差不多几秒钟,在Excel右边就提示已加载200万行数据,这样就表示加载成功,可以进行下一步操作。

Step 04 插入透视表,操作跟普通的透视表几乎一样,最大的区别就是不需要选择区域,透视表直接根据数据模型中的数据统计。将区域拉到行区域,金额拉到值区域。秒统计,丝毫不卡。

看懂没?

不管你有100万,还是200万,甚至300万通通都一样,添加到数据模型,就不怕大数据了。

Excel存放不下,还有记事本、数据库,好好学习,Excel比你想象中的更强大。

作者:卢子,清华畅销书作者,《Excel效率手册 早做完,不加班》系列丛书创始人,个人公众号:Excel不加班(ID:Excelbujiaban)

(0)

相关推荐