【数据分析过程解析】三、分析和展现数据
前面我们介绍了Excel中的Power BI组件,也介绍了实际工作中使用这些组件的一些案例。但还有些朋友对Power BI不太熟悉。从今天开始,我们将用一系列(3-4篇)文章完整介绍一个使用Power BI进行数据分析的全过程。
今天是第三篇:分析和展现数据
数据源文件获得方式:
正文
扩展和丰富数据模型
0. 准备
但是微软的系统就会有小插曲。你可以先跳过下面的内容,直接去看1. 插入Power View报告这一部分。如果你可以成功插入报告。就不用看这一部分内容了。否则,下面就是解决方案。
有时,在你插入报告时,会弹出这样的对话框:
点击确定后,去微软网站下载一个注册表项程序包,地址为:
https://gallery.technet.microsoft.com/scriptcenter/Registry-keys-to-reenable-7cd9f723
进入后是这个样子的:
下载后解压,进入目录,找到文件:
双击即可完成注册。会弹出警告信息:
1. 插入Power View报告
Excel中插入了一个工作表,叫做“Power View1”,里面是个空白报告:
在右侧“Power View Fields”中,选择Hosts表,然后勾选City。然后选择Medals表,勾选Sport。在报告区域,显示如下:
在点击右侧“FIELDS”中的Sport后面的箭头,选择“Count(Not Blank)”:
可以看到,左侧的Sports已经变成了数字。
鼠标点选报告区域中的任意单元格,会出现“设计”选项卡,选择“切换可视化效果”组中的地图:
在“Power View Fields”中Medals表中,将Sport字段推拽到COLOR下面的框中:
可以看到,在地图的显示上增加了颜色(夏季用蓝色,冬季用红色)。在地图旁边出现了图例。与Excel图表的图例不同,这里的图例可以点击,地图上会根据选择发生变化:
这里的地图不同于Power Map(关于Power Map见这里),感觉更像是Bing Map(关于Excel中使用Bing Map,见这里)
2. 添加计算字段
点击“Power Pivot”选项卡下的“管理”,管理数据模型:
选择Medals表,点击“主页”选项卡下的“计算区域”,在表格下方将显示计算区域:
选中计算区域中Edition列下面的第一个单元格,点击“主页”选项卡下的“自动汇总”后面的箭头,点击“非重复计数”:
实际上,这就是我们前一节提到过的DAX函数,Power Pivot利用DAX函数创建了一个公式(在公式编辑栏中可见):
Edition 的非重复计数:=DISTINCTCOUNT([Edition])
关闭“Power Pivot for Excel”窗口,保存Excel文件,回到Power View工作表。这时,会出现以下信息框:
提示你数据模型已经修改。点击OK,Power View将会被更新。
再次回到管理数据模型的窗口,在Medals表的计算区域中,选中刚才添加计算字段的单元格下方的单元格:
在公式编辑栏中输入公式:
金牌百分比:=[以下项目的计数:Medal]/CALCULATE([以下项目的计数:Medal],all(Medals))
为了测试一下这个计算字段,我们关闭“Power Pivot for Excel”窗口,利用这个计算字段实现如下的透视表:
3. 设置默认字段集,表行为和数据类别
回到管理数据模型窗口,选择Medals表,在“主页”选项卡下,选择“数据视图”。
点击“高级”选项卡,点击“默认字段集”:
在出现的窗口中,在左侧选择Sport, Medal, Event,EditionID,Athlete(按Shift/Ctrl键点击鼠标,可以多选),然后点击添加,将这些字段添加到默认字段集中:
点击“确定”,默认字段集添加成功。
我们回到Power View中看看默认字段集的效果:
在Power View左侧的报告区域点击空白的地方,然后在右边“Power View Fields”中点击Medals,在左侧报告区域就会显示默认字段集的报表:
这个功能其实很有用。因为你表中的字段可能很多,但是我们在分析和展现时可能只用其中的某几个字段。(甚至在做多份报告时也是如此)。这个设置就可以我们创建报告的效率得到很大提升。而且,我们还可以设置表行为,让默认字段的呈现效果也自动设置。
回到“Power Pivot for Excel”窗口,在“高级”选项卡下点击“表行为”:
在表行为对话框中,首先设置行标识符。行标识符是表中的某一列,这一列必须能够唯一标识该行。我们选择MedalKey作为行标识符。
在保持唯一行中,选择AthleteID列。被选择的这列在透视表和Power View中不会被合并。
将默认标签选择为Sport。
将默认图像处保持为默认值([未选择任何列])
点击确定。返回Power View工作表,选择我们添加的Medals报告(在地图下方的数据报表)。在“设计”选项卡下,依次点击“表”,“卡”:
你的报表变成了下面的样子:
拖动卡片右侧的滚动条,你可以看到数据变化。
为了更好地让Power View基于数据模型动态创建报告,Power View必须能够尽可能识别这些字段的内容,例如表示位置信息的字段,我们可以在数据模型中手工为这些字段设置分类。
在Power Pivot for Excel窗口中,选择Hosts表。选择NOC_CountryRegion列,然后在“高级”选项卡下,点击“数据类别”后面的箭头,选择“国家/地区”:
在Medals表中也有相同的一列,重复同样的操作,将该列分类为国家/地区。
回到Power View工作表中,在右侧“Power View Fields”的字段列表,可以看到在NOC_CountryRegion字段前面出现了一个地球的图标,表示Excel已经将这一列识别为位置信息了。
4. 总结
Power View的基础还是数据模型,实际上,你可以将它理解为加强版的透视图(还是多个透视图的集成)。并且为了形成报告,Excel还做了很多增强。比如通过默认字段集,表行为等提高工作效率。
取得本文案例文件的方式:
关注本公众号
回复“Power BI数据分析案例文件”即可获得下载地址