对不起,这些技术细节,只能翻微软官方操作手册了! | 附PQ手册下载

- 1 -

前段时间,我发表了文章《就用了一下合并查询的模糊匹配,VLOOKUP实在太弱了!| PQ实战》。

里面提到模糊匹配的算法问题,本来并不打算深究细讲,因为可以预计的是,将来一定会有越来越多的智能算法,我们根本就没有时间精力、也完全没有必要都去搞明白,尽管用就是了!

但因为问的朋友多了,感觉也不好再“逃避”下去

……所以,我翻开了微软的1074页Power Query官方文档(文末附下载链接):

单从目录,就能看出这里包含了超级详细的解析、关联说明(当然,也会显得比较臃肿、啰嗦)。

翻到“模糊合并”的内容,Note里,其实标注了合并查询的模糊匹配使用的是“Jaccard相似性算法”!

有了这个说明,接下来就简单了,随便搜索一下“Jaccard”,就能找到相关的算法说明:

还有举例的说明,更加直观:

当你知道了这个算法的原理后:
  • 一是,你可以按需要改进这个算法,比如,增加一些明确的判断条件等等,使得它更加精准;

  • 二是,你可以看看其他(比如公司开发某些系统)需要做模糊匹配的场景下,是否可以借鉴这个算法进行实现。

- 2 -

当然,除了上面的算法备注,官方文档还给出了很多功能的注意事项。

比如,将OneDrive for Business文件用作Power BI服务的数据源时,应选择“OAuth2”作为身份验证方法……

还有一些功能细节的说明,比如,可以给每个步骤添加属性说明:

总的来说,微软官方的说明或帮助文档,非常的详细,但是,由于语言表达习惯、翻译方式等等原因,在没有一定基础的情况下,很多地方看起来可能会很难理解,或者更直接地说,就是“看着很难受,学不下去”!

所以,对于大多数想入门打基础的朋友来说,官方的文档可能并不是很适合——当然,可以先收藏一下。


       而对于有一定基础,需要进行更加系统、全面学习提升的朋友来说,有时间的时候,就翻查一下,则是很好的参考材料(下载链接见文末)

总的一句:

官方文档不是用来学习入门的,

是用来查漏补缺的!

- 3 -

刚好在写这篇文章时,一位新关注公众号的朋友问,你的公众号里文章这么多,该怎么学啊?——这真是有点儿醍醐灌顶的感觉!

我赶紧找个地方坐下来,做几下深呼吸,静静地想一想。

1)免费视频

对于初学者来说,最好是有免费的入门和基础应用视频先看一下,以便了解Power系列功能的基础内容以及最常见的应用,看看是否符合自己的工作需要,然后再考虑是否要进一步深入学习。

所以,我觉得应该先推荐这个免费的系列视频:30+集免费视频报名,以及腾讯课堂配套材料下载方法

2)系列文章

此外,除了基础的视频,还可以系统地看一下系列性的文章,包括入门、进阶、应用以及躲坑等等,所以,同时推荐这个Power Query的文章合集:

3)实体图书
当然,还有的朋友比较喜欢实体书的味道和感觉,那就可以参考《读这些书,学Power BI的效率提升100%!》里面的书籍。
当然,还有官方文档,不要忘了收藏备查哦。

下载链接(请复制到浏览器打开):

https://share.weiyun.com/FS2Bjmtr

(0)

相关推荐