对不起,这些技术细节,只能翻微软官方操作手册了! | 附PQ手册下载
- 1 -
前段时间,我发表了文章《就用了一下合并查询的模糊匹配,VLOOKUP实在太弱了!| PQ实战》。
里面提到模糊匹配的算法问题,本来并不打算深究细讲,因为可以预计的是,将来一定会有越来越多的智能算法,我们根本就没有时间精力、也完全没有必要都去搞明白,尽管用就是了!
但因为问的朋友多了,感觉也不好再“逃避”下去
……所以,我翻开了微软的1074页Power Query官方文档(文末附下载链接):
单从目录,就能看出这里包含了超级详细的解析、关联说明(当然,也会显得比较臃肿、啰嗦)。
翻到“模糊合并”的内容,Note里,其实标注了合并查询的模糊匹配使用的是“Jaccard相似性算法”!
有了这个说明,接下来就简单了,随便搜索一下“Jaccard”,就能找到相关的算法说明:
还有举例的说明,更加直观:
一是,你可以按需要改进这个算法,比如,增加一些明确的判断条件等等,使得它更加精准;
二是,你可以看看其他(比如公司开发某些系统)需要做模糊匹配的场景下,是否可以借鉴这个算法进行实现。
- 2 -
当然,除了上面的算法备注,官方文档还给出了很多功能的注意事项。
比如,将OneDrive for Business文件用作Power BI服务的数据源时,应选择“OAuth2”作为身份验证方法……
还有一些功能细节的说明,比如,可以给每个步骤添加属性说明:
总的来说,微软官方的说明或帮助文档,非常的详细,但是,由于语言表达习惯、翻译方式等等原因,在没有一定基础的情况下,很多地方看起来可能会很难理解,或者更直接地说,就是“看着很难受,学不下去”!
所以,对于大多数想入门打基础的朋友来说,官方的文档可能并不是很适合——当然,可以先收藏一下。
而对于有一定基础,需要进行更加系统、全面学习提升的朋友来说,有时间的时候,就翻查一下,则是很好的参考材料(下载链接见文末)。
总的一句:
官方文档不是用来学习入门的,
是用来查漏补缺的!
- 3 -
刚好在写这篇文章时,一位新关注公众号的朋友问,你的公众号里文章这么多,该怎么学啊?——这真是有点儿醍醐灌顶的感觉!
我赶紧找个地方坐下来,做几下深呼吸,静静地想一想。
1)免费视频
对于初学者来说,最好是有免费的入门和基础应用视频先看一下,以便了解Power系列功能的基础内容以及最常见的应用,看看是否符合自己的工作需要,然后再考虑是否要进一步深入学习。
所以,我觉得应该先推荐这个免费的系列视频:《30+集免费视频报名,以及腾讯课堂配套材料下载方法》
2)系列文章
此外,除了基础的视频,还可以系统地看一下系列性的文章,包括入门、进阶、应用以及躲坑等等,所以,同时推荐这个Power Query的文章合集:
下载链接(请复制到浏览器打开):
https://share.weiyun.com/FS2Bjmtr