n个关键词,还大小写不一,咋统计?
前面写了一篇关于关键词统计的文章《两个函数搞定关键词统计!》,其中主要是针对某特定关键词进行统计,比较简单,于是,有朋友提出是否可以有更进一步的案例。
![](http://pic.ikafan.com/imgp/L3Byb3h5L2h0dHBzL2ltYWdlMTA5LjM2MGRvYy5jbi9Eb3dubG9hZEltZy8yMDIxLzA1LzIyMTAvMjIyNjMxMDg2XzFfMjAyMTA1MjIxMDIyMzk2Nw==.jpg)
的确,在实际中,要统计的关键词往往是很多个,即可能是一个很长的关键词清单,甚至是一个很大的词库,同时,如果是英文的话,还可能有各种大小写不统一的情况,而实际上对于关键词的判断,往往不应该区分大小写。
![](http://pic.ikafan.com/imgp/L3Byb3h5L2h0dHBzL2ltYWdlMTA5LjM2MGRvYy5jbi9Eb3dubG9hZEltZy8yMDIxLzA1LzIyMTAvMjIyNjMxMDg2XzJfMjAyMTA1MjIxMDIyMzk0NDI=.jpg)
现在,我们就先通过简单的办法来解决这个两个问题。
-1- 大小写问题
这个问题其实很简单,即在进行统计时,对整个句子先全部转为大写或小写,关键词也全部用大写或小写,问题就解决了,示例如下:
![](http://pic.ikafan.com/imgp/L3Byb3h5L2h0dHBzL2ltYWdlMTA5LjM2MGRvYy5jbi9Eb3dubG9hZEltZy8yMDIxLzA1LzIyMTAvMjIyNjMxMDg2XzNfMjAyMTA1MjIxMDIyMzk5Mjc=.jpg)
与原来的公式比较,就是增加了Text.Upper函数,将内容全部转为大写,而关键词也用大写的。
-2- 多关键词问题
这个其实可以很容易简化为对每个关键词逐个统计,然后求和,所以实际就是一个关键词批量处理的问题。我们在上面处理大小写的基础上继续。
假设我们将关键词列表也已通过查询的方式接入PQ,统计的公式为:
![](http://n4.ikafan.com/assetsj/blank.gif)
思路非常简单,通过List.Transform函数(不熟悉的朋友可参考文章《用Power Query轻松批量抓取A股数据,及列表转换函数(List.Transform)的使用》),对关键词列表进行批量操作(转换),得到每个关键词在描述内容中的出现次数,然后通过List.Sum函数进行求和。
其中,因为关键词本身的大小写也没有统一,所以,在引用时,也要通过Text.Upper将关键词转为大写形式。
当然,关于这个问题,在这个解法的基础上,还有改善的空间,思考一下?欢迎留言讨论,一起学习,共同进步!
【近期热门合集/文章】
赞 (0)