n个关键词,还大小写不一,咋统计?

前面写了一篇关于关键词统计的文章《两个函数搞定关键词统计!》,其中主要是针对某特定关键词进行统计,比较简单,于是,有朋友提出是否可以有更进一步的案例。

的确,在实际中,要统计的关键词往往是很多个,即可能是一个很长的关键词清单,甚至是一个很大的词库,同时,如果是英文的话,还可能有各种大小写不统一的情况,而实际上对于关键词的判断,往往不应该区分大小写。

现在,我们就先通过简单的办法来解决这个两个问题。

-1- 大小写问题

这个问题其实很简单,即在进行统计时,对整个句子先全部转为大写或小写,关键词也全部用大写或小写,问题就解决了,示例如下:

与原来的公式比较,就是增加了Text.Upper函数,将内容全部转为大写,而关键词也用大写的。

-2- 多关键词问题

这个其实可以很容易简化为对每个关键词逐个统计,然后求和,所以实际就是一个关键词批量处理的问题。我们在上面处理大小写的基础上继续。

假设我们将关键词列表也已通过查询的方式接入PQ,统计的公式为:

思路非常简单,通过List.Transform函数(不熟悉的朋友可参考文章《用Power Query轻松批量抓取A股数据,及列表转换函数(List.Transform)的使用》),对关键词列表进行批量操作(转换),得到每个关键词在描述内容中的出现次数,然后通过List.Sum函数进行求和。

其中,因为关键词本身的大小写也没有统一,所以,在引用时,也要通过Text.Upper将关键词转为大写形式。

当然,关于这个问题,在这个解法的基础上,还有改善的空间,思考一下?欢迎留言讨论,一起学习,共同进步!

【近期热门合集/文章】

(0)

相关推荐