FILTERXML函数,用过没?

今天给大家聊一个比较陌生的函数:FILTERXML

语法格式:FILTERXML(xml, xpath)

这个函数有两个必需的参数,第1参数是有效的xml格式的字符串,第2参数是指定的xpath。

正常而言,该函数常用于解析xml结构的网页数据。但不正常的是……咱们可以人为搭建xml格式的字符串,进而实现原本很复杂的文本处理问题。

举个例子。

以上图所示的数据为例,需要按分隔符拆分。

参考函数如下:

C2单元格输入公式后横/纵向填充 ▼

=IFERROR(INDEX(FILTERXML('<a><b>'&SUBSTITUTE($A2,'-','</b><b>')&'</b></a>','a/b'),COLUMN(A1)),'')

有朋友可能会觉得这个问题更适合使用基础技巧:分列

基础技巧和函数的优劣区别咱们说过很多次了,函数的优势有两个,一个是可以搭建结果和数据源之间的关联,当数据源发生了变动,计算结果可以自动更新,另外一个是函数的计算结果可以嵌套在另外一个函数中继续使用,比如说……

现在需要获取A列中的数值,并按从小到大排序。

参考函数如下:

C2单元格输入公式后横/纵向填充 ▼

=IFERROR(SMALL(FILTERXML('<a><b>'&SUBSTITUTE($A2,'-','</b><b>')&'</b></a>','a/b'),COLUMN(A1)),'')

再比如说,统计下图所示A列数据中不重复的人名数:

参考函数如下:

B2单元格输入公式后向下复制填充 ▼

=COUNTA(FILTERXML('<a><b>'&SUBSTITUTE($A2,'-','</b><b>')&'</b></a>','a/b[not(following::*=.)]'))

又或者,将A列不重复的人名拆分:

参考函数如下:

C2单元格输入公式后横/纵向填充 ▼

=IFERROR(INDEX(FILTERXML('<a><b>'&SUBSTITUTE($A2,'-','</b><b>')&'</b></a>','a/b[not(following::*=.)]'),COLUMN(A1)),'')

……

以上函数解法中都使用到了FILTERXML函数,下面稍微解释一下它,大家就多少了解一下。坦白的说,这些都是套路,理不理解并不重要,重要的是遇到同类问题会套用。

以下部分是FILTERXML函数的第1参数:

'<a><b>'&SUBSTITUTE($A2,'-','</b><b>')&'</b></a>'

SUBSTITUTE函数将A2单元格的分隔符,替换为</b><b>,最后返回一个xml结构的字符串。

<a><b>看见星光</b><b>随风小妞</b><b>看见星光</b></a>

至于啥是xml……感兴趣的朋友可以搜狗。

简单而言,它是一种可扩展标记语言,有标签组成节点,标签必须按合适的顺序进行嵌套,任何的起始标签都必须有一个结束标签。

以上文为例,<a>是开始标签,</a>是结束标签。b是嵌套在a节点内的子节点。

如果我们需要获取a节点下所有b节点的内容,可以将FILTERXML函数第2参数的xpath设置为:

a/b

此时FILTERXML函数返回一个纵向一维内存数组。

{'看见星光';'随风小妞';'看见星光'}

如果在获取a节点下所有b节点文本内容的同时去重复,可以将FILTERXML函数第2参数的xpath设置为:

a/b[not(following::*=.)]

最后,再在FILTERXML函数外嵌套其它查询/聚合/容错函数,即可返回指定结果。

……

挥挥手,下期再见。

图文制作:看见星光

原载:Excel星球

(0)

相关推荐