实用 | Excel.xlsx 文件批量转换为 制表符分隔文件.tab.txt

写在前面

绝大多数生物信息学分析软件只接受制表符(即键盘上的 Tab)分隔的文本文件。而日常表格处理时,我们常常会使用 Excel 等软件,对应使用的是 二进制的 .xlsx 文件。直接将 .xlsx 文件设置为其他绝大多数生信软件的输入,往往只会遇到报错。
解决办法很简单,打开 Excel 文件 -> 文件另存为 -> 制表符分隔的文本文件。但这个操作存在几个问题:

  1. 需要专门打开 excel 文件

  2. Excel 文件过大时,加载需要不少时间(甚至可能出现自动换行的情况,每一行甚至格是有长度限制的)

  3. 如果一个 Excel 中有几个表(Sheet),那么需要另存为多次
    。。。

等等问题。甚至如果你的 Excel 没有注册,那可能还得被提示要注册。多少是麻烦。我一直有想法写个转换器,因为这个实现起来还是很简单的(毕竟不像绝大多数TBtools功能)。这几天,在协助课题组赶一个文稿,月底要投出去。遇到一个问题,即公司返回的转录组数据分析结果中,所有文件是 Excel 文件.xlsx,如下。

Emmm,那就没办法用 TBtools 做文本处理了(比如表格批量筛选,表格快速合并等等,当然也不能很好的写脚本处理)。
索性,我写了一个 TBtools 新的小插件。

Excel to Tab 插件

插件已经上线到Plugin Store,建议从高速商店下载,不了解的请参考之前的推文《Plugin | 高速版插件商店!我又有一个绝妙的 idea》。

插件使用非常简单

使用实例

批量转换表格

转换完成会有弹窗提示

当然,也支持每个Excel文件中存在多个表格,如

转换前,在excel中

转换后

接下来,就可以愉快的使用 TBtools 中大量方便的表格处理工具,也可以....直接写几个命令批量处理文件了。当然后者是我目前主要目的。

写在最后

Excel 文件批量转换成文本文件,Emmm,多少还是有用的吧。对于一些想偷懒的人。比如我,常常不太乐意打开 .xlsx 文件,毕竟只是为了另存为一次文件,不如一次 Start。

(0)

相关推荐