所有人 - 10秒掌握神器 - 完成少量序列 - 加速你的生信数据下游分析
写在“写在前面”的前面
有一句名言说得特别好,这里必须分享!
“如果你经常需要花费超过三秒钟去完成一个简单的事情,那么说明,你没用对工具。--- CJ”。
写在前面
《-零命令行-生信下游数据分析》的第二帖主题,定为序列操作。
或许,所有做生物数据的朋友都躲不过的,就是序列操作。尤其是做分子生物学实验的朋友,相信早已有自己熟悉的一款软件。但是,这篇推文会提供一个我最爱不释手也自认为最方便的序列操作姿势,之所以这个姿势我这么推荐,主要原因是,真(shi)的(wo)很(xie)快(de)。
掌握了这个姿势,或许你可以为你以后的每一次序列操作节省几秒钟(在以往使用网页工具时,这几秒钟可能显得更久)。接下来,你可能需要浪费30秒的时间读完本文这篇 10秒 教程。
10秒掌握新操作
掌握姿势的第一步,打开TBtools。
你需要打开对应的工具,“Sequence Toolkits => Fasta Tools => Fasta Manipulator”
那么你会得到这个
要完成接下来的演示,我们可能需要一个序列。
清理非序列字符
于是,我找到了NCBI,比如我需要这条序列
https://www.ncbi.nlm.nih.gov/nuccore/HM236375.2
在网页复制到序列的时候,你可能会发现,这个序列中有数据,很麻烦。
于是你可能可以这样,清理所有数字
于是,我们有了序列作为示例,我们可以做很多有趣的事情
改变大小写
颜值很重要,大写更容易看明白
修改每行碱基数目
每行序列太多了,看着不舒服,可以修改为50,(反之,也可以直接修改为1000000...,那么整个序列就只有一条)
取序列的反向互补
这个操作,可能才是最多人需要用的
速度太快,我很感动
小众需求,转成RNA序列
现在的课题组做RNA层面的研究比较多,有时候,需要用到RNA序列,于是
讲完了
那么Refresh摁钮有啥用?其实就是放着觉得舒服,有时候,点一点会舒服很多,比如不喜欢摁回车的时候
补充一点
以上都是单个小序列的,那么多个序列呢?
这种情况下,你可能需要输入Fasta格式(相信大家都知道是啥格式....),正如下图
所以,当你有大量序列的时候,也就可以....
批量反向互补或者其他
写在最后
每一个人,都应该找到最适合自己的方式去做事情。处理数据这个事情上,可选的操作有很多,可以自己写脚本,可以用网页用具,本地的命令行工具,或者本地的界面化工具。而一个真正意义的工具,应该是让你在最短的时间完成最漂亮的工作。
使用TBtools,加速你的操作,节省你的时间,享受你的生活。