多个Sanger测序结果和多序列比对结果的可视化
写在前面
转眼五一假期就要结束。事实上,在每一个假期,我总是有一些想做的事情,比如完成某个分析任务?或者是写一个不错的工具。今次假期比较特殊,我似乎变得愿意安排出时间陪伴本应多陪伴的人。当然,这也是TBtools早期开发的目的之一。
节省可以节省的时间,用于陪伴家人。
虽然说是陪伴,主要还是在家宅着,看了几部电影,吃了罗锅,大量水果,大量肉食...。从某个角度来说,这种休假方式,确实是比较舒适。Anyway,我一样安排了时间做一些数据分析的工作。但毕竟是假期,我的习惯可能还是make something。于是,花了大半天的时间,在TBtools中,增加了两个功能。
批量查看Sanger测序峰值图(.ab1)
做分子实验的朋友,可能才会明白这个功能存在的意义。十年前(...大一...我确实有点老了),我入学并随后进去了华南农大何业华教授的课题组学习(也是我的硕士导师)。我接触的第一个分子实验,即是克隆一个基因。但凡克隆,就要测序。对于每个克隆,公司往往会返回两个文件:
.ab1 文件,即测序峰值图(下机数据,信息全面)
.seq或.txt 文件, 即baseCalling之后的序列(只对可信位点取峰值最好的碱基),丢失了信息,也可能出现错误Calling,但实用
往往,我们克隆并送质粒到公司做Sanger测序时,我们总会对同一个克隆片段,送几个样品与公司。一方面,Sanger测序时部分碱基也会测不准,多送几个样品,可以相互验证;另一方面,我们需要考虑SNP存在的可能...
于是,我们会同时对同一个片段,收到数个.ab1文件。
对于这些.ab1文件,存在很多工具可以直接查看,如bioedit,DNAman?但很多时候,似乎他们只支持一次展示一个样品。而我们需要的可能是同时真实四个样品,以人工查看某些位点/SNP的可靠性(我当然知道有软件可以做到,我只是看看这个功能是不是很难写,结果似乎不是)。
使用这个功能比较简单,首先是打开这个功能
将.ab1文件直接拖拽或通过摁钮选择并放入其中(这里用两个文件做示例)
点击Start,即可看到这个图
Emm...是的,我并没有将多序列比对应用进去...感觉似乎麻烦。
所以此时,应该是键盘摁住Ctrl键,鼠标拖拽SubPanel,使其对其
别忘了,鼠标滚轮可以放大缩小图片
OK,发现一个测序错误?还是?总之多了两个AA,而且应该是比较可靠
总的来说,似乎有用...尤其是当你不止有一个克隆的情况下。或者是,你需要一张图,去说服其他人,这确实有个SNP....
快速可视化多序列比对结果
很久之前,我已经将Muscle打包到TBtools中,那会只是顺便。没想到在后续我有数次还是用上了。总的来说,体验一般。主要原因是,没有可视化结果,那么其实即使比对出来,也不容易做数据观测。
于是我加了一个自动展示多序列比对结果的功能。
首先是打开这个Wrapper
随后是设置用于多序列比对的序列(可以是文件,也可以是文本区域;输出也是一样支持两种)
简单实用以上的序列作为输入
可以同时看到图片,如果你还记得这两个AA
但,事实上,这个功能更适合序列较多的情况,如
写在后面
写工具,终归是消遣时间。睡觉。
题外
课题组每年暑期有内部生信入门培训,主要是对实验室新生开展(以及湿实验为主的成员)培训。一直有收到其他课题组想要了解我们课题组生信数据分析的想法。故,在博导的提议和课题组的讨论后,我们近期计划,在本年度暑期(7~8月份之间)对外增设生信基础培训名额10枚(前面每年只是课题组内培训,而不对外)。具体请见https://mp.weixin.qq.com/s/OtmeTErd9f9rvjJPtBKjMw
欢迎访问本课题组网站
园艺植物小分子RNA与基因组研究-夏瑞课题组
课题组主页:http://xialab.scau.edu.cn/