共线性 | WGDI 一键搞定 - ColinearScan 改进版!

作为王希胤老师课题组的学生,共线性一直没有更方便或深刻的方法拿出来,有点儿惭愧。王老师是共线性分析软件ColinearScan第一作者和MCscan的重要作者。但我们共线性常常使用Colinearscan,二者在提取共线性上有细微差别,各有优劣。两个软件都是基于动态规划来实现的提取共线性。主要区别来源于对同源基因对的判别。

  • Colinearscan 的判定规则是:是一个基因相对另一个基因组同源基因的数量限制,即repeat_number的参数。

  • MCscan 的判定规则是:任意两条染色体间(即点图中的一个小方块内部),一个基因相对另外一套染色体上的基因个数(默认为5)。

  • 体现在结果上:ColinearScan 提取的是前面点图中看到的片段,古老加倍的片段常常不如 MCscan 的完整。MCscan 能够提取到更古老的片段,但会有较多不准确的片段被提取。

比较一下点图,同源的点判定的个数为 5*19(有的方块中同源点不够5个,事实上没那么多)但一般情况下也远远大于 20 。之所以都用黑色点表示,因为两个软件在提取的时候都把判定为同源的点一视同仁了。

MCscan之所以这个策略,是为了往多重序列比对上发展,如果有提前画点图的方式,就不能做到多个物种同时来比较了。
接下来就是我的改进部分了。即对同源点像点图中那样,分级别。在有多个重复基因时候,优选最好匹配的结果。
ColinearScan 的运行方式,需要安装 ColinearScan 软件,输入 blockscan 有返回值即可

wgdi -cl >> total.conf
[colinearscan]gff1 = gff1 filegff2 = gff2 filelens1 = lens1 filelens2 = lens2 fileblast = blast fileblast_reverse = Falsedir = output folder 生成一个目录,任意两条染色体比较evalue = 1e-5score = 100mg = 25,25 两个基因对被认为能连起来的最大距离(罚分)repeat_number = 20positon = order 目前只支持orde

输出文件以dir+block.txt 命名
我的改进后的程序,python编写,不需要c环境,有些慢。

wgdi -icl >> total.conf
[collinearity]gff1 = gff1 filegff2 = gff2 filelens1 = lens1 filelens2 = lens2 fileblast = blast fileblast_reverse = falsedir = output folderevalue = 1e-5score = 100 和点图保持一直grading = 50,40,25 红,蓝,灰的不同分值mg = 25,25repeat_number = 20 和点图保持一直positon = ordersavefile = collinearity file 输出文件
(0)

相关推荐

  • 使用GlimmerHMM 预测基因 此博文包含视频 (2018-01-04 13:13:24)转载

    ▼分类: 生物信息学1:软件网址:https://ccb.jhu.edu/software/glimmerhmm/2:下载近源物种的gff文件以及基因组序列,这个近源物种的寻找,个人的方法就是搞清楚你 ...

  • 多重PCR引物设计示范

    原文地址:多重PCR引物设计示范 原文作者:生物技术创新创业-韩健 有同行使用iCubate2.0以后不知到下一步如何做,这里试图介绍一下我们的经验. iCubate2.0现阶段的一个局限就是没有做S ...

  • 生物信息

    比较基因组学中,共线性的分析的图无疑是最漂亮的. 共线性分析可以很好地解释进化关系和多倍化事件. 本文主要介绍的是唐老师的Python版McScan(jcvi工具包),这个包很强大,但是其功能在官网的 ...

  • 技术贴 | 物种内部基因的共线性分析

    本文由沐子星根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导读 今天我们学习物种内部的基因共线性分析,基因的共线性分析在基因家族类分析中很常见,通常基因家族主要通过串联重复.片段复 ...

  • 更新版 | 共线性!WGDI 一键搞定 - ColinearScan 改进版!

    共线性分析 作为王希胤老师课题组的学生,共线性相关分析上,一直没有提出更方便或深刻的方法,着实有点儿惭愧.王老师是共线性分析软件ColinearScan的第一作者和MCscan的重要作者.在我们课题组 ...

  • 免费!在线考试系统,员工考核/部门评比一键搞定

    互联网时代将许多工作由线下搬至线上,通过科学化管理线上考试测评.在线考试平台集智能组卷,PC+微信+手机考试,自动阅卷与快速统计分析功能于一体.正因如此,现在很多的企业开始使用在线考试平台进行员工考核 ...

  • 安卓换iPhone数据怎么转移?这款神器一键搞定

    换新手机了,内心当然是巨爽无比了,我的新手机耶!可是换机时有个步骤却让人觉得有点麻烦,那就是如何快捷的将旧手机的资料转移到新手机里去,安卓与iOS又如何互通呢?以前的操作得先将数据导出到电脑,然后可能 ...

  • 这4个抠图工具,电脑手机都能一键搞定,比PS方便快捷!

    旅行途中,心血来潮想P个图:偶尔躺卧家中,如何能把自己与远在深处的大海滩结合在一起呢,这就必须用到一个神奇的操作--抠图. 今天小妞说的4个免费工具,分别能解决4个类型的伙伴们,一是在电脑旁不愿用ps ...

  • Excel单元格中怎么设置页边距,教你一键搞定他

    Excel单元格中怎么设置页边距,教你一键搞定他

  • 拍的照片变形、打印出来发黑!这款软件一键搞定

    函数公式.职场模板.财务应用.分析图表.练习题.软件工具.表格合并.Office 365.Power Query.表格美化.符号作用.条件格式.学会骗.一本不正经.避坑指南.数据整理.筛选技巧.偷懒宝 ...

  • 2021全新PR高级分屏预设,画面分屏一键搞定!

    我们在后期剪辑工作中 经常会对画面进行分屏处理 但是分屏制作往往不太友好 繁琐的调节多图层的位置 大小,裁剪,等参数 着实让人烦恼 极大的降低了工作效率 本期我们给大家带来了 2021全新高级PR分屏 ...

  • 要导出所有Power BI数据表?用DAX Studio一键搞定!

    经常有朋友问,想导出Power BI Desktop里已经清洗好的数据表,但做成视觉对象后导出数据量有限制,复制表也很麻烦. 那么,怎么能将PBI里的数据方便地导出来呢?甚至导出其中所有的表数据呢?其 ...

  • 这样的数据分列也一键搞定!真是太Power了!

    小勤:像这样的数据,怎么将文字和数字分别拆开到不同的列啊? 需要结果如下: 大海:这个问题如果在Power BI里,现在太简单了.操作如下:Step 01 按照从数字到非数字的转换拆分列 Step 0 ...