生信编程直播第0题-生信编程很简单!
貌似顺序有点怪异,我们都把1~8题给讲解完了,现在才开始第0题,很明显,这个是临时加入的,因为有很多没有编程基础的朋友也开始跟着我们学习了。
还不知道怎么回事的先查看历史题目:
生物信息学技能面试题(第1题)-人类基因组的外显子区域到底有多长
生物信息学技能面试题(第4题)-多个同样的行列式文件合并起来
生物信息学技能面试题(第5题)-根据GTF画基因的多个转录本结构
生物信息学技能面试题(第6题)-下载最新版的KEGG信息,并且解析好
本次的第0题是真真正正的适合0基础朋友学习的,请珍惜!
首先安装bowtie2这个软件,里面有测试数据!
## Download and install bowtie
cd ~/biosoft
mkdir bowtie && cd bowtie
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.9/bowtie2-2.2.9-linux-x86_64.zip
unzip bowtie2-2.2.9-linux-x86_64.zip
针对测试数据:
对FASTQ的操作
5,3段截掉几个碱基
序列长度分布统计
FASTQ 转换成 FASTA
统计碱基个数及GC%
对FASTA的操作
取互补序列
取反向序列
DNA to RNA
大小写字母形式输出
每行指定长度输出序列
按照序列长度/名字排序
提取指定ID的序列
随机抽取序列
高级难度:
根据坐标取序列
多文件合并
根据ID列表取序列
GTF文件探索
简并碱基的引物序列还原成多条序列
snp进行注释并格式化输出
第0题会录制3次视频~
赞 (0)