hpv病毒基因研究调研

2024-06-15 14:02:50

2015年有一篇文献中提到了hpv的研究现状

As of May 30, 2015, 201 different HPV types had been completely sequenced and officially recognized and divided into five PV-genera: Alpha-, Beta-, Gamma-, Mu-, and Nupapillomavirus.

文献地址： http://www.ncbi.nlm.nih.gov/pubmed/26086163

根据文献，我找到了hpv所有已知测序种类的参考基因组网站：http://www.hpvcenter.se/html/refclones.html

截至到2015年7月已经有了205种，我爬取它们的genebank ID号，然后用python程序批量下载了它们的序列，能下载的序列共179条，都是8K左右的碱基序列。

根据genebank ID或者其它ID号批量下载核酸序列的脚本如下：

import sys
import time
import random
from Bio import Entrez
ids=[]
infile=sys.argv[1]
for line in open(infile,'r'):
line=line.strip()
ids.append(line)
for i in range(1,len(ids)):
# t = random.randrange(0,5)
handle =
Entrez.efetch(db="nucleotide", id=ids[i],rettype="fasta",email="jmzeng1314@163.com")
# time.sleep(t)
print handle.read()

脚本的使用很简单，保持输入文件是一行一个ID号即可。同时，根据文献我们也能得到hbv病毒提取方法当然，我当年居然写过python？？？

同样，拿到下载的178条序列我们可以做一个进化树，在那篇文章中已经做好了，我就不做了。

下载179条hpv序列，每条序列都是8KB左右。我还用了R脚本批量下载

library(ape)
a=read.table("hpv_all.ID") #输入文件是一行一个ID号即可
for (i in 1:nrow(a)){
tmp=read.GenBank(a[i,1],seq.names = a[1,1],as.character = T)
write.dna(tmp,"tmp.fa",format="fasta", append=T,colsep = "")
}

然后用muscle做比对，比对过程相对比较简单，大家感兴趣可以参照我之前的几篇笔记。

Muscle进行多序列比对

http://www.bio-info-trainee.com/?p=659
Figtree的把进化树文件可视化

http://www.bio-info-trainee.com/?p=660
用phyML对多重比对phy文件来构建进化树

http://www.bio-info-trainee.com/?p=626

muscle -in mouse_J.pro -out mouse_J.pro.a
muscle -maketree -in mouse_J.pro.a -out mouse_J.phy

貌似时间有点长呀，最后还莫名其妙的挂掉了，可能是我的这个测试服务器配置有点低。

(非常经典的 segmentation fault )

进化树如下所示：

赞 (0)

HPV18是普遍病毒吗？怎么预防呢？

在HPV这个大病毒体系里面,包含有100多种病毒组合而成的.
故事·寓言13丨The Lion and the Mouse

ID:sxlsxzb 学习之路,现在开始也不晚每天10分钟,让学习英语成为一种习惯! 每天与您分享各种有趣的英语学习资源!
生信分析人员数据处理脚本实战 | 生信菜鸟团

我前面写到了生信分析人员如何入门linux和perl,后面还会写R和python的总结,但是在这中间我想插入一个脚本实战指南.其实在我前两篇日志里面也重点提到了学习编程语言最重要的就是实战了,也点出了 ...
故事·寓言23丨 The Frog and the Mouse

ID:sxlsxzb 学习之路,现在开始也不晚每天与您分享各种有趣的英语学习资源!
全球及中国特殊益生菌菌株行业专项调研及前景调查研究分析报告2021年版

第1章:行业综述1.1 特殊益生菌菌株行业简介 1.2 特殊益生菌菌株主要分类和各类型产品的主要生产企业 1.3 特殊益生菌菌株下游应用分布格局 1.4 全球特殊益生菌菌株主要生产企业概况 ...
中国防雷行业深度调研及投资战略研究分析报告2021年版

第1章:中国防雷行业发展态势分析1.1 防雷行业范畴界定 1.1.1 定义 1.1.2 管理机构 1.1.3 防雷设计.施工单位的企业资质的等级与范围 1.2 原材料市场对防雷行业的推力分析 1.2. ...
中国交通安全管理设施行业深度调研及未来发展趋势研究预测报告2021年版

第1章:中国交通安全管理设施行业的发展综述1.1 交通安全管理设施行业定义及产品分类 1.1.1 交通安全管理设施行业定义 1.1.2 交通安全管理设施行业产品分类 1.2 交通安全管理设施行业产业链 ...
中国传媒广告产业深度调研及前景战略研究分析报告2021年版

第1章:传媒广告产业定义及发展环境分析1.1 传媒广告产业定义及地位 1.1.1 传媒广告产业定义 1.1.2 传媒广告产业在国民经济中的地位分析 1.2 传媒广告产业政策环境分析 1.2.1 传媒广 ...
中国汽车零部件制造行业调研与投资战略规划研究预测报告2021-2027年

第1章:中国汽车零部件制造行业发展综述1.1 汽车零部件制造行业定义及分类 1.1.1 汽车零部件的相关概念 1.1.2 汽车零部件主要产品大类 1.1.3 行业在国民经济中的地位 1.2 汽车零部件 ...
报告 | 中国REITs指数研究：不动产资本化率调研

来源:北京大学光华管理学院 REITs是一种风险适中.高比例分红.流动性较好的新型投资工具.在二级市场 ,REITs产品的份额交易价格.分红派息表现,备受投资者的关注. "REITs市场具有 ...
全球及中国无溶剂复膜胶行业运营状况分析研究及投资调研报告2021-2027版

2020年,全球无溶剂复膜胶市场规模达到了XX百万美元,预计2027年可以达到XX百万美元,年复合增长率(CAGR)为XX% (2021-2027).中国市场规模增长快速,预计将由2020年的XX百万 ...
2021-2025年中国环保产业调研及“十四五”投资战略研究预测报告

今年全国两会恰逢"十四五"的开局之年,针对于2021年,提出了"加强污染防治和生态建设,持续改善环境质量,深入实施可持续发展战略,巩固蓝天.碧水.净土保卫战成果,促进生 ...
全球及中国食品膨松剂行业全景调研与未来发展战略研究预测报告2021年版

第1章:行业综述1.1 食品膨松剂行业简介 1.2 食品膨松剂主要分类和各类型产品的主要生产企业 1.3 食品膨松剂下游应用分布格局 1.4 全球食品膨松剂主要生产企业概况 1.5 全球食 ...