厉害了!疾病和药物基因哪里找?这个数据库是你的课题思路之源!也太太太太太太实用了吧!
嗨,小伙伴们大家好!酸菜校长在36策第5策“引药生变”中有详细介绍药物作为主变量的研究套路。
何谓“引药生变”?字面意思理解便是,引入合适的药物作为主变量,可让课题设计变化无穷妙处。古人云:《易》穷则变,变则通,通则久。往往有无穷变化,便意味着无限可能,由此产生无限机遇。
有时候当我们夙兴夜寐、兀兀穷年、焚膏继晷、夜以继日、不分昼夜、通宵达旦做课题,皓首穷经、殚精竭虑、冥思苦想、煞费苦心、绞尽脑汁而终不可得时,不放换个思路去找找是否有适合的药物可以引入研究设计。神农百草浩如烟海,化学物质宛若星河,掌握方法,去挖掘如此宝藏,难道不值得你心动么?!学会引药生变,何愁“自天佑之,吉无不利”
呵!闲话少叙,新的一周给大家带来基因、药物与疾病网络关系数据库CTD,带你掌握引药生变的技巧,一起来康康吧~!
数据库概览
CTD数据库(Comparative Toxicogenomics Database)整合大量化学物质、基因、功能表型和疾病之间相互作用数据,为疾病相关环境暴露因素及药物潜在作用机制研究提供极大便利,自于2004年发布以来一直是广受好评。该数据库目前更新至2021年版本,总计超过4664万上述相互作用数据,包括超过230万种化学物质、46689个基因、4340个表型和7212种疾病信息。
进入数据库主页(https://ctdbase.org/),可见CTD数据库6大用途:
①查询和疾病相关的基因;
②查询和疾病相关的化学物质;
③查询与基因或蛋白相互作用的化学物质;
④查询与化学物质相互作用的基因或蛋白;
⑤查询基因/蛋白与化学物质相互作用参考文献;
⑥查询化学物质相关GO功能条目。
主页右侧栏,上半部分为快速检索框,下拉菜单可以选择需要检索的信息类型;下半部分为数据库分别在化学物质、疾病和基因方面的数据更新信息。
数据库主页面功能菜单栏:Home下拉可见该数据各种介绍;Search下拉为数据库各种检索功能模块;Analysis下拉为数据库各种分析功能模块;Download菜单提供数据库数据下载链接;Help下拉有常见问题和数据库使用指南。Home和Help菜单,感兴趣的小伙伴可以自行浏览,Search、Analysis和Download三大核心功能板块,接下来将给大家做详细介绍和操作演示。
数据库功能及操作演示
1
检索模块:Search
首先点击All Search可见该数据库各个检索子模块的具体功能。Chemicals化学物质检索子模块,可以访问物质结构、毒理学数据,以及与之相关的基因、GO条目、疾病、通路和参考文献信息。Diseases疾病检索子模块,可以浏览人类疾病相关的化学物质、基因通路和参考文献。Genes基因检索子模块,可以关键词Gene symbol、Accession ID、物种、化学物质、相互作用类型、疾病或GO注释条目进行检索,获得相关基因/蛋白质信息。Chemical–Gene Interactions化学物质与基因相互作用检索子模块,基于文献检索跨物种的化学物质与基因/蛋白质相互作用信息。Chemical–Phenotype Interactions化学物质与表型相关检索子模块,基于文献检索跨物种的化学物质与表型相关信息。
References参考文献检索子模块,按基因、物种、化学物质,化学物质与基因相互作用类型、疾病、引用信息或Accession ID检索参考文献。Gene Ontology (GO)和Pathway检索子模块,浏览带有功能注释的基因和疾病相关性信息。Organisms按照物种查询基因表达信息。Exposure Studies Query和Exposure Details Query子模块,可以关键词如化学物质、基因、疾病、表型、受体描述、国家/地区,作者和/或标题/摘要等检索与暴露事件相关的研究和声明。Batch Query提供批量检索功能。
应用一
检索与已知化学物质有关的基因/蛋白、疾病、表型和GO/pathway信息
点击Chemicals进入检索页面,可以按照化学物质分类进行逐级浏览,或在左上角检索感兴趣的物质。与该化学物质相关的基因、疾病、参考文献和表型都有不同的符号标志,页面下方有注释。
以二甲基亚砜(DMSO)为例,检索框输入DMSO后点击Search,结果页面显示该数据库中DMSO及其衍生物,点击目标Dimethyl sulfoxide查看详情。
首先,Basic是DMSO基本描述,CAS命名及别名、CAS注册号、定义范围、化学结构式、Top交互基因、主题词ID和其他化合物数据库扩展链接,页面下拉是数据库收录的DMSO衍生物列表。
其次,Gene Interactions和Gene展示与DMSO相互作用的基因和交互关系,Gene列表可根据交互关系数据进行排序,点击数字可查看全部交互关系。页面最底部可下载全部结果列表。
Disease展示与DMSO相关的疾病,可根据Disease category(疾病类型)和Association type(Curated或Inferred)对结果进行过滤,列表展示结果证据等级、交互网络、预测评分和参考文献,并提供富集分析功能。Enrichment Analysis可分别进行疾病、GO和通路富集分析。
Phenotypes展示与DMSO相关的表型,列表展示交互关系、交互网络、物种和参考文献信息。
Comps展示与DMSO交互基因类似的化学物质,可以根据基因上调或下调,或与基因交互类型,对结果进行过滤。网站对上述结果Top10进行通路富集,点击Visualize查看可视化结果。
接下来是GO、Pathway富集分析结果。
该结果无DMSO相关环境暴露因素研究,以谷胱甘肽为例,Exposure Studies/Exposure Details信息如下。
应用二
检索与基因/蛋白有关的化学物质、疾病、表型和GO/pathway信息
点击Gene进入检索页面,可以在左上角检索感兴趣的基因/蛋白,或设置与化学物质互作关系、基因或蛋白或mRNA、疾病以及Pathway/GO等检索条件进行精确检索。
以SOX2为例,检索框输入SOX2,点击Search,检索结果中选择SOX2,点击进入查看详情,与前文类似,不再赘述。
应用三
检索与疾病有关的基因/蛋白、化学物质、表型和GO/pathway信息
点击Disease进入检索页面,可以按照疾病分类进行逐级浏览,或在左上角检索感兴趣的疾病。以高血压为例,左上角检索框输入Hypertension,点击Search,结果展示各种原发或继发高血压类型。点击感兴趣的条目进入详情页面,与前述类似。
应用四
检索药物与基因/蛋白互作关系
点击Chemical–Gene Interaction Query进入检索页面,与Gene检索模块类似。以检索丁酸(butyric acid)与MAPK1互作关系为例:Chemical字段选择equals精确检索,点击Select在弹出窗口输入butyric acid,点击列表中butyric acid前面Use;Chemical–gene interaction字段选择ANY;Gene字段选择equals精确检索,点击Select在弹出窗口输入MAPK,点击列表中MAPK1前面Use;点击Search得到检索结果。
得到3条文献支持结果:乙酸促进MAPK1蛋白磷酸化水平;乙酸与1'-acetoxychavicol acetate协同促进MAPK1蛋白磷酸化水平;乙酸促进MAPK1蛋白磷酸化水平被Acetylcysteine所抑制。上述结果均可查看参考文献。
应用五
检索药物与表型相关关系
点击Chemical–Phenotype Interaction Query进入检索页面,以检索丁酸(butyric acid)与凋亡表型关系为例:同前法,Chemical字段选择butyric acid;Phenotype字段选择equals精确检索,点击Select在弹出窗口输入apoptotic process,点击前面Use;点击Search得到检索结果。
结果可见丁酸促进肝脏、肿瘤、皮肤和U937细胞系的细胞凋亡过程。列表展示物种、相关基因网络和参考文献信息。
应用六
检索药物与某GO条目或Pathway基因集的相关关系
点击Gene进入检索页面,以丁酸(butyric acid)与MAPK通路为例:同前法,Chemical字段选择butyric acid;GO或Pathway字段选择equals精确检索,点击Select在弹出窗口输入MAPK,点击前面Use;点击Search得到检索结果。
应用七
检索药物相关文献
点击Reference进入检索页面,检索条件设置与前文类似,输入化学物质后,可以限定与基因互作方式、基因、疾病、表型和物种,可以限定作者、标题和摘要等条件,进行精确检索。此处不再赘述。
检索模块其他功能与前文所述大同小异,感兴趣的小伙伴们可以自行摸索,此处不再一一赘述啦~!
2
分析模块:Analyze
首先点击All Tools可见该数据库各个分析子模块的具体功能。Batch Query,批量查询并下载一组化学物质、疾病、基因、GO条目/Pathway之间相关联的数据;Set Analyzer,基于化学物质列表或基因列表进行疾病分析、GO/Pathway富集分析和基因互作分析;My Gene Venn,将基因列表与最多两种化学物质或疾病相关基因进行比较。My Venn,查看自定义数据与CTD数据库化学物质、疾病、基因、GO条目/Pathway或任何其他数据列表之间的关系。Venn Viewer,比较最多三种化学物质、疾病或基因的关联数据集。
应用一
对已有基因/化学物质列表进行疾病关联、GO/Pathway分析
点击Set Analyzer进入功能模块,输入类型选择Genes,输入上述1-应用六中丁酸(butyric acid)与MAPK通路交互的基因集,以选择Enrich Pathway为例,其他参数默认,点击Submit得到结果。结果显示富集程度最高的即为MAPK信号通路。
输入类型选择Chemicals,输入乙酸、丙酸、丁酸,以选择Enrich Pathway为例,其他参数默认,点击Submit得到结果。结果显示富集到MAPK信号通路。
应用二
对已有基因列表与某药物相关基因集进行共表达分析
点击Set Analyzer进入功能模块,输入上述1-应用六中丁酸(butyric acid)与MAPK通路交互的基因集,再输入乙酸(acetic acid)和丙酸(propionic acid),点击Submit得到分析结果。可见乙酸、丙酸和丁酸对MAPK共有的相关基因有3个,分别是CASP3、IL1B和TNF。
应用三
对多个化学物质、基因列表、疾病、GO/Pathway或其他类型数据进行共性分析
按照1-应用六中方法,分别获得乙酸(acetic acid)、丙酸(propionic acid)和丁酸(butyric acid)与MAPK通路交互的基因集。
点击MyVenn进入功能模块,输入类型选择Gene,分别输入上述3个基因集,点击Submit得到分析结果。可见乙酸、丙酸和丁酸与MAPK共有的相关基因有3个,与前文结果一致。
应用四
对多个化学物质相互作用的基因,或相关疾病、表型和GO/Pathway,或其他类型数据进行网络分析
点击Batch Query进入功能模块,输入类型选择Chemicals,分别输入乙酸(acetic acid)、丙酸(propionic acid)和丁酸(butyric acid),以选择Phenotype associations为例,其他参数默认,点击Download得到分析结果。
Excel打开上述文件,数据筛选功能选择人类,然后按照下面数据格式准备文件,其中node1为乙酸、丙酸和丁酸,node2为相关表型。
将上述文件导入Cytoscape软件绘制网络图如下,结果可见三种物质相关的表型中共有的只有一个,即short-chain fatty acid metabolic process。
3
下载模块:Download
点击Download进入下载页面,可以根据目录下载感兴趣数据集;或点击Batch Query,同上述2-应用四方法下载感兴趣数据集。
文献应用案例
本文综合GEO和TCGA数据库中肝癌数据集,基于R包(limma和edgeR)表达差异分析获得763个DEGs,其中247个上调和516个下调。然后利用STRING数据库建立PPI网络,利用MCC、MNC和DMNC三种Cytoscape插件筛选TOP10的Hub基因,取交集获得8个基因。进一步在HPA、Oncomine和GEPIA数据库验证其表达差异,以及预后相关性分析。最后,在CTD数据库分析8个基因与化疗药物相关性,结果展示在Figure8(如下图,截取部分)。
Figure8单图复现如下
以Figure8 E为例演示。进入CTD数据库,点击Chemical–Gene Interaction Query进入检索页面,Chemical字段选择equals精确检索,点击Select在弹出窗口输入Topotecan;Chemical–gene interaction字段选择ANY;Gene字段选择equals精确检索,点击Select在弹出窗口输入CDC20;点击Search得到检索结果。可见Topotecan抑制CDC20 mRNA表达水平,相关支持文献1篇。同样方法获得其他化疗药与CDC20调控关系如下。
根据上述数据,按照数据文件格式构建文件,导入Cytoscape软件绘制网络图如下,即原文Figure8 E图,大同小异。
以上就是CTD数据库的全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下参考文献!
好啦~!本文关于CTD数据库介绍就暂到这里啦~!欲知更多生信知识,我们相约“挑圈联靠”公众号~下期再见了~!