华清大学、京北大学联合发现:#学习R语言之数据挖掘可抑制新型冠状病毒#
(纯属娱乐,不过技能是真)
2020年2月1日从华清北联合研究院获悉,该所研究初步发现,传统艺能#学习R语言之数据挖掘可抑制新型冠状病毒#。此前,华清北联合攻关组启动由带节奏师兄牵头的抗新型冠状病毒感染肺炎药物研究瞎胡闹团队,在无视前期SARS相关研究和药物发现成果基础上,聚焦针对该病毒的治疗候选新药筛选、评价和老药新用研究。
R语言之数据挖掘是一种简洁的传统技能。救不了的中国人普遍认为R语言之数据挖掘具有让人秃头的作用,头发没了,病毒就进不去了,聪明的智商就又占领高地了。并且学R语言之数据挖掘可以修炼心性,适应宅在家的生活,减少宅在家引起的心理问题。是目前有效的防范冠状病毒的手段之一。
华清北长期从事抗病毒歪门邪道研究,2003年“非典”期间,带节奏师兄团队率先证实学R语言之数据挖掘具有抗SARS冠状病毒作用,十余年来又陆续证实R语言之数据挖掘对流感病毒(H7N9、H1N1、H5N1)、严重急性呼吸综合征冠状病毒、中东呼吸综合征冠状病毒具有明显的抗病毒效应。
目前,R语言之数据挖掘课程已在生信技能树B站隆重上线,欢迎大家学习!
当然知道春节假期在家里刷剧很过瘾,但我还是尝试劝你学习,生物信息学如果仅仅是数据处理那就好办了,问题在于他被迫与生物这个落后学科捆绑在一起,21世纪是生物学的世纪,你懂的
生物信息学必备计算机背景
书籍贪多不烂,必买工具书如下,每个读5遍以上,或者买同类书籍5本,总之想方设法打牢基础!
R语言之书 编程与统计 https://book.douban.com/subject/33418263/
Linux命令行与shell脚本编程大全.第3版
视频必须强推生信技能树近30万学习量的基础合辑:https://space.bilibili.com/338686099/#/
这就是解决20个小时的学习量了,很多时候一些视频需要反复听,保守估计得听40个小时,也有很多人分享了听视频学习R语言的心得体会,比如:生信技能树-R语言视频课听后感 (10万+的播放量就看这个春节)
弹幕听说是很好玩,你可以去感受一下。
首先是LINUX学习
我在《生信分析人员如何系统入门Linux(2019更新版)》把Linux的学习过程分成6个阶段 ,提到过每个阶段都需要至少一天以上的学习:
第1阶段:把linux系统玩得跟Windows或者MacOS那样的桌面操作系统一样顺畅,主要目的就是去可视化,熟悉黑白命令行界面,可以仅仅以键盘交互模式完成常规文件夹及文件管理工作。
第2阶段:做到文本文件的表格化处理,类似于以键盘交互模式完成Excel表格的排序、计数、筛选、去冗余,查找,切割,替换,合并,补齐,熟练掌握awk,sed,grep这文本处理的三驾马车。
第3阶段:元字符,通配符及shell中的各种扩展,从此linux操作不在神秘!
第4阶段:高级目录管理:软硬链接,绝对路径和相对路径,环境变量
第5阶段:任务提交及批处理,脚本编写解放你的双手
第6阶段:软件安装及conda管理,让linux系统实用性放飞自我
然后是R学习
我在在生信分析人员如何系统入门R(2019更新版) 里面给初学者的知识点路线图如下:
了解常量和变量概念
加减乘除等运算(计算器)
多种数据类型(数值,字符,逻辑,因子)
多种数据结构(向量,矩阵,数组,数据框,列表)
文件读取和写出
简单统计可视化
无限量函数学习
而且我专门为R语言建立了 GitHub 仓库存放相关学习路线指导资料:https://github.com/jmzeng1314/R_bilibili 并且配套了一些练习题!
有了基础就可以看数据库挖掘
主要是讲解如何使用R语言走标准分析流程,火山图,热图,GO/KEGG数据库注释等等。这些流程的视频教程都在B站和GitHub了,目录如下:
第一讲:GEO,表达芯片与R
第二讲:从GEO下载数据得到表达量矩阵
第三讲:对表达量矩阵用GSEA软件做分析
第四讲:根据分组信息做差异分析
第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析
第六讲:指定基因分组boxplot指定基因list画热图
感兴趣可以细读表达芯片的公共数据库挖掘系列推文 ;
2020最新打包代码在:免费的数据分析付费的成品代码
配套这个单元视频教程的习题我通常是安排给学徒完成,因为公众号粉丝很少有人能学到这个程度,你可以看到视频播放量就一万左右。所以,这些作业就随缘吧。
如果看到这些习题的你也感兴趣加入我们的在线学徒列表,欢迎随机挑选一个作业尝试完成后,邮件汇报给我你探索的过程!我的邮箱 jmzeng1314@163.com
接着看全栈生信工程师的NGS组学技能
分别是4,5,6,7个小时的教学视频,主要是依托于我在生信技能树/生信菜鸟团过去五年举办的各种NGS组学线上教学经验,相关推文目录是:
lncRNA数据分析传送门 (2017-12-21)
450K甲基化芯片数据处理传送门 ( 2017-09-09)
ChIP-seq基础入门传送门 ( 2017-08-13)
转录组入门传送门 ( 2017-08-07)