使用R语言做机器学习的书籍推荐

总是有一些小伙伴觉得机器学习很高大上,令人望而生畏,其实它就是我们常见的统计学方法,比如做表达量矩阵分析,通常是需要绘制pca图看看组间差异是否足够明显。

如果你有单细胞转录组数据处理经验,实际上流程里面的降维聚类分群无一不是机器学习。如果你做肿瘤数据挖掘,经常会使用lasso,随机森林,支持向量机,它们都是在R里面非常容易实现。我们也多次推荐过 《精通机器学习:基于R(第2版)-图书-图灵社区》:https://www.ituring.com.cn/book/1989 (赠书活动)

我们还是有长期合作的出版社《图灵出版社》,他们会提供书籍作为粉丝礼物,老规矩(留言点赞前5名获得书籍),还有3个小要求

  • 必须有过赞赏记录

  • 留言的点赞数量大于18

  • 留言的是你与生信技能树的故事或者你为什么想要这本书

如果你不想看中文书籍

有意思的是一些小伙伴对中文翻译比较抵触,喜欢看英文原版,我们也有推荐:

在线书籍地址:https://f0nzie.github.io/machine_learning_compilation/index.html

目录

  • 1 Preface

The Basics of Machine Learning

  • 2 Introduction to PCA
  • 3 Comparison of two PCA packages
  • 4 Detailed study of Principal Component Analysis
  • 5 Detection of diabetes using Logistic Regression
  • 6 Sensitivity analysis for a neural network
  • 7 Data Visualization for ML models

Feature Engineering

  • 8 Ten methods to assess Variable Importance
  • 9 Employee Attrition using Feature Importance

Classification

  • 10 A gentle introduction to Support Vector Machines
  • 11 Broad view of SVM
  • 12 Feature Selection to enhance cancer detection
  • 13 Dealing with unbalanced data
  • 14 Imputting missing values with Random Forest
  • 15 Tuning of Support Vector Machine prediction

Classification

  • 16 Introduction to algorithms for Classification
  • 17 Comparing Classification algorithms
  • 18 Who buys Social Network ads
  • 19 Predicting Ozone levels
  • 20 Building a Naive Bayes Classifier
  • 21 Linear and Non-Linear Algorithms for Classification
  • 22 Detect mines vs rocks with Random Forest
  • 23 Predicting the type of glass
  • 24 Naive Bayes for SMS spam
  • 25 Vehicles classiification with Decision Trees
  • 26 Applying Naive-Bayes on the Titanic case
  • 27 Classification on bad loans
  • 28 Predicting Flu outcome comparing eight classification algorithms
  • 29 A detailed study of bike sharing demand
  • 30 Prediction of arrhythmia with deep neural nets

Linear Regression

  • 31 Linear Regression with ISLR
  • 32 Evaluation of three linear regression models
  • 33 Comparison of six Linear Regression algorithms
  • 34 Comparing regression models
  • 35 Finding the factors of happiness
  • 36 Regression with a neural network
  • 37 Comparing Multiple Regression vs a Neural Network
  • 38 Temperature modeling using nested dataframes

Neural Networks

  • 39 Credit Scoring with neuralnet
  • 40 Wine classification with neuralnet
  • 41 Predicting the rating of cereals
  • 42 Fitting a linear model with neural networks
  • 43 Visualization of neural networks
  • 44 Build a fully connected R neural network from scratch
  • 45 Tuning Hyperparameters in a Neural Network
  • 46 Deep Learning tips for Classification and Regression

Appendix

  • A What is dot hat in a regression output
  • B Q-Q normal to compare data to distributions
  • C QQ and PP Plots
  • D Visualizing residuals

书籍可能没有视频动画更加通俗易懂

StatQuest生物统计学视频是一个很优秀的生物统计学教程,教程作者是Josh Starmer (个人博客 https://statquest.org/ ),生信菜鸟图很早之前就推过相关的学习资源。而且还组建过学习小分队,给视频写配套笔记:

确实猛人啊,一直在更新:

(0)

相关推荐

  • NVIDIA之AI Course:Getting Started with AI on Jetson Nano—Class notes(一)

    NVIDIA之AI Course:Getting Started with AI on Jetson Nano-Class notes(一) 导读         在线参加面向初学者的深度学习研究院课 ...

  • 权威机器学习术语中英对照词表一份!

    视觉/图像重磅干货,第一时间送达 新机器视觉 最前沿的机器视觉与计算机视觉技术 206篇原创内容 公众号 来源:算法进阶 本术语库目前拥有专业术语约 2094 个.专项领域篇 1 篇,主要为人工智能领 ...

  • 这725个机器学习术语表,太全了!

    您想知道的人工智能干货,第一时间送达 你好,我是zhenguo 这是几位机器学习权威专家汇总的725个机器学习术语表,非常全面了,值得收藏! 英文术语中文翻译 0-1 Loss Function0-1 ...

  • 用R语言做单因素方差分析及多重比较

    SPSS方差分析的应用已经做得非常好了,绝大多数的方差分析问题均可通过SPSS"点菜单"的方式得以解决,R语言在统计和可视化方面有自己的特色, 我们不妨来对比着学习. 选用R语言自 ...

  • 用R语言做逻辑回归

    用R语言做逻辑回归 jmzeng(jmzeng1314@163.com) 回归的本质是建立一个模型用来预测,而逻辑回归的独特性在于,预测的结果是只能有两种,true or false 在R里面做逻辑回 ...

  • 在R语言做并行计算的一些R包

    今天在<共享服务器第27个群>看到有粉丝提问,说他跑cibersort的时候,R代码运行超级慢,需要一些加速技巧. 本来呢,如果是十年前的我,一定会给他搜索然后使用这些包,并且测评它们,每 ...

  • 使用R语言做极大似然估计实例

    原文链接:http://tecdat.cn/?p=18970 在普遍的理解中,最大似然估计是使用已知的样本结果信息来反向推断最有可能导致这些样本结果的模型参数值! 换句话说,最大似然估计提供了一种在给 ...

  • 博士师兄手把手教你用R语言做PCA分析,不存在学不会!

    手把手教你用R语言做PCA主成分分析,不存在学不会 作者简介 本文作者Trigo Hoang,作者目前在香港攻读博士学位,硕士期间发表了多篇生信相关的SCI,累计影响因子35+,公众号简书会记录作者学 ...

  • 如何使用R语言做生存分析?

    首先,我们这里是介绍使用survival这个包来做. 软件的安装:install.packages(survival) 加载包:library(survival) 我们这里利用R自带的数据进行分析. ...

  • 用R语言pie函数做饼图

    ggplot2不直接支持制作饼图,尚需先做柱形图再变换坐标轴才转换为饼图,比较繁琐.所以在R中做饼图,小兵先练习使用自带饼图函数pie()来实现. 案例数据源:雇员数据 请在本公众号后台回复关键词[雇 ...

  • 使用R语言的clusterProfiler对葡萄做GO富集分析的简单小例子

    葡萄的参考基因组下载自NCBI,下载链接是https://ftp.ncbi.nlm.nih.gov/genomes/all/GCF/000/003/745/GCF_000003745.3_12X/ 基 ...

  • 机器学习算法之随机森林的R语言实现-表达芯片示例

    终于还是要发这个系列了,其实我还没有准备好,机器学习系列,有一个公众号做的非常好,是中科院上海马普所的几个同学做的,过两天我会在此推送他们的学习目录,供大家欣赏. 我就先抛砖引玉吧: 随机森林背景介绍 ...