【组队学习】【24期】集成学习(中)

集成学习(中)

开源内容:

https://github.com/datawhalechina/team-learning-data-mining/tree/master/EnsembleLearning

基本信息

  • 贡献人员:李祖贤、薛传雨、赵可、杨毅远、陈琰钰、李嘉骐
  • 学习周期:12天
  • 学习形式:理论学习 + 练习
  • 组队学习说明:上期学习大家系统了解了机器学习的经典的算法数学推导和代码调用,本期我们将进行bagging/boosting等基本集成方法以及常见的集成方法组合的学习。我们依然对于每个算法都进行了细致的理论分析以及必要的代码演示,希望大家的理论知识水平和代码实践能力两个方面都能够获得均衡的提高。在案例的代码中,我们给出了详细的代码注释,尽量让学习者们不会因为看不懂代码而感到烦恼。
  • 人群定位:已完成机器学习(上)课程内容的学习,具备《高等数学》、《线性代数》、《概率论与数理统计》基础,了解机器学习经典模型的理论知识,能够调用相应模型库解决的学习者。
  • 每个任务完成大概所需时间:3-5h
  • 任务路线:掌握基本的模型集成方法和常见组合集成模型的理论及模型调用调参
  • 难度系数:中

⚠️ 特别提示:已报名并完成集成学习(上)所有学习内容的同学不需要重复报名。直接报名集成学习(中)的同学需要自行完成集成学习(上)课程内容的学习。

学习目标

本次课程是由Datawhale集成学习小组内部成员共同完成,是针对机器学习小白的一入门课程。学习本课程需要学习者具备《高等数学》、《线性代数》、《概率论与数理统计》基础,会使用常见的数据分析工具(Numpy,Pandas、matplotlib)。

本次课程内容的设计参考了B站很火的《白板推导》系列、李航老师的《统计学习方法》、机器学习入门圣经的《统计学习导论》以及大量的技术博客,详细地介绍了机器学习领域中最经典的算法并给出了相应的数学推导和代码,对于每个算法都进行了细致的分析以及必要的代码的演示,便于学习者深刻理解机器学习算法的本质。除此之外,每个算法都要求学习者自行查阅sklearn官方文档的相应参数,帮助学习者构建理论与实际相结合的学习框架。在这些案例的代码中,我们给出了详细的代码注释,尽量让学习者们不会因为看不懂代码而感到烦恼。

开营视频

内容介绍

01
02
03
04
05
06
07
08
09
10

(0)

相关推荐