ML之SSL：Semi-Supervised Learning半监督学习的简介、应用、经典案例之详细攻略

2024-08-03 11:09:07

参考文章：《2019中国人工智能发展报告》—清华大学中国工程院知识智能中心—201912

相关文章
ML之SL：监督学习(Supervised Learning)的简介、应用、经典案例之详细攻略
ML之UL：无监督学习Unsupervised Learning的概念、应用、经典案例之详细攻略
ML之SSL：Semi-Supervised Learning半监督学习的简介、应用、经典案例之详细攻略

Semi-Supervised Learning半监督学习的简介

半监督学习(Semi-Supervised Learning，SSL)是模式识别和机器学习领域研究的重点问题，是监督学习与无监督学习相结合的一种学习方法。半监督学习使用大量的未标记数据，以及同时使用标记数据，来进行模式识别工作。当使用半监督学习时，将会要求尽量少的人员来从事工作，同时，又能够带来比较高的准确性，因此，半监督学习正越来越受到人们的重视。最大的特点是监督学习与无监督学习相结合。

半监督学习的研究的历史可以追溯到20世纪70年代，这一时期，出现了自训练(Self-Training)、直推学习(Transductive Learning)、生成式模型(Generative Model)等学习方法。

半监督学习是监督学习与无监督学习相结合的一种学习方法。半监督学习一般针对的问题是数据量大，但是有标签数据少或者说标签数据的获取很难很贵的情况，训练的时候有一部分是有标签的，而有一部分是没有的。与使用所有标签数据的模型相比，使用训练集的训练模型在训练时可以更为准确，而且训练成本更低。常见的两种半监督的学习方式是直推学习（Transductive learning）和归纳学习（Inductive learning）。

1、直推学习Transductive learning

没有标记的数据是测试数据，这个时候可以用测试的数据进行训练。这里需要注意，这里只是用了测试数据中的特征（feature）而没有用标签（label），所以并不是一种欺骗的方法。

2、归纳学习Inductive learning

没有标签的数据不是测试集。

Semi-Supervised Learning半监督学习的应用

1、SSL根据学习场景可分为四大类

源自《百度百科》

1.1、半监督分类

半监督分类(Semi-Supervised Classification)：是在无类标签的样例的帮助下训练有类标签的样本，获得比只用有类标签的样本训练得到的分类器性能更优的分类器，弥补有类标签的样本不足的缺陷，其中类标签取有限离散值。

1.2、半监督回归

半监督回归(Semi-Supervised Regression)：在无输出的输入的帮助下训练有输出的输入，获得比只用有输出的输入训练得到的回归器性能更好的回归器，其中输出取连续值；

1.3、半监督聚类

半监督聚类(Semi-Supervised Clustering)：在有类标签的样本的信息帮助下获得比只用无类标签的样例得到的结果更好的簇，提高聚类方法的精度；

1.4、半监督降维

半监督降维(Semi-Supervised Dimensionality Reduction)：在有类标签的样本的信息帮助下找到高维输入数据的低维结构，同时保持原始高维数据和成对约束(Pair-Wise Constraints)的结构不变，即在高维空间中满足正约束(Must-Link Constraints)的样例在低维空间中相距很近，在高维空间中满足负约束(Cannot-Link Constraints)的样例在低维空间中距离很远。

Semi-Supervised Learning半监督学习的经典案例

后期更新……

11月10日论文推荐（附下载地址）

论文名: Semi-Supervised Classification with Graph Convolutional Networks 作者:Thomas N. Kipf, and Max Wel ...
半监督学习入门基础（二）：最基础的3个概念

半监督学习 (SSL) 是一种非常有趣的方法,用来解决机器学习中缺少标签数据的问题.SSL利用未标记的数据和标记的数据集来学习任务.SSL的目标是得到比单独使用标记数据训练的监督学习模型更好的结果.这 ...
远程监督在关系抽取中的应用

什么是关系抽取知识就是力量.使人类及机器能够更好地利用知识是提升工作效率及实现人工智能的关键所在,也催生了包括知识表示.知识推理在内的一系列研究.作为一切对知识的利用的基础,我们首先要获取知识,即知 ...
C++之undefined reference to “ssl::first::first()“

C++之undefined reference to “ssl::first::first()“
2月2日论文推荐（附下载地址）

论文题目 Semi-supervised Learning on Graphs with Generative Adversarial Nets 作者 Ming Ding Jie Tang Jie Z ...
C语言之sprintf使用总结

C语言之sprintf使用总结
自监督学习: 人工智能的未来

导读什么是自监督学习?为什么自监督学习是AI的未来?自监督学习如何实现? 本文将回顾下自监督学习的前世今生,介绍它在CV.NLP.Graph.RecSys.RL等领域已经取得的令人惊叹的效果! 1. ...
ML之UL：无监督学习Unsupervised Learning的概念、应用、经典案例之详细攻略

ML之UL:无监督学习Unsupervised Learning的概念.应用.经典案例之详细攻略参考文章:<2019中国人工智能发展报告>-清华大学中国工程院知识智能中心-201912 ...
ML之SL：监督学习(Supervised Learning)的简介、应用、经典案例之详细攻略

ML之SL:监督学习(Supervised Learning)的简介.应用.经典案例之详细攻略参考文章:<2019中国人工智能发展报告>-清华大学中国工程院知识智能中心-201912 相 ...
ML之LoR：逻辑回归LoR算法的简介、应用、经典案例之详细攻略

ML之LoR:逻辑回归LoR算法的简介.应用.经典案例之详细攻略逻辑回归LoR算法的简介逻辑回归最适合二进制分类(y = 0或1的数据集,其中1表示默认类).例如:在预测事件是否发生时,发生的事件 ...
ML之SVM：SVM算法的简介、应用、经典案例之详细攻略

ML之SVM:SVM算法的简介.应用.经典案例之详细攻略 SVM算法的简介支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning ...
ML之RF：随机森林RF算法简介、应用、经典案例之详细攻略

ML之RF:随机森林RF算法简介.应用.经典案例之详细攻略随机森林RF算法简介随机森林指的是利用多棵决策树对样本进行训练并预测的一种分类器.它包含多个决策树的分类器,并且其输出的类别是由个别树输出 ...
ML之kNN：k最近邻kNN算法的简介、应用、经典案例之详细攻略

ML之kNN:k最近邻kNN算法的简介.应用.经典案例之详细攻略kNN算法的简介邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一.所谓 ...
ML之Clustering之K-means：K-means算法简介、应用、经典案例之详细攻略

ML之Clustering之K-means:K-means算法简介.应用.经典案例之详细攻略 K-means算法简介 K-均值是著名聚类算法,它找出代表聚类结构的k个质心.如果有一个点到某一质心的距离 ...
ML之NB：朴素贝叶斯Naive Bayesian算法的简介、应用、经典案例之详细攻略

ML之NB:朴素贝叶斯Naive Bayesian算法的简介.应用.经典案例之详细攻略朴素贝叶斯Naive Bayesian算法的简介朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法.朴素 ...
ML之DT之CART：分类与回归树CART算法的简介、应用、经典案例之详细攻略

ML之DT之CART:分类与回归树CART算法的简介.应用.经典案例之详细攻略分类与回归树CART算法简介分类与回归树(Classification and Regression Trees, C ...

ML之SSL：Semi-Supervised Learning半监督学习的简介、应用、经典案例之详细攻略

Semi-Supervised Learning半监督学习的简介

1、直推学习Transductive learning

2、归纳学习Inductive learning

Semi-Supervised Learning半监督学习的应用

1、SSL根据学习场景可分为四大类

1.1、半监督分类

1.2、半监督回归

1.3、半监督聚类

1.4、半监督降维

Semi-Supervised Learning半监督学习的经典案例

相关推荐