156页！NLPCC 2020《预训练语言模型回顾》讲义下载

2024-03-29 20:54:16

声明：本文转载自哈工大讯飞联合实验室公众号

哈工大讯飞联合实验室（HFL）资深级研究员、研究主管崔一鸣受邀在NLPCC 2020会议做题为《Revisiting Pre-trained Models for Natural Language Processing》的讲习班报告（Tutorial），介绍了预训练语言模型的发展历程以及近期的研究热点。本期推送文末提供了报告的下载方式。

NLPCC 2020 Tutorials:

http://tcci.ccf.org.cn/conference/2020/tutorials.php

报告信息

Title: Revisiting Pre-Trained Models for Natural Language Processing

Abstract : Pre-Trained Language Models (PLM) have become fundamental elements in recent research of natural language processing. In this tutorial, we will revisit the technical progress of the text representations, i.e., from one-hot embedding to the recent PLMs. We will describe several popular PLMs (such as BERT, XLNet, RoBERTa, ALBERT, ELECTRA, etc.) with their technical details and utilizations. On the other hand, we will also introduce various efforts on Chinese PLMs. At the end of this talk, we will analyze the shortcomings of the recent PLMs and envision the directions of future research.

报告目录

Introduction
Traditional Approaches for Text Representation

one-hot, word2vec, GloVe

Contextualized Language Models

CoVe, ELMo

Deep Contextualized Language Models

GPT, BERT, XLNet, RoBERTa, ALBERT, ELECTRA

Chinese Pre-trained Language Models

Chinese BERT-wwm, ERNIE, NEZHA, ZEN, MacBERT

Recent Research on PLM

Trending: GPT-2, GPT-3, T5
Distillation: DistilBERT, TinyBERT, MobileBERT, TextBrewer
Multi-lingual: mBERT, XLM, XLM-R

Summary

讲义部分内容截图

讲义下载

赞 (0)

NLP：《NLP Year in Review 2019&NLP_2019_Highlights》2019年自然语言处理领域重要进展回顾及其解读

NLP:<NLP Year in Review 2019&NLP_2019_Highlights>2019年自然语言处理领域重要进展回顾及其解读导读:2019年是自然语言处理(N ...
初二培优讲义，模块一：三垂直基本模型模块...

初二培优讲义，模块一：三垂直基本模型模块...
【讲义分享】全等“手拉手”模型（下）讲义电子版及下载

图片版
【每周NLP论文推荐】从预训练模型掌握NLP的基本发展脉络

读论文是做AI的人必需要下的功夫,所以咱们开通了专栏<每周NLP论文推荐>.本着有三AI的一贯原则,即系统性学习,所以每次的论文推荐也会是成系统的,争取每次能够把一个领域内的"故 ...
字节跳动火山翻译负责人：预训练时代的机器翻译

2021年10月8日-10日,第十七届全国机器翻译大会 (CCMT 2021) 在西宁举行,字节跳动火山翻译团队技术和产品研发负责人王明轩以<预训练时代的机器翻译>为题,阐述预训练技术在机 ...
中文预训练语言模型回顾

论文名称:Revisiting Pre-trained Models for Chinese Natural Language Processing 论文作者:崔一鸣,车万翔,刘挺,秦兵,王士进,胡国 ...
赛尔原创@Findings | 中文预训练语言模型回顾

论文名称:Revisiting Pre-trained Models for Chinese Natural Language Processing 论文作者:崔一鸣,车万翔,刘挺,秦兵,王士进,胡国 ...
COLING 2020 | CharBERT：字符敏感的预训练语言模型

©PaperWeekly 原创 · 作者|张琨学校|中国科学技术大学博士生研究方向|自然语言处理论文标题: CharBERT: Character-aware Pre-trained Langu ...
预训练语言模型关系图必读论文列表，清华荣誉出品

项目作者:王晓智.张正预训练语言模型(PLM)是 NLP 领域的一大热门话题.从 BERT 到 GPT2 再到 XLNet,各种预训练模型层出不穷,不少同学感叹,「大佬慢点,跟不上了--」那么,这么 ...
预训练语言模型fine-tuning近期进展概述

近年来,迁移学习改变了自然语言处理领域的范式,对预训练语言模型(PLM)进行微调(fine-tuning)已经成为了新的范式.本文主要梳理了近期的预训练语言模型做fine-tuning的进展. 另外, ...
如何掌握好自然语言处理中的预训练语言模型？你需要读这本书

预训练语言模型属于人工智能领域中自然语言处理领域的一个细分,是自然语言处理领域的重要突破,得到了越来越广泛的关注,相关研究者和从业人员在实际应用的过程中,亟需一本理论翔实.代码细节充分的参考书.本次给 ...
2021年预训练语言模型及微调的最新进展

对预训练语言模型(LM)进行微调已成为在自然语言处理中进行迁移学习的事实上的标准.在过去的三年中(Ruder,2018),微调(Howard&Ruder,2018)取代了预训练embeddin ...
NLP前沿预训练语言模型大赏

预训练模型可以分为以下三个大类: 自回归模型自动编码模型序列到序列模型什么是自回归模型(auto-regressive model):经典的语言建模任务,根据已读取文本内容预测下一个单词.比如T ...
常用预训练语言模型（PTMs）总结

NLP工作站 16篇原创内容公众号从以下5个部分通过QA的方式进行总结:Transformer架构.Transformer-Encoder预训练语言模型.Transformer-Decoder预训 ...