如何掌握好自然语言处理中的预训练语言模型？你需要读这本书

2024-06-10 13:40:58

预训练语言模型属于人工智能领域中自然语言处理领域的一个细分，是自然语言处理领域的重要突破，得到了越来越广泛的关注，相关研究者和从业人员在实际应用的过程中，亟需一本理论翔实、代码细节充分的参考书。本次给大家赠送3本新书，即《预训练语言模型》。

本书内容

本书详细梳理了预训练语言模型的基本概念和理论基础，并通过实际代码的讲解，阐述了具有代表性的预训练语言模型的实现细节，非常适合需要快速、全面掌握预训练语言模型的从业者阅读。全书共8章，约200页，全彩色印刷。

第1章：预训练语言模型简介

讲解自然语言处理的研究进展，预训练语言模型自然语言表示，预训练语言模型发展史及分类。

第2章预训练语言模型基础知识

讲解统计语言模型，神经网络语言模型，词向量，RNN和LSTM基础，基于RNN的语言模型，ELMo模型。

第3章 Transformer与Attention

讲解Transformer 的结构，Self-Attention的思想，位置编码与单向掩码，模型的训练技巧。

第4章 GPT系列模型

讲解GPT的结构，如何在不同任务中使用，GPT的核心代码解读，GPT-2与GPT-3的特点。

第5章 BERT模型

讲解BERT的特征提取能力，无监督训练，微调训练用于句对分类，单句分类，文本问答，单句标注等下游任务，核心代码解读。

第6章后BERT时代的模型

讲解跨语言模型XLM，多任务融合MT-DNN，文本生成模型UniLM，更大掩码范围的SpanBERT，置换自回归模型XLNet，用于知识图谱的ERNIE，多模态融合模型VideoBERT等。

第7章评测和应用

讲解自然语言处理的通用评测任务，领域评测任务，其他评测任务，以及Transformers 代码实战，多模态预训练模型。

第8章总结和展望

讲解预训练语言模型的发展现状和未来展望。

本书作者：

邵浩日本国立九州大学工学博士，现就职于vivo。曾任狗尾草智能科技AI研究院院长，带领团队打造了AI虚拟生命产品的交互引擎。曾是上海对外经贸大学副教授，硕士生导师。是上海市静安区首届优秀人才，上海市人才发展基金获得者，杭州市高层次人才。任中国中文信息学会青年工作委员会委员，语言与知识计算专委会委员，中国计算机学会语音对话与听觉专业组委员，中文信息技术专委会委员。发表论文50余篇，获专利10余项，主持多项***及省部级课题，曾在联合国、世界贸易组织、亚利桑那州立大学、香港城市大学等机构任访问学者。刘一烽全国中学生物理竞赛保送生，清华大学电子系硕士，曾获学习成绩优异奖学金。现任vivo人工智能研究院AI算法工程师，主要研究方向为强化学习、自然语言处理，主导游戏AI和机器翻译核心算法研发工作。

GPT-2：OpenAI的NLP商业化野望

自然语言处理(NLP)技术正在生活的方方面面改变着我们的生活. 客厅的智能音箱在跟你每天的对话中飞速进步,甚至开始跟你"插科打诨"来适应你的爱好习惯. 电商客服总是能在第一时间回复 ...
自然语言处理 NLP 发展简史

从语言结构化理论基础,到 1750 亿参数的 GPT-3.一部 NLP 的百年发展史. 语言的结构化 20 世纪初,在瑞士的日内瓦大学,一位名叫费迪南德·德·索绪尔( Ferdinand de Sau ...
2020年深度学习技术发展综述

来源:无人系统技术作者:王亚珅摘要:对深度学习领域的研究进行综合评述,并对其进一步发展方向进行分析.首先分析围绕注意力机制的深度学习技术最新研究成果,以及在自然语言处理领域取得突破性进展的巨型预训 ...
刘群：预训练语言模型研究进展和趋势展望

自2018年下半年开始,到现在为止,预训练语言模型的发展基本呈现爆发趋势,研究人员数目越来越多,研究方向也越来越广. 近日,在第十九届中国计算语言学大会(CCL2020)上,华为诺亚方舟实验室语音语义 ...
宋睿华、万小军、黄民烈谈自然语言生成现状：关于创作、多样性和知识融合

10月22日,在2020年中国计算机大会(CNCC)上,中国人民大学长聘副教授宋睿华.北京大学教授万小军与清华大学长聘副教授黄民烈围绕 "自然语言生成" 的主题进行了演讲. 尽管深 ...
［首藏作品］（5696）把文本变成画作，AI对艺术“下手”了

把文本变成画作,AI对艺术"下手"了图为人工智能系统 DALL·E根据文本"穿着芭蕾舞裙遛狗的小萝卜"绘制的图像图片来源:OpenAI官网自然语言处理与视觉处理 ...
哈尔滨工业大学车万翔：自然语言处理新范式

来自:哈工大SCIR 5月13日-15日举办的CCF青年精英大会(YEF2021),特别组织思想秀,邀请各界贤达与业界青年共同探讨方略大事.作为CCF青年精英大会(YEF)最重要核心的环节之一,&qu ...
预训练语言模型关系图必读论文列表，清华荣誉出品

项目作者:王晓智.张正预训练语言模型(PLM)是 NLP 领域的一大热门话题.从 BERT 到 GPT2 再到 XLNet,各种预训练模型层出不穷,不少同学感叹,「大佬慢点,跟不上了--」那么,这么 ...
预训练语言模型fine-tuning近期进展概述

近年来,迁移学习改变了自然语言处理领域的范式,对预训练语言模型(PLM)进行微调(fine-tuning)已经成为了新的范式.本文主要梳理了近期的预训练语言模型做fine-tuning的进展. 另外, ...
2021年预训练语言模型及微调的最新进展

对预训练语言模型(LM)进行微调已成为在自然语言处理中进行迁移学习的事实上的标准.在过去的三年中(Ruder,2018),微调(Howard&Ruder,2018)取代了预训练embeddin ...
NLP前沿预训练语言模型大赏

预训练模型可以分为以下三个大类: 自回归模型自动编码模型序列到序列模型什么是自回归模型(auto-regressive model):经典的语言建模任务,根据已读取文本内容预测下一个单词.比如T ...
常用预训练语言模型（PTMs）总结

NLP工作站 16篇原创内容公众号从以下5个部分通过QA的方式进行总结:Transformer架构.Transformer-Encoder预训练语言模型.Transformer-Decoder预训 ...
字节跳动 | AMBERT：一种多粒度Tokenization的预训练语言模型

论文标题:AMBERT: A Pre-trained Language Model with Multi-Grained Tokenization(多粒度分词的预训练语言模型AMBERT) 作者:Xi ...
中文预训练语言模型回顾

论文名称:Revisiting Pre-trained Models for Chinese Natural Language Processing 论文作者:崔一鸣,车万翔,刘挺,秦兵,王士进,胡国 ...
COLING 2020 | CharBERT：字符敏感的预训练语言模型

©PaperWeekly 原创 · 作者|张琨学校|中国科学技术大学博士生研究方向|自然语言处理论文标题: CharBERT: Character-aware Pre-trained Langu ...
赛尔原创@Findings | 中文预训练语言模型回顾

论文名称:Revisiting Pre-trained Models for Chinese Natural Language Processing 论文作者:崔一鸣,车万翔,刘挺,秦兵,王士进,胡国 ...

如何掌握好自然语言处理中的预训练语言模型？你需要读这本书

相关推荐