HuggingFace自然语言处理详解(基于BERT中文模型的任务实战)/计算机技术开发与应用丛书
定 价:69 元
丛书名:计算机技术开发与应用丛书
- 作者:李福林著
- 出版时间:2023/4/1
- ISBN:9787302628538
- 出 版 社:清华大学出版社
- 中图法分类:TP391
- 页码:226
- 纸张:
- 版次:1
- 开本:16开
本书综合性讲解HuggingFace社区提供的工具集datasets和transformers,书中包括最基础的工具集的用例演示,具体的项目实战,以及预训练模型的底层设计思路和实现原理的介绍。通过本书的学习,读者可以快速掌握HuggingFace工具集的使用方法,掌握自然语言处理项目的一般研发流程,并能研发自己的自然语言处理项目。
本书分为3篇共14章:工具集基础用例演示篇(第1~6章),详细讲解HuggingFace工具集的基本使用目的一般流程;预训练模型底层原理篇(第13、14章),详细阐述了预训练模型的设计思路和计算原理。
本书将使用最简单浅显的语言,带领读者快速了解HuggingFace工具集的使用方法。通过本书实战项目的学习,读者可以掌握一般的自然语言处理项目的研发流程。通过本书预训练模型底层原理的学习,读者能够知其然也知其所以然,做到融会贯通。方法;中文项目实战篇(第7~12章),通过几个实战项目演示使用HuggingFace工具集研发自然语言处理项
本书适合有PyTorch编程基础的读者阅读,也适合作为对自然语言处理感兴趣的读者的参考图书。
李福林,一个在IT领域摸爬滚打十多年的老程序员、培训师,精通多种IT技术,具有软件设计师职称。分享了多部AI技术教程,受到了读者的广泛赞誉。现任职于阳狮集团,担任算法工程师职位。教学风格追求化繁为简,务实而不空谈,课程设计思路清晰,课程演绎说理透彻,对A领域技术有自己独到的见解。
工具集基础用例演示篇
第1章 HuggingFace简介
第2章 使用编码工具
2.1 编码工具简介
2.2 编码工具工作流示意
2.3 使用编码工具
2.4 小结
第3章 使用数据集工具
3.1 数据集工具介绍
3.2 使用数据集工具
3.2.1 数据集加载和保存
3.2.2 数据集基本操作
3.2.3 将数据集保存为其他格式
3.3 小结
第4章 使用评价指标工具
4.1 评价指标工具介绍
4.2 使用评价指标工具
4.3 小结
第5章 使用管道工具
5.1 管道工具介绍
5.2 使用管道工具
5.2.1 常见任务演示
5.2.2 替换模型执行任务
5.3 小结
第6章 使用训练工具
6.1 训练工具介绍
6.2 使用训练工具
6.2.1 准备数据集
6.2.2 定义模型和训练工具
6.2.3 训练和测试
6.3 小结
中文项目实战篇
第7章 实战任务1:中文情感分类
7.1 任务简介
7.2 数据集介绍
7.3 模型架构
7.4 实现代码
7.4.1 准备数据集
7.4.2 定义模型
7.4.3 训练和测试
7.5 小结
第8章 实战任务2:中文填空
8.1 任务简介
8.2 数据集介绍
8.3 模型架构
8.4 实现代码
8.4.1 准备数据集
8.4.2 定义模型
8.4.3 训练和测试
8.5 小结
第9章 实战任务3:中文句子关系推断
9.1 任务简介
9.2 数据集介绍
9.3 模型架构
9.4 实现代码
9.4.1 准备数据集
9.4.2 定义模型
9.4.3 训练和测试
9.5 小结
第10章 实战任务4:中文命名实体识别
10.1 任务简介
10.2 数据集介绍
10.3 模型架构
10.4 实现代码
10.4.1 准备数据集
10.4.2 定义模型
10.4.3 训练和测试
10.5 小结
第11章 使用TensorFlow训练
11.1 任务简介
11.2 数据集介绍
11.3 模型架构
11.4 实现代码
11.4.1 准备数据集
11.4.2 定义模型
11.4.3 训练和测试
11.5 小结
第12章 使用自动模型
12.1 任务简介
12.2 数据集介绍
12.3 模型架构
12.4 实现代码
12.4.1 准备数据集
12.4.2 加载自动模型
12.4.3 训练和测试
12.5 深入自动模型源代码
12.6 小结
预训练模型底层原理篇
第13章 手动实现Transformer
13.1 Transformer架构
13.2 注意力
13.2.1 为什么需要注意力
13.2.2 注意力的计算过程
13.2.3 注意力计算的矩阵形式
13.2.4 多头注意力
13.3 位置编码
13.3.1 为什么需要位置编码
13.3.2 位置编码计算过程
13.4 MASK
13.4.1 PAD MASK
13.4.2 上三角MASK
13.5 Transformer计算流程
13.5.1 编码器
13.5.2 整体计算流程
13.5.3 解码器解码过程详细讲解
13.5.4 总体架构
13.6 简单翻译任务
13.6.1 任务介绍
13.6.2 定义数据集
13.6.3 定义MASK函数
13.6.4 定义Transformer工具子层
13.6.5 定义Transformer模型
13.6.6 训练和测试
13.7 两数相加任务
13.7.1 任务介绍
13.7.2 实现代码
13.7.3 训练和测试
13.8 小结
第14章 手动实现BERT
14.1 BERT架构
14.2 数据集处理
14.2.1 数据处理过程概述
14.2.2 数据集介绍
14.2.3 数据处理实现代码
14.3 PyTorch提供的Transformer工具层介绍
14.4 手动实现BERT模型
14.4.1 准备数据集
14.4.2 定义辅助函数
14.4.3 定义BERT模型
14.4.4 训练和测试
14.5 小结