Deep-Learning-From-Scratch-Notes
中文
English
Part 4:Attention 机制与 Transformer
Part 1: 深度学习基础
Chapter 1: 深度学习简介
Chapter 1.1 神经网络:一个可学习的函数
Chapter 2: PyTorch 入门
Chapter 2.1 PyTorch 中的自动微分
Chapter 2.2 PyTorch 维度变换操作函数
Chapter 2.3 PyTorch 中的梯度记录与控制
Chapter 2.4 PyTorch 中的数据加载:Dataset、DataLoader 与批处理
Chapter 2.5 PyTorch 中的 nn.Module:组织模型、参数与状态
Chapter 2.6 PyTorch 中的优化器:从手动更新到参数组与状态管理
Chapter 2.7 PyTorch 中的训练循环:把数据、模型和优化器连接起来
Chapter 2.8 PyTorch 中的 Checkpoint:中断训练后如何继续
Part 4: Attention 机制与 Transformer
Chapter 8: Attention 与 Transformer:从动态检索到序列建模
Chapter 8.1 Bahdanau Attention:从信息压缩到动态检索
Part 4:Attention 机制与 Transformer
作者
Brench
发布于
2026-05-08
修改于
2026-06-23
排序方式
默认
日期 - 日期升序
日期 - 日期降序
标题
作者
标题
作者
日期
Chapter 8.1 Bahdanau Attention:从信息压缩到动态检索
Brench
2026-05-19
无匹配项
二次使用
CC BY-NC 4.0