D2L 3.2 Object-Oriented Design for Implementation

Table of Contents

D2L - This article is part of a series.

Part : D2L 5.4 Custom Layer

Part : D2L 5.3 Deferred Initialization

Part : D2L 5.2 Parameter Management

Part : D2 5.1 Layer & Block

Part : D2L 4.1 Multilayer Perceptron

Part : D2L 4.2 Example of MLP

Part 1: D2L 5. Deep Learning Computation

Part 1: Linear Regression

Part 1: Chapter 3. Linear Neural Network

Part 1: Chapter 4. Multilayer Perceptron

Part 1: Dive Into Deep Learning

Part 2: D2L 3.1 Linear Regression

Part 3: This Article

Part 4: D2L 3.3 A concise implementation of linear regression

Part 5: D2L 3.4 Softmax Regression

Part 6: D2L 3.5 Image classification datasets

Part 7: D2L 3.6 Implementation of softmax regression from scratch

Part 9: D2L 4.1 MultilayerPerceptron

Part 10: D2L Weierstrass Approximation Theorem

Part 10: D2L 4.4 Model Selection, Underfitting, and Overfitting

从零开始实现整个方法，包括数据流水线、模型、损失函数和小批量随机梯度下降优化器。虽然现代的深度学习框架几乎可以自动化地进行所有这些工作，但从零开始实现可以确保我们真正知道自己在做什么。

3.2.1 生成数据集
#

为了简单起见，我们将根据带有噪声的线性模型构造一个人造数据集
使用线性模型参数$w=[2,-3.4]^T,b=4.2$和噪声项$\epsilon$生成数据集及其标签 $$y=Xw+b+\epsilon$$
$\epsilon$可以视为模型预测和标签时的潜在观测误差

3.2.2 读取数据集
#

3.2.3 初始化模型参数
#

通过从均值为0、标准差为0.01的正态分布中采样随机数来初始化权重，并将偏置初始化为0。

w = torch.normal(0, 0.01, size=(2,1), requires_grad=True)
b = torch.zeros(1, requires_grad=True)

在初始化参数之后，我们的任务是更新这些参数，直到这些参数足够拟合我们的数据
并运用[[2.5 自动微分]]来计算梯度

3.2.4 定义模型
#

这里我们用的还是线性模型，即$$\hat y=w^Tx+b$$

def linreg(X, w, b):  #@save
    """线性回归模型"""
    return torch.matmul(X, w) + b

3.2.5 定义损失函数
#

模型建立后，开始使用对原函数的损失函数进行梯度下降
这里我们使用[[3.1_LinearRegression#平方误差函数]]

3.2.6 定义优化算法
#

使用[[3.1_LinearRegression#Minibatch Stochastic Gradient Descent 小批量随机梯度下降]]

3.2.7 训练
#

本质为执行一下循环
初始化参数
更新梯度，更新参数

D2L - This article is part of a series.

Part : D2L 5.4 Custom Layer

Part : D2L 5.3 Deferred Initialization

Part : D2L 5.2 Parameter Management

Part : D2 5.1 Layer & Block

Part : D2L 4.1 Multilayer Perceptron

Part : D2L 4.2 Example of MLP

Part 1: D2L 5. Deep Learning Computation

Part 1: Linear Regression

Part 1: Chapter 3. Linear Neural Network

Part 1: Chapter 4. Multilayer Perceptron

Part 1: Dive Into Deep Learning

Part 2: D2L 3.1 Linear Regression

Part 3: This Article

Part 4: D2L 3.3 A concise implementation of linear regression

Part 5: D2L 3.4 Softmax Regression

Part 6: D2L 3.5 Image classification datasets

Part 7: D2L 3.6 Implementation of softmax regression from scratch

Part 9: D2L 4.1 MultilayerPerceptron

Part 10: D2L Weierstrass Approximation Theorem

Part 10: D2L 4.4 Model Selection, Underfitting, and Overfitting

D2L 3.1 Linear Regression

Apr 15 2024·2946 words

D2L Computer Science Docs

D2L 3.3 A concise implementation of linear regression

Apr 15 2024·1286 words

D2L Computer Science Docs

D2L 3.4 Softmax Regression

Apr 15 2024·1963 words

D2L Computer Science Docs

D2L 3.5 Image classification datasets

Apr 15 2024·1074 words

D2L Computer Science Docs

D2L 3.6 Implementation of softmax regression from scratch

Apr 15 2024·2032 words

D2L Computer Science Docs

D2L 4.1 MultilayerPerceptron

Apr 15 2024·1476 words

D2L Computer Science Docs

3.2.1 生成数据集 #

3.2.2 读取数据集 #

3.2.3 初始化模型参数 #

3.2.4 定义模型 #

3.2.5 定义损失函数 #

3.2.6 定义优化算法 #

3.2.7 训练 #

Related

3.2.1 生成数据集
#

3.2.2 读取数据集
#

3.2.3 初始化模型参数
#

3.2.4 定义模型
#

3.2.5 定义损失函数
#

3.2.6 定义优化算法
#

3.2.7 训练
#