class MyNet(nn.Module):
    def __init__(self):
        super().__init__()
        self.layers = nn.Sequential(
            nn.Linear(0, 0),  
            nn.ReLU(),
            nn.Linear(0, 0) 
        )

先定义模型框架，将两个Linear Layer留空，这样就可以在之后更改

def forward(self, x):
    if isinstance(self.layers[0], nn.Linear) and self.layers[0].in_features == 0:
        self.layers[0] = nn.Linear(x.size(1), 256)  # 动态初始化第一层
    if isinstance(self.layers[2], nn.Linear) and self.layers[2].in_features == 0:
        self.layers[2] = nn.Linear(256, 10)  # 动态初始化第二层
    return self.layers(x)

定义前向传播的过程，并在过程中加入初始化的部分，由于不知道具体的输入维度，将self.layers[0] = nn.Linear(x.size(1), 256)这一层的input Feature设置为输入的维度，也就是x.size(1)，而层与层之间的维度都是可以自行调整的，这里就可以设置这一层的output维度为256
分别检查定义模型时的层和运行后的，有

Before input:
Layer 0 weights: None
Layer 2 weights: None

After input:
Layer 0 weights: torch.Size([256, 20])
Layer 2 weights: torch.Size([10, 256])

D2L - This article is part of a series.

Part : D2L 5.4 Custom Layer

Part : This Article

Part : D2L 5.2 Parameter Management

Part : D2 5.1 Layer & Block

Part : D2L 4.1 Multilayer Perceptron

Part : D2L 4.2 Example of MLP

Part 1: D2L 5. Deep Learning Computation

Part 1: Linear Regression

Part 1: Chapter 3. Linear Neural Network

Part 1: Chapter 4. Multilayer Perceptron

Part 1: Dive Into Deep Learning

Part 2: D2L 3.1 Linear Regression

Part 3: D2L 3.2 Object-Oriented Design for Implementation

Part 4: D2L 3.3 A concise implementation of linear regression

Part 5: D2L 3.4 Softmax Regression

Part 6: D2L 3.5 Image classification datasets

Part 7: D2L 3.6 Implementation of softmax regression from scratch

Part 9: D2L 4.1 MultilayerPerceptron

Part 10: D2L Weierstrass Approximation Theorem

Part 10: D2L 4.4 Model Selection, Underfitting, and Overfitting

D2L 5.2 Parameter Management

Jan 17 2025·992 words

D2L Computer Science Docs

D2 5.1 Layer & Block

Dec 21 2024·861 words

D2L Computer Science Docs

D2L 4.1 Multilayer Perceptron

Dec 20 2024·2588 words

D2L Computer Science Docs

D2L 4.2 Example of MLP

Dec 20 2024·532 words

D2L Computer Science Docs

D2L Weierstrass Approximation Theorem

Dec 19 2024·915 words

D2L Computer Science Docs

D2L 3.1 Linear Regression

Apr 15 2024·2946 words

D2L Computer Science Docs

D2L 5.3 Deferred Initialization

5.3.1 Create Network 实例化网络
#

Related

5.3.1 Create Network 实例化网络 #

Related

5.3.1 Create Network 实例化网络
#