用PyTorch训好鸢尾花分类模型，再用PyQt做个能输数字看结果的预测小窗口

原创于 2026-06-11 08:08:46 发布 · 242 阅读

3 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#PyTorch分类 #鸢尾花数据集 #PyQt预测界面

该文章已生成可运行项目，

本文还有配套的精品资源，点击获取

简介：这个资源包包含一个完整的鸢尾花分类实战项目：train.py负责用PyTorch训练四维特征到三类品种的分类模型，predict.py支持命令行快速推理；配套的PyQt5图形界面可手动输入萼片长、萼片宽、花瓣长、花瓣宽四个数值，点击预测即实时显示类别名称和对应置信度。所有代码组织清晰，主目录为IrisSort，不依赖复杂环境，Python 3.7以上 + torch + numpy + scikit-learn + PyQt5就能直接跑起来。适合刚学完基础机器学习想动手练手的同学，也适合作为课程设计、课堂演示或小型模型落地展示的参考模板。里面没有预训练权重，模型从零训练，过程透明可控；界面简洁无多余功能，专注输入→预测→反馈这一核心流程。

1. 项目概述：为什么一个“输四个数字就能出结果”的小窗口，值得你花两小时亲手搭一遍？

我带过不少刚学完吴恩达《机器学习》前五周的同学做第一个实战项目，很多人卡在同一个地方：模型在 Jupyter 里跑通了，准确率98%，但一问“怎么让非技术人员也用得上”，就愣住——总不能让人打开终端敲 python predict.py --sepal_length 5.1 --sepal_width 3.5 --petal_length 1.4 --petal_width 0.2 吧？更别说老师来听课、同学来演示、甚至自己想快速验证一组新数据时，命令行来回切窗口、改参数、看输出，效率低还容易出错。

这个鸢尾花分类小项目，就是专为解决这种“最后一公里”问题设计的。它不追求SOTA精度，也不堆砌Transformer或注意力机制；它的核心价值，是把从数据预处理、模型训练、权重保存，到推理封装、界面交互、结果可视化这一整条链路，用最精简、最透明、最可调试的方式串起来。你看到的不是一个黑盒API，而是一个能掰开揉碎、每一行都清楚知道它在干什么的完整闭环。

关键词里提到的“PyTorch分类”“鸢尾花数据集”“PyQt预测界面”，其实对应着三个关键能力层：
- 底层模型层：用 PyTorch 从零搭建一个全连接网络（不是调 torchvision.models），手动写 forward、定义损失、控制训练循环，确保你真正理解反向传播如何驱动权重更新；
- 数据桥梁层：Iris 数据集虽小，但它是所有机器学习教材的“Hello World”。这里我们不用 sklearn.datasets.load_iris() 一键加载完事，而是显式做标准化（StandardScaler）、划分训练/验证集、构建 TensorDataset 和 DataLoader，让你看清数据如何一步步变成模型能吃的张量；
- 应用接口层：PyQt5 界面不是为了炫技，而是用最少代码实现最刚需功能——四个输入框（对应萼片长、萼片宽、花瓣长、花瓣宽）、一个预测按钮、一个结果标签（显示“山鸢尾”+置信度87.3%）。没有菜单栏、没有状态栏、没有多线程后台任务，所有逻辑都在 on_predict_click() 里直来直去。

它适合谁？如果你正处在这样的阶段：能看懂梯度下降公式，但没亲手保存过 .pt 文件；会用 model.eval()，但不知道 torch.no_grad() 为什么必须套在推理外层；能写 QLineEdit，但不清楚 QDoubleValidator 怎么限制用户只输数字——那这个项目就是为你量身定做的练手靶子。它不教你“什么是卷积”，但会逼你搞懂“为什么预测前要 unsqueeze(0)”；它不讲“PyQt信号槽原理”，但会让你亲手连通“点击按钮 → 获取文本 → 转张量 → 过模型 → 更新UI”这条神经通路。

我试过把它拆成三节课教给大三学生：第一课跑通 train.py，重点看 loss 曲线怎么收敛；第二课啃透 predict.py，手动构造一个 [5.1, 3.5, 1.4, 0.2] 的输入，对比 torch.argmax(output, dim=1) 和 torch.softmax(output, dim=1) 的输出差异；第三课直接改 main_window.py，把“山鸢尾/变色鸢尾/维吉尼亚鸢尾”换成中文拼音首字母（S/V/W），再加个置信度进度条。三节课下来，没人再问“模型训好了，然后呢？”——因为“然后”已经刻进肌肉记忆里了。

2. 整体架构与设计思路：为什么选全连接而不是CNN？为什么PyQt5不选Tkinter？

2.1 模型选型：四维特征，何必画蛇添足？

看到“鸢尾花分类”，有人第一反应是“该上CNN了吧？毕竟图像分类都这么干”。但这里必须按下暂停键：Iris 数据集根本不是图像，它是150行×4列的数值表格，每行代表一朵花的四个物理测量值。强行套CNN，等于给自行车装涡轮增压——结构错配，徒增复杂度。

我们最终选择一个三层全连接网络（MLP），结构清晰到可以手写推导：
- 输入层：4个神经元（对应萼片长、萼片宽、花瓣长、花瓣宽）
- 隐藏层：16个神经元（ReLU激活）
- 输出层：3个神经元（对应三类鸢尾花，Softmax前）

为什么是16？不是8也不是32？这背后有经验法则：隐藏层神经元数通常取输入与输出维度的几何平均数附近。√(4×3)≈3.5，显然太小；而16是2⁴，在保证表达能力的同时，参数总量仅 4×16 + 16×3 = 112 个权重 + 16+3=19个偏置，总计131个可训练参数。对比一个最简CNN（哪怕只有一层3×3卷积核），参数量轻松破千。对只有150个样本的数据集，小模型反而更鲁棒，过拟合风险更低——我实测过，用32维隐藏层，验证集准确率反而比16维低0.7%，就是因为模型开始记住了训练集噪声。

更重要的是，小模型=快训练+易调试。在 train.py 里，一个epoch不到0.01秒，100个epoch全程2秒内结束。这意味着你可以随时修改学习率、换优化器、调整batch_size，几秒钟就能看到效果。而如果上了ResNet变体，光是初始化权重就得等半天，学生根本没耐心调参。

提示：别被“深度学习”四个字绑架。真正的工程思维，是用最简单的工具解决最具体的问题。鸢尾花分类的本质是“在四维空间里划三条直线把点分开”，MLP就是最适合的尺子。

2.2 框架选型：PyTorch vs TensorFlow？PyQt5 vs Tkinter？

PyTorch 胜在“所见即所得”。train.py 里 model(x) 这一行，和你在纸上推导的 y = Wx + b 完全对应；loss.backward() 直接触发计算图反向遍历，不像TF1.x那样要先 sess.run() 构建静态图。对初学者，PyTorch 的错误提示也更友好——比如你忘了 .to(device)，它会明确告诉你 “Expected all tensors to be on the same device”，而不是抛出一长串无法定位的CUDA上下文错误。

至于 PyQt5 而非 Tkinter，核心在于“专业感”和“可控性”。Tkinter 的默认控件（尤其是输入框和按钮）在Windows/macOS/Linux上渲染风格割裂，字体模糊，间距诡异。而PyQt5基于Qt框架，原生支持高DPI缩放，控件质感接近系统原生应用。更重要的是，PyQt5的信号槽机制（button.clicked.connect(self.on_predict_click)）比Tkinter的 command= 回调更清晰——它天然支持多参数传递、断开重连、跨线程安全（虽然本项目没用到），为后续扩展留足余地。

当然，PyQt5需要额外安装（pip install pyqt5），而Tkinter是Python自带。但权衡之下，多一次 pip install 换来三年不踩UI布局坑，这笔账很划算。我见过太多学生用Tkinter做界面，最后卡在 grid() 行列对齐、sticky 参数失效、StringVar 绑定失效上，耽误三天调试时间。PyQt5用 QVBoxLayout 垂直堆叠控件，setFixedWidth() 锁定输入框宽度，setAlignment(Qt.AlignCenter) 居中显示结果，三行代码搞定的事，何必绕弯？

2.3 工程结构：为什么目录叫 IrisSort？为什么要有 network/ 子模块？

项目主目录命名为 IrisSort，不是随便起的。它直指核心功能——“Iris”（数据集）+ “Sort”（分类动作）。这个名字在终端里敲 cd IrisSort 时，比 iris_project 或 ml_demo 更具指向性；在Git提交记录里，git commit -m "fix: IrisSort validation accuracy drop" 比 "fix: demo accuracy" 更易追溯。

目录结构刻意扁平化，但暗含分层逻辑：

IrisSort/
├── train.py          # 训练入口：数据加载→模型定义→训练循环→权重保存
├── predict.py        # 推理入口：加载权重→构造输入→模型预测→打印结果
├── gui/              # 独立GUI模块（非脚本，是包）
│   ├── __init__.py
│   ├── main_window.py  # 主窗口类：控件创建+信号连接+业务逻辑
│   └── model_wrapper.py # 模型包装器：封装load_model/predict方法，解耦界面与PyTorch
├── network/          # 模型定义模块（非train.py内联定义）
│   ├── __init__.py
│   └── iris_net.py     # IrisNet类：纯模型结构，不含训练逻辑
├── data/             # 数据相关（未来可扩展）
│   └── preprocess.py # 标准化器保存/加载，避免训练/预测用不同scaler
├── models/           # 权重存储目录（自动创建）
│   └── best_model.pt
└── requirements.txt  # 显式声明依赖，版本锁定（torch==2.0.1而非torch>=2.0）

关键设计点在于 network/ 和 gui/model_wrapper.py 的分离。很多新手会把模型定义直接写在 train.py 里，导致 predict.py 不得不复制粘贴同样代码，一旦模型结构改动，两处都要改。而本项目中，iris_net.py 只负责描述网络拓扑，model_wrapper.py 负责加载权重并提供统一的 predict() 接口。这样 train.py、predict.py、main_window.py 全部通过 from network.iris_net import IrisNet 导入，模型变更只需改一处。

注意：requirements.txt 里 torch 版本写死为 2.0.1，不是 2.0.*。因为PyTorch 2.1引入了新的编译器后端，某些旧版 torch.jit.trace 生成的模型在新版本可能报错。生产环境宁可牺牲一点新特性，也要保证 pip install -r requirements.txt 后100%能跑。

3. 核心细节解析与实操要点：从数据标准化到界面实时反馈，每个环节为什么这么写？

3.1 数据预处理：为什么标准化必须在训练/预测时用同一套参数？

Iris 数据集中，萼片长度范围约4.3–7.9cm，花瓣宽度仅0.1–2.5cm。如果直接把原始数值喂给模型，梯度更新会严重失衡——花瓣宽度的微小变化（0.01）对损失函数的影响，远小于萼片长度变化（0.01）的影响，因为前者本身数值就小两个数量级。这就是为什么必须标准化（Standardization），而非简单归一化（Normalization）。

标准化公式是：
x’ = (x - μ) / σ
其中 μ 是训练集均值，σ 是训练集标准差。

关键点在于：μ 和 σ 必须只从训练集计算，且在预测时复用同一组值。如果预测时用新数据重新算 μ/σ，相当于每次输入都用不同的尺度，模型根本无法稳定工作。

在 train.py 中，我们这样做：

from sklearn.preprocessing import StandardScaler
# ... 加载数据后
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)  # fit_transform：计算μ/σ并转换
X_test_scaled = scaler.transform(X_test)         # transform：仅用已知μ/σ转换
# 保存scaler供预测使用
import joblib
joblib.dump(scaler, 'data/scaler.pkl')

而在 gui/model_wrapper.py 的预测逻辑里：

def predict(self, sepal_length, sepal_width, petal_length, petal_width):
    # 加载训练时保存的scaler
    scaler = joblib.load('data/scaler.pkl')
    # 将四个输入组成numpy数组，并reshape为(1,4)以匹配scaler要求
    input_array = np.array([[sepal_length, sepal_width, petal_length, petal_width]])
    input_scaled = scaler.transform(input_array)  # 复用同一μ/σ！
    # 转为tensor，送入模型...

实操心得：我曾见过学生把 scaler.fit_transform() 写在 predict.py 里，结果每次预测都用自己的输入重新算均值标准差，导致同一组数字多次预测结果不同。记住口诀：“fit once, transform everywhere”。

3.2 模型定义：为什么 `IrisNet` 类里不写 `init` 以外的逻辑？

打开 network/iris_net.py，你会看到极其干净的代码：

import torch.nn as nn

class IrisNet(nn.Module):
    def __init__(self, input_dim=4, hidden_dim=16, num_classes=3):
        super().__init__()
        self.fc1 = nn.Linear(input_dim, hidden_dim)
        self.relu = nn.ReLU()
        self.fc2 = nn.Linear(hidden_dim, num_classes)

    def forward(self, x):
        x = self.fc1(x)
        x = self.relu(x)
        x = self.fc2(x)
        return x

没有 optimizer，没有 loss_fn，没有 train()/eval() 切换逻辑——因为这些属于训练策略，和模型结构是正交概念。把它们混在一起，会导致模型类职责爆炸。想象一下，如果明天你要用这个模型做迁移学习，得先删掉 train.py 里的优化器代码才能复用 IrisNet；或者你想在Web服务里部署，还得把 train.py 整个搬过去。

正确的分层是：
- IrisNet：只管“怎么计算输出”（forward）
- train.py：管“怎么用数据更新参数”（backward + optimizer.step）
- model_wrapper.py：管“怎么安全地调用模型”（加载权重 + 输入校验 + 输出解析）

这种解耦让代码像乐高一样可替换。比如你想试试Dropout，只需在 IrisNet.__init__ 里加一行 self.dropout = nn.Dropout(0.2)，并在 forward 里插入 x = self.dropout(x)，其他所有文件完全不用动。

3.3 PyQt5界面：为什么输入框要用 `QDoubleValidator` 而非 `QIntValidator`？

Iris 数据集的原始测量值都是浮点数（如花瓣长1.4cm），用户输入 5.1 或 4.7 必须被接受。如果用 QIntValidator，用户输入 5.1 会被立即截断为 5，导致预测结果严重偏差——这比程序崩溃更危险，因为用户根本意识不到输入被篡改了。

QDoubleValidator 提供精确控制：

validator = QDoubleValidator()
validator.setDecimals(1)  # 最多1位小数（Iris数据精度足够）
validator.setBottom(0.1)  # 最小值（花瓣宽最小0.1）
validator.setTop(8.0)    # 最大值（萼片长最大7.9）
line_edit.setValidator(validator)

但这里有个陷阱：QDoubleValidator 默认允许空字符串和负号。而Iris所有特征均为正值，空输入应视为无效。因此我们在 on_predict_click() 里强制校验：

def on_predict_click(self):
    try:
        sepal_len = float(self.sepal_length_input.text())
        sepal_wid = float(self.sepal_width_input.text())
        petal_len = float(self.petal_length_input.text())
        petal_wid = float(self.petal_width_input.text())
        # 手动检查是否为正数
        if not all(v > 0 for v in [sepal_len, sepal_wid, petal_len, petal_wid]):
            raise ValueError("所有输入值必须大于0")
        # ... 执行预测
    except ValueError as e:
        self.result_label.setText(f"输入错误：{str(e)}")
        return

注意：不要依赖 QDoubleValidator 的 setRange() 完全替代业务校验。因为用户可能绕过输入框（如粘贴文本），或 QDoubleValidator 在某些Qt版本下对科学计数法（1e-2）支持不稳定。双重校验才是工业级做法。

3.4 推理流程：为什么 `predict()` 方法里必须有 `torch.no_grad()` 和 `model.eval()`？

这是PyTorch新手最容易忽略的性能与正确性雷区。看 model_wrapper.py 中的关键片段：

def predict(self, sepal_length, sepal_width, petal_length, petal_width):
    # ... 数据预处理
    input_tensor = torch.tensor(input_scaled, dtype=torch.float32)
    input_tensor = input_tensor.to(self.device)

    self.model.eval()  # 关闭dropout/batchnorm训练行为
    with torch.no_grad():  # 禁用梯度计算，节省显存+加速
        output = self.model(input_tensor)
        probabilities = torch.softmax(output, dim=1)
        confidence, predicted_class = torch.max(probabilities, dim=1)

    return self.class_names[predicted_class.item()], confidence.item()

model.eval()：告诉模型“我现在不是在训练”。它会关闭 Dropout 层（否则每次预测随机失活神经元，结果抖动），并冻结 BatchNorm 的 running_mean/running_var（否则用单样本更新统计量，导致输出漂移）。如果不加这行，同一组输入多次预测，结果可能不同。
torch.no_grad()：包裹推理过程，禁止PyTorch构建计算图。因为预测不需要反向传播，构建图纯属浪费内存（显存占用减少约40%）和CPU时间（推理速度提升15%-20%）。在GPU上尤其明显——没有 no_grad，每次预测都会在显存里残留计算图节点，直到下次 gc.collect()。

实操心得：我在教学时让学生故意删掉这两行，然后连续点击预测按钮10次。结果：第一次输出“山鸢尾 92.1%”，第三次变成“变色鸢尾 63.5%”，第七次又跳回“山鸢尾”。学生立刻明白——这不是模型不准，是没关掉训练模式。

4. 实操过程与核心环节实现：从零开始，手把手搭出可运行的完整流程

4.1 环境准备与依赖安装：为什么 `requirements.txt` 要分开发/生产环境？

虽然项目声称“Python 3.7+ 即可运行”，但实际部署时，不同场景对依赖的要求不同。requirements.txt 并非简单罗列所有包，而是按角色分层：

# requirements.txt （生产环境最小依赖）
torch==2.0.1
numpy==1.24.3
scikit-learn==1.2.2
PyQt5==5.15.9
joblib==1.2.0

# requirements-dev.txt （开发环境额外依赖）
pytest==7.3.1
black==23.3.0
jupyter==1.0.0

为什么这么做？因为最终交付给老师的作业包，或部署到同学电脑上的演示程序，只需要运行时依赖。如果把 jupyter 也打进 requirements.txt，用户 pip install -r requirements.txt 会额外装几百MB的内核和前端，纯属冗余。而开发时，你需要 pytest 写单元测试验证 predict() 函数，用 black 格式化代码保证团队风格统一，这些都不该污染生产环境。

安装步骤严格按顺序执行：

# 1. 创建虚拟环境（隔离依赖，避免污染系统Python）
python -m venv iris_env
# 2. 激活环境（Windows）
iris_env\Scripts\activate.bat
# 3. 激活环境（macOS/Linux）
source iris_env/bin/activate
# 4. 安装生产依赖（注意：-r 指向 requirements.txt，不是 requirements-dev.txt）
pip install -r requirements.txt
# 5. 验证安装（检查关键包版本）
python -c "import torch; print(torch.__version__)"
python -c "from PyQt5.QtWidgets import QApplication; print('PyQt5 OK')"

提示：如果 pip install pyqt5 报错“Microsoft Visual C++ 14.0 is required”，说明缺少C++编译工具。此时不要慌，直接下载预编译wheel：访问 https://pypi.org/project/PyQt5/#files ，找到 PyQt5-5.15.9-5.15.8-cp39-cp39-win_amd64.whl（根据你的Python版本和系统选择），然后 pip install PyQt5-5.15.9-5.15.8-cp39-cp39-win_amd64.whl。预编译包免编译，秒装。

4.2 模型训练：`train.py` 的每一行都在解决什么问题？

现在进入核心环节。打开 train.py，我们逐段解析其设计意图：

# 第1部分：导入与配置
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report, confusion_matrix
import numpy as np
import joblib

# 设备选择：优先GPU，无则CPU
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"Using device: {device}")

# 超参数定义（全部集中在此，方便实验）
BATCH_SIZE = 16
LEARNING_RATE = 0.01
NUM_EPOCHS = 100
HIDDEN_DIM = 16

这里 device 的判断逻辑很重要。很多教程直接写 device = torch.device("cuda")，结果学生在没GPU的笔记本上运行直接报错。我们用 torch.cuda.is_available() 安全兜底，且打印日志让用户明确知道当前运行环境。

# 第2部分：数据加载与预处理
from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target

# 划分训练集/测试集（8:2）
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42, stratify=y
)

# 标准化（关键！）
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# 保存scaler供预测使用
joblib.dump(scaler, 'data/scaler.pkl')

# 转为PyTorch张量
X_train_tensor = torch.tensor(X_train_scaled, dtype=torch.float32)
y_train_tensor = torch.tensor(y_train, dtype=torch.long)
X_test_tensor = torch.tensor(X_test_scaled, dtype=torch.float32)
y_test_tensor = torch.tensor(y_test, dtype=torch.long)

# 构建Dataset和DataLoader
train_dataset = TensorDataset(X_train_tensor, y_train_tensor)
train_loader = DataLoader(train_dataset, batch_size=BATCH_SIZE, shuffle=True)

注意 stratify=y 参数：它确保训练集和测试集中三类鸢尾花的比例与原始数据一致（各50朵）。否则随机划分可能导致训练集里山鸢尾占80%，测试集里只有20%，模型学到的其实是类别分布偏差，而非真实特征。

# 第3部分：模型、损失、优化器定义
from network.iris_net import IrisNet
model = IrisNet(input_dim=4, hidden_dim=HIDDEN_DIM, num_classes=3).to(device)
criterion = nn.CrossEntropyLoss()  # 分类任务标准损失
optimizer = optim.SGD(model.parameters(), lr=LEARNING_RATE)

# 第4部分：训练循环
best_val_acc = 0.0
for epoch in range(NUM_EPOCHS):
    model.train()  # 开启训练模式
    total_loss = 0.0
    for batch_idx, (data, target) in enumerate(train_loader):
        data, target = data.to(device), target.to(device)

        optimizer.zero_grad()        # 清空上一轮梯度
        output = model(data)         # 前向传播
        loss = criterion(output, target)  # 计算损失
        loss.backward()              # 反向传播
        optimizer.step()             # 更新权重

        total_loss += loss.item()

    # 每10个epoch评估一次
    if (epoch + 1) % 10 == 0:
        model.eval()  # 切换评估模式
        with torch.no_grad():
            val_output = model(X_test_tensor.to(device))
            val_pred = torch.argmax(val_output, dim=1)
            val_acc = (val_pred == y_test_tensor.to(device)).float().mean().item()

        print(f"Epoch [{epoch+1}/{NUM_EPOCHS}], Loss: {total_loss/len(train_loader):.4f}, Val Acc: {val_acc:.4f}")

        # 保存最佳模型
        if val_acc > best_val_acc:
            best_val_acc = val_acc
            torch.save(model.state_dict(), 'models/best_model.pt')
            print(f"  -> Saved best model with accuracy {best_val_acc:.4f}")

这段循环体现了完整的训练范式：
- optimizer.zero_grad() 必须在每个batch开头调用，否则梯度会累积（grad += new_grad），导致权重爆炸；
- model.train()/model.eval() 在训练/评估时切换，确保Dropout/BatchNorm行为正确；
- torch.no_grad() 在评估时禁用梯度，提速省显存；
- 模型保存用 state_dict() 而非 model 对象，因为 state_dict() 只保存权重，体积小、跨平台兼容性好（.pt 文件仅1KB）。

训练完成后，你会在 models/ 目录下看到 best_model.pt，这就是后续所有预测的基石。

4.3 图形界面开发：`main_window.py` 如何实现“输入→预测→反馈”闭环？

gui/main_window.py 是整个项目的门面，代码虽短，但每行都经过深思：

from PyQt5.QtWidgets import (
    QApplication, QMainWindow, QWidget, QVBoxLayout, QHBoxLayout,
    QLabel, QLineEdit, QPushButton, QGridLayout, QSpacerItem, QSizePolicy
)
from PyQt5.QtCore import Qt
from .model_wrapper import ModelWrapper

class IrisMainWindow(QMainWindow):
    def __init__(self):
        super().__init__()
        self.setWindowTitle("鸢尾花分类预测器")
        self.setGeometry(100, 100, 400, 300)  # 主窗口位置和大小

        # 创建中央部件和主布局
        central_widget = QWidget()
        self.setCentralWidget(central_widget)
        main_layout = QVBoxLayout(central_widget)
        main_layout.setSpacing(20)
        main_layout.setContentsMargins(30, 30, 30, 30)

        # 标题标签
        title_label = QLabel("请输入鸢尾花测量值（单位：厘米）")
        title_label.setAlignment(Qt.AlignCenter)
        title_label.setStyleSheet("font-size: 14px; font-weight: bold;")
        main_layout.addWidget(title_label)

        # 输入网格（4行2列）
        grid_layout = QGridLayout()
        grid_layout.setSpacing(10)

        # 创建4个输入框及标签
        self.sepal_length_input = self._create_input_field("萼片长度:")
        self.sepal_width_input = self._create_input_field("萼片宽度:")
        self.petal_length_input = self._create_input_field("花瓣长度:")
        self.petal_width_input = self._create_input_field("花瓣宽度:")

        # 添加到网格
        grid_layout.addWidget(QLabel("萼片长度:"), 0, 0)
        grid_layout.addWidget(self.sepal_length_input, 0, 1)
        grid_layout.addWidget(QLabel("萼片宽度:"), 1, 0)
        grid_layout.addWidget(self.sepal_width_input, 1, 1)
        grid_layout.addWidget(QLabel("花瓣长度:"), 2, 0)
        grid_layout.addWidget(self.petal_length_input, 2, 1)
        grid_layout.addWidget(QLabel("花瓣宽度:"), 3, 0)
        grid_layout.addWidget(self.petal_width_input, 3, 1)

        main_layout.addLayout(grid_layout)

        # 预测按钮
        self.predict_button = QPushButton("预测鸢尾花品种")
        self.predict_button.setStyleSheet("""
            QPushButton {
                background-color: #4CAF50;
                color: white;
                border: none;
                padding: 10px 20px;
                font-size: 14px;
                border-radius: 4px;
            }
            QPushButton:hover {
                background-color: #45a049;
            }
        """)
        self.predict_button.clicked.connect(self.on_predict_click)
        main_layout.addWidget(self.predict_button, alignment=Qt.AlignCenter)

        # 结果显示区域
        self.result_label = QLabel("预测结果将显示在这里")
        self.result_label.setAlignment(Qt.AlignCenter)
        self.result_label.setStyleSheet("font-size: 16px; font-weight: bold; color: #2c3e50;")
        main_layout.addWidget(self.result_label)

        # 初始化模型包装器
        self.model_wrapper = ModelWrapper()

        # 设置默认值（帮助用户快速上手）
        self.sepal_length_input.setText("5.1")
        self.sepal_width_input.setText("3.5")
        self.petal_length_input.setText("1.4")
        self.petal_width_input.setText("0.2")

    def _create_input_field(self, label_text):
        """辅助方法：创建带验证器的输入框"""
        line_edit = QLineEdit()
        line_edit.setFixedWidth(100)
        line_edit.setAlignment(Qt.AlignCenter)

        # 应用浮点数验证器
        validator = QDoubleValidator()
        validator.setDecimals(1)
        validator.setBottom(0.1)
        validator.setTop(8.0)
        line_edit.setValidator(validator)

        return line_edit

    def on_predict_click(self):
        """核心预测逻辑"""
        try:
            # 获取并转换输入
            sepal_len = float(self.sepal_length_input.text())
            sepal_wid = float(self.sepal_width_input.text())
            petal_len = float(self.petal_length_input.text())
            petal_wid = float(self.petal_width_input.text())

            # 业务校验
            if not all(v > 0 for v in [sepal_len, sepal_wid, petal_len, petal_wid]):
                raise ValueError("所有输入值必须大于0")

            # 调用模型包装器预测
            class_name, confidence = self.model_wrapper.predict(
                sepal_len, sepal_wid, petal_len, petal_wid
            )

            # 更新UI（格式化置信度为百分比）
            self.result_label.setText(
                f"{class_name}（置信度：{confidence*100:.1f}%）"
            )
            self.result_label.setStyleSheet(
                "font-size: 16px; font-weight: bold; color: #27ae60;"
            )

        except ValueError as e:
            self.result_label.setText(f"输入错误：{str(e)}")
            self.result_label.setStyleSheet(
                "font-size: 16px; font-weight: bold; color: #e74c3c;"
            )
        except Exception as e:
            self.result_label.setText(f"预测失败：{str(e)}")
            self.result_label.setStyleSheet(
                "font-size: 16px; font-weight: bold; color: #e67e22;"
            )

if __name__ == "__main__":
    app = QApplication([])
    window = IrisMainWindow()
    window.show()
    app.exec_()

关键设计亮点：
- 响应式布局：QVBoxLayout 垂直堆叠标题、网格、按钮、结果，QGridLayout 精确控制4个输入框位置，setSpacing() 和 setContentsMargins() 消除拥挤感；
- 视觉反馈：按钮悬停变色、成功结果绿色、错误红色、警告橙色，符合用户直觉；
- 防呆设计：默认填入经典样本 [5.1, 3.5, 1.4, 0.2]（山鸢尾），用户打开即能点击预测，获得即时正向反馈；
- 异常分级处理：ValueError（输入格式错误）和通用 Exception（模型加载失败等）分开捕获，给出不同提示，避免用户面对“Internal Server Error”一脸懵。

运行界面只需一行命令：

python gui/main_window.py

一个清爽的窗口立刻弹出，输入任意合法数值，点击按钮，结果秒出。

4.4 命令行预测：`predict.py` 如何成为调试利器？

predict.py 不是摆设，而是模型验证的黄金标准。它的存在，让你能脱离GUI，在终端里快速验证模型行为：

# predict.py
import argparse
import torch
import numpy as np
from sklearn.preprocessing import StandardScaler
import joblib
from network.iris_net import IrisNet

def main():
    parser = argparse.ArgumentParser(description="鸢尾花分类预测（命令行版）")
    parser.add_argument("--sepal_length", type=float, required=True, help="萼片长度（cm）")
    parser.add_argument("--sepal_width", type=float, required=True, help="萼片宽度（cm）")
    parser.add_argument("--petal_length", type=float, required=True, help="花瓣长度（cm）")
    parser.add_argument("--petal_width", type=float, required=True, help="花瓣宽度（cm）")

    args = parser.parse_args()

    # 加载标准化器和模型
    scaler = joblib.load('data/scaler.pkl')
    model = IrisNet()
    model.load_state_dict(torch.load('models/best_model.pt'))
    model.eval()

    # 构造输入
    input_array = np.array([[
        args.sepal_length,
        args.sepal_width,
        args.petal_length,
        args.petal_width
    ]])
    input_scaled = scaler.transform(input_array)
    input_tensor = torch.tensor(input_scaled, dtype=torch.float32)

    # 预测
    with torch.no_grad():
        output = model(input_tensor)
        probabilities = torch.softmax(output, dim=1)
        confidence, predicted_class = torch.max(probabilities, dim=1)

    class_names = ["山鸢尾", "变色鸢尾", "维吉尼亚鸢尾"]
    print(f"预测结果：{class_names[predicted_class.item()]}")
    print(f"置信度：{confidence.item()*100:.2f}%")

if __name__ == "__main__":
    main()

使用方式极其简单：

# 预测一朵典型的山鸢尾
python predict.py --sepal_length 5.1 --sepal_width 3.5 --petal_length 1.4 --petal_width 0.2

# 预测一朵维吉尼亚鸢尾
python predict.py --sepal_length 7.2 --sepal_width 3.6 --petal_length 6.1 --petal_width 2.5

为什么需要它？因为GUI是“最终形态”，而命令行是“调试形态”。当你发现GUI预测结果不对时，第一步永远是：
1. 用同样的输入，在命令行里跑 predict.py；
2. 如果命令行结果正确，问题在GUI的数据传递或UI更新逻辑；
3. 如果命令行也错，则问题在模型或标准化流程。

这种分层排查法，能帮你5分钟内定位90%的问题，而不是在PyQt信号槽里大海捞针。

5. 常见问题与排查技巧实录：那些文档里不会写的“踩坑现场”

5.1 模型训练常见问题速查表

问题现象	可能原因	排查步骤	解决方案
训练loss不下降，始终在2.0左右	学习率过大，权重更新幅度过猛	1. 打印 `optimizer.param_groups[0]['lr']` 2. 观察第一个batch的loss	将 `LEARNING_RATE` 从0.1降至0.01或0.001
验证准确率远低于训练准确率（如训练98%，验证70%）	过拟合，或验证集划分未 `stratify`	1. 检查 `train_test_split` 是否有 `stratify=y` 2. 查看 `y_train` 和 `y_test` 的类别分布	添加 `stratify=y`；或增加 `Dropout(p=0.2)` 到模型中
训练时显存OOM（Out of Memory）	batch_size过大，或模型在CPU上训练却未 `.to(device)`	1. 检查 `device` 是否为 `cuda` 2. 尝试 `BATCH_SIZE=8`	确保所有tensor和model都 `.to(device)`；减小batch_size
`torch.load()` 报错 “unexpected key in source state_dict”	模型结构变更后，仍用旧权重文件	1. 检查 `IrisNet` 类是否新增/删除了层 2. 对比 `state_dict().keys()`	删除 `models/best_model.pt`，重新训练；或用 `strict=False` 加载（不推荐）

实操心得：我让学生在 train.py 开头加一行 print("Model structure:", model)，它会打印出所有层的名字和形状。当遇到权重加载错误时，对比打印出的结构和 .pt 文件里的 state_dict.keys()，一眼就能看出哪一层名字对不上。

5.2 PyQt5界面问题排查指南

问题现象	可能原因	排查步骤	解决方案
窗口一闪而逝，终端无报错	`app.exec_()` 未被调用，或 `window.show()` 后程序退出	1. 检查 `if __name__ == "__main__":` 下是否有 `app.exec_()` 2. 确认 `window.show()` 在 `app.exec_()` 之前	确保 `app.exec_()` 是最后一行，且未被 `sys.exit()` 提前终止
输入框无法输入中文，或粘贴数字后显示乱码	`QLineEdit` 的编码或字体设置问题	1. 在 `__init__` 中添加 `self.setFont(QFont("Microsoft YaHei"))` 2. 检查系统是否安装中文字体	设置中文字体；或改用 `QPlainTextEdit`（支持更多输入）
点击预测按钮无反应，终端无输出	信号未正确连接，或 `on_predict_click` 方法名拼写错误	1. 在 `__init__` 中 `print("Button connected:", self.predict_button.clicked)` 2. 检查方法名是否为 `on_predict_click`（不是 `on_click_predict`）	确保 `self.predict_button.clicked.connect(self.on_predict_click)` 语句存在且无语法错误
预测结果总是显示“山鸢尾”，无论输入什么	模型权重未正确加载，或 `scaler` 路径错误	1. 在 `on_predict_click` 开头加 `print("Loading model...")` 2. 检查 `data/scaler.pkl` 和 `models/best_model.pt` 是否存在	确保 `train.py` 已成功运行并生成这两个文件；路径用绝对路径调试

注意：PyQt5的调试技巧是“加print，不加断点”。因为GUI事件循环是异步的，IDE断点经常失效。在关键方法开头加 print(f"[DEBUG] {method_name} called")，是最可靠的方法。

5.3 跨平台部署避坑清单（Windows/macOS/Linux）

平台	常见陷阱	解决方案	验证命令
Windows	`PyQt5` 安装失败，报“Microsoft Visual C++ 14.0 is required”	下载预编译wheel： `pip install PyQt5-5.15.9-5.15.8-cp39-cp39-win_amd64.whl`	`python -c "from PyQt5.QtWidgets import QApplication"`
macOS	窗口无法聚焦，或按钮点击无响应	设置环境变量： `export QT_QPA_PLATFORM_PLUGIN_PATH=/path/to/PyQt5/Qt/plugins/platforms`	在 `main_window.py` 开头加 `import os; os.environ['QT_QPA_PLATFORM_PLUGIN_PATH'] = ...`
Linux	运行报错 `Could not connect to any X display`（服务器无GUI）	使用 `xvfb` 虚拟帧缓冲： `xvfb-run -a python gui/main_window.py`	`sudo apt-get install xvfb`（Ubuntu/Debian）

最后分享一个小技巧：如果你想把这个项目打包成独立可执行文件（.exe/.app），用 PyInstaller 是最稳妥的选择。在 IrisSort/ 目录下执行：
bash pip install pyinstaller pyinstaller --onefile --windowed --add-data "models;models" --add-data "data;data" gui/main_window.py
--add-data 参数确保 models/ 和 data/ 目录被一起打包进去。生成的 dist/main_window.exe 可以直接发给同学，无需他们装Python。

6. 项目延伸与进阶方向：从“能跑”到“好用”，还能做什么？

这个项目的价值，不仅在于它现在能做什么，更在于它为你铺平了通往更复杂系统的道路。以下是几个自然、低门槛的延伸方向，每个都能在1小时内完成：

6.1 增加“历史记录”功能：让预测不再是一次性操作

现在的界面每次预测都覆盖上次结果。加一个历史面板，只需三步：
1. 在 main_window.py 的 __init__ 中，添加一个 QListWidget：
python self.history_list = QListWidget() self.history_list.setMaximumHeight(100) main_layout.addWidget(QLabel("预测历史：")) main_layout.addWidget(self.history_list)
2. 在 on_predict_click() 成功预测后，追加一行：
python self.history_list.addItem(f"{class_name} ({confidence*100:.1f}%)") self.history_list.scrollToBottom() # 自动滚动到底部
3. 为历史列表添加清空按钮（同理添加 QPushButton 并连接 self.history_list.clear）。

这个改动教会你：PyQt5 的 QListWidget 是管理有序列表的最佳选择，scrollToBottom() 解决了长列表自动滚动的痛点。

6.2 支持批量预测：拖入CSV文件，一键输出所有结果

很多同学的真实需求是：老师给了一个Excel表格，里面有50行鸢尾花测量值，想批量预测。这只需扩展 predict.py：

# 新增参数
parser.add_argument("--csv_file", type=str, help="CSV文件路径，需包含sepal_length,sepal_width,petal_length,petal_width列")
# 在main()中
if args.csv_file:
    import pandas as pd
    df = pd.read_csv(args.csv_file)
    results = []
    for _, row in df.iterrows():
        pred, conf = model_wrapper.predict(row['sepal_length'], ...)
        results.append([pred, f"{conf*100:.1f}%"])
    pd.DataFrame(results, columns=["品种", "置信度"]).to_csv("prediction_result.csv", index=False)
    print("批量预测完成，结果已保存至 prediction_result.csv")

这个功能把项目从“玩具”升级为“工具”，且只增加了20行代码。它展示了如何用 pandas 桥接结构化数据与机器学习模型。

6.3 模型监控：在界面上实时绘制训练曲线

如果你希望学生理解“模型是怎么学会的”，可以在GUI里嵌入Matplotlib图表。gui/main_window.py 中：

from matplotlib.backends.backend_qt5agg import FigureCanvasQTAgg as FigureCanvas
from matplotlib.figure import Figure

class PlotCanvas(FigureCanvas):
    def __init__(self, parent=None, width=5, height=4, dpi=100):
        fig = Figure(figsize=(width, height), dpi=dpi)
        self.axes = fig.add_subplot(111)
        super().__init__(fig)

# 在IrisMainWindow.__init__中
self.plot_canvas = PlotCanvas(self, width=5, height=4)
main_layout.addWidget(self.plot_canvas)

# 在训练循环中（需改造train.py为可调用函数）
def plot_training_curve(losses, accuracies):
    self.plot_canvas.axes.clear()
    self.plot_canvas.axes.plot(losses, label='Train Loss')
    self.plot_canvas.axes.plot(accuracies, label='Val Accuracy')
    self.plot_canvas.axes.legend()
    self.plot_canvas.draw()