简述：小数据集照片分类的模型训练

张

张建站

2026/6/4 16:16:21

10分钟阅读

简述小数据集照片分类的模型训练如20 个分类 × 每类 500 张总共 1 万张图属于小数据集多分类。一、先确定你该用什么模型直接选MobileNetV2 或 ResNet34理由适合小数据集1 万张以内训练快、不容易过拟合分类效果稳20 类完全够用你之前已经在用 ResNet无缝衔接二、训练前准备文件夹结构必须这样放plaintext dataset/ train/ 类别1/ 001.jpg 002.jpg... 类别2/... 类别20/ val/ 类别1/ 类别2/... 类别20/数据划分规则非常重要每类 500 张400 张 → train 训练100 张 → val 验证三、最简单训练方案推荐你直接用核心技术迁移学习小数据集必用用ImageNet 预训练权重只微调最后几层训练速度快、准确率高训练超参数直接照抄输入尺寸224×224批次大小16 或 32学习率1e-4优化器Adam损失函数CrossEntropyLoss多分类标准训练轮数30~50 轮四、完整训练步骤从 0 到 1第 1 步安装环境1 行命令pipinstalltorch torchvision pillow tqdm第 2 步训练代码复制直接运行importtorchimporttorch.nnasnnfromtorchvisionimportdatasets,models,transformsfromtorch.utils.dataimportDataLoaderimportos# 1. 配置 devicetorch.device(cudaiftorch.cuda.is_available()elsecpu)num_classes20# 你的分类数量batch_size16epochs30lr1e-4# 2. 数据增强小数据集必须加data_transforms{train:transforms.Compose([transforms.Resize((224,224)),transforms.RandomHorizontalFlip(),# 随机翻转transforms.RandomRotation(15),# 随机旋转transforms.ToTensor(),transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])]),val:transforms.Compose([transforms.Resize((224,224)),transforms.ToTensor(),transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])])}# 3. 加载数据 data_dirdataset# 你的数据集路径image_datasets{x:datasets.ImageFolder(os.path.join(data_dir,x),data_transforms[x])forxin[train,val]}dataloaders{x:DataLoader(image_datasets[x],batch_sizebatch_size,shuffleTrue,num_workers0)forxin[train,val]}# 4. 模型ResNet34 迁移学习 modelmodels.resnet34(pretrainedTrue)# 修改最后一层为20分类num_ftrsmodel.fc.in_features model.fcnn.Linear(num_ftrs,num_classes)modelmodel.to(device)# 5. 损失函数优化器 criterionnn.CrossEntropyLoss()optimizertorch.optim.Adam(model.parameters(),lrlr)# 6. 开始训练 forepochinrange(epochs):model.train()running_loss0.0correct0total0forinputs,labelsindataloaders[train]:inputs,labelsinputs.to(device),labels.to(device)optimizer.zero_grad()outputsmodel(inputs)losscriterion(outputs,labels)loss.backward()optimizer.step()running_lossloss.item()_,predictedtorch.max(outputs,1)totallabels.size(0)correct(predictedlabels).sum().item()train_acc100*correct/totalprint(fEpoch{epoch1}/{epochs}| Loss:{running_loss:.4f}| Acc:{train_acc:.2f}%)# 验证model.eval()val_correct0val_total0withtorch.no_grad():forinputs,labelsindataloaders[val]:inputs,labelsinputs.to(device),labels.to(device)outputsmodel(inputs)_,predictedtorch.max(outputs,1)val_totallabels.size(0)val_correct(predictedlabels).sum().item()val_acc100*val_correct/val_totalprint(f验证集准确率:{val_acc:.2f}%\n)# 保存模型torch.save(model.state_dict(),photo_classify_20classes.pth)print(训练完成模型已保存)第 3 步运行训练把数据集放好直接运行代码30~60 分钟训练完成。五、预测代码训练完直接用importtorchfromtorchvisionimportmodels,transformsfromPILimportImage# 加载模型devicetorch.device(cudaiftorch.cuda.is_available()elsecpu)modelmodels.resnet34()model.fctorch.nn.Linear(model.fc.in_features,20)model.load_state_dict(torch.load(photo_classify_20classes.pth))modelmodel.to(device)model.eval()# 预处理transformtransforms.Compose([transforms.Resize((224,224)),transforms.ToTensor(),transforms.Normalize([0.485,0.456,0.406],[0.229,0.224,0.225])])# 预测一张图defpredict_image(img_path):imgImage.open(img_path).convert(RGB)imgtransform(img).unsqueeze(0).to(device)withtorch.no_grad():outputmodel(img)_,predtorch.max(output,1)returnpred.item()# 使用print(predict_image(test.jpg))六、这个数据规模预期效果训练集准确率95%~99%验证集准确率85%~92%20 分类完全够用每类 500 张属于刚刚好的小样本七、总结最关键的 3 点任务类型图像分类模型ResNet34不是分割模型数据每类分 400 训练 100 验证文件夹分类放好训练用迁移学习30 轮直接运行我给的代码

AVEC2014抑郁症语音识别实战包：ResNet模型完整训练流程+预处理特征数据

本文还有配套的精品资源，点击获取简介：直接运行就能跑通的抑郁症语音分析代码包，基于AVEC2014国际标准数据集，用ResNet做端到端建模。里面包含音频特征加载（eGeMAPS等）、标准化预处理、ResNet网络搭建、…...

2026/6/4 16:15:34 阅读更多 →

大模型+多源数据融合的AI产业招商智能体技术实践解析（含行业标杆企业推荐）

传统产业招商普遍存在经验无法复用、数据孤岛突出、全流程人工低效等业务与技术瓶颈，传统人工招商模式已难以适配当下精细化、高速化的产业竞争节奏。为解决上述行业共性痛点，AI招商智能体已成为政府园区数智化转型的核心方向。本文以行业标杆方案——火…...

2026/6/4 16:11:50 阅读更多 →

深度解析HS2-HF Patch：200+插件如何重构Honey Select 2的游戏体验

深度解析HS2-HF Patch：200插件如何重构Honey Select 2的游戏体验【免费下载链接】HS2-HF_Patch Automatically translate, uncensor and update HoneySelect2! 项目地址: https://gitcode.com/gh_mirrors/hs/HS2-HF_Patch 在数字创作的世界里，每…...

2026/6/4 16:11:31 阅读更多 →

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…...

2026/6/3 16:54:28 阅读更多 →

Lindy路线图前瞻：3个已被验证的信号，预示Q3将启动下一代AI原生平台重构

更多请点击： https://intelliparadigm.com 第一章：Lindy路线图前瞻：3个已被验证的信号，预示Q3将启动下一代AI原生平台重构信号一：核心基础设施层API调用量连续8周突破临界阈值 Lindy平台的 /v2/execute与 /v3/plan端…...

2026/6/3 1:19:41 阅读更多 →

【AI工具智能排行榜TOP10】：2024年实测数据驱动的生产力跃迁指南（仅限本周开放下载）

更多请点击： https://kaifayun.com 第一章：AI工具智能排行榜TOP10的底层逻辑与评估范式 AI工具排行榜并非主观评分的产物，而是由多维可量化指标驱动的系统性工程。其核心在于构建一个兼顾能力广度、推理深度、工程鲁棒性与生态协同性的评估范…...

2026/6/4 8:46:30 阅读更多 →

3步解决博德之门3模组管理难题：BG3ModManager完整使用指南

3步解决博德之门3模组管理难题：BG3ModManager完整使用指南【免费下载链接】BG3ModManager A mod manager for Baldurs Gate 3. This is the only official source! 项目地址: https://gitcode.com/gh_mirrors/bg/BG3ModManager BG3ModManager是专为《博德之…...

2026/6/4 10:59:42 阅读更多 →