ArcGIS Pro 3.0 + YOLO：手把手教你制作遥感影像目标检测数据集（附完整代码）

张

张建站

2026/6/5 13:12:35

10分钟阅读

ArcGIS Pro 3.0 + YOLO：手把手教你制作遥感影像目标检测数据集（附完整代码）

ArcGIS Pro 3.0与YOLO实战遥感影像目标检测数据集全流程解析在遥感影像分析领域目标检测技术正逐渐成为从海量数据中提取有价值信息的关键手段。无论是农业监测中的作物识别、城市规划中的建筑物检测还是环境评估中的植被覆盖分析准确高效的自动化检测方案都能显著提升工作效率。本文将完整呈现如何利用ArcGIS Pro 3.0与YOLO框架构建端到端的遥感目标检测解决方案特别适合需要处理大范围地理空间数据的GIS专业人员和AI开发者。1. 环境准备与数据标注1.1 软件配置要求构建遥感影像检测流水线需要以下核心组件ArcGIS Pro 3.0确保安装时勾选Deep Learning扩展模块Python 3.8环境推荐使用Miniconda创建独立环境YOLOv5/v8可通过pip直接安装最新版本辅助工具包GDAL、OpenCV、Shapely等空间数据处理库提示ArcGIS Pro的深度学习工具需要单独授权建议提前确认许可状态1.2 遥感影像预处理要点优质数据集的基础是规范的影像预处理坐标系统一确保所有影像采用相同的投影坐标系如WGS84 Web Mercator辐射校正进行大气校正和辐射归一化处理波段组合根据检测目标优化波段选择如植被检测优先使用NIR波段影像分块建议将大范围影像预先分割为1024x1024像素的区块# 使用GDAL进行影像分块示例 import gdal input_img input.tif output_prefix tile_ tile_size 1024 ds gdal.Open(input_img) for i in range(0, ds.RasterXSize, tile_size): for j in range(0, ds.RasterYSize, tile_size): gdal.Translate(f{output_prefix}{i}_{j}.tif, ds, srcWin[i, j, tile_size, tile_size])2. ArcGIS Pro标注工作流2.1 创建标注工程在ArcGIS Pro中建立标注项目的关键步骤新建地图工程导入待标注影像创建面要素类Shapefile或Geodatabase Feature Class设置与影像一致的坐标系添加class_id短整型和class_name文本型字段启动编辑会话使用多边形工具绘制目标轮廓标注效率技巧启用捕捉功能保证标注边界精确对齐对规则形状目标如圆形树冠可使用自动完成多边形工具批量标注时先绘制所有同类目标再统一填写属性2.2 高级标注策略针对遥感影像特点推荐以下优化方法场景解决方案优势多时相影像使用时间滑块同步标注避免重复标注相同地物大区域覆盖建立图幅索引系统便于团队协作标注多类别目标定制符号化渲染直观区分不同类别# 属性表批量赋值示例ArcPy import arcpy feature_class 标注要素.shp with arcpy.da.UpdateCursor(feature_class, [class_id, class_name]) as cursor: for row in cursor: if row[1] 柑橘树: row[0] 1 # 对应YOLO类别ID cursor.updateRow(row)3. 数据集导出与格式转换3.1 使用Export Training Data工具在ArcGIS Pro的影像分析工具箱中找到导出深度学习训练数据工具关键参数配置输入栅格选择待导出的影像图层输出位置指定空文件夹存储结果标注要素选择标注好的面要素输出格式建议选择PASCAL Visual Object Classes切片大小设置为640x640适配YOLO输入尺寸步长设置320可获得50%重叠的增强数据注意勾选旋转增强可自动生成多角度训练样本显著提升模型鲁棒性3.2 转换为YOLO格式导出后的PASCAL VOC格式需要转换为YOLO要求的txt标注文件转换逻辑包括解析XML中的边界框坐标将绝对坐标转换为相对坐标0-1范围按class_id x_center y_center width height格式保存# VOC转YOLO格式完整代码 import xml.etree.ElementTree as ET import os def convert_voc_to_yolo(xml_path, output_dir, class_map): tree ET.parse(xml_path) root tree.getroot() size root.find(size) img_width int(size.find(width).text) img_height int(size.find(height).text) txt_filename os.path.splitext(os.path.basename(xml_path))[0] .txt txt_path os.path.join(output_dir, txt_filename) with open(txt_path, w) as f: for obj in root.iter(object): cls_name obj.find(name).text cls_id class_map[cls_name] bbox obj.find(bndbox) xmin float(bbox.find(xmin).text) ymin float(bbox.find(ymin).text) xmax float(bbox.find(xmax).text) ymax float(bbox.find(ymax).text) # 转换坐标 x_center ((xmin xmax) / 2) / img_width y_center ((ymin ymax) / 2) / img_height width (xmax - xmin) / img_width height (ymax - ymin) / img_height f.write(f{cls_id} {x_center:.6f} {y_center:.6f} {width:.6f} {height:.6f}\n) # 使用示例 class_map {柑橘树: 0, 建筑物: 1} # 与标注时的class_id对应 xml_dir VOC/Annotations output_dir YOLO/labels os.makedirs(output_dir, exist_okTrue) for xml_file in os.listdir(xml_dir): if xml_file.endswith(.xml): convert_voc_to_yolo(os.path.join(xml_dir, xml_file), output_dir, class_map)4. YOLO模型训练配置4.1 数据集结构规范完整的YOLO数据集应遵循以下目录结构dataset/ ├── images/ │ ├── train/ │ └── val/ ├── labels/ │ ├── train/ │ └── val/ └── dataset.yaml4.2 关键配置文件详解dataset.yaml文件是连接数据和模型的枢纽典型配置如下# 柑橘树检测数据集配置 path: ../dataset # 数据集根目录 train: images/train # 训练集路径 val: images/val # 验证集路径 # 类别信息 names: 0: 柑橘树 1: 建筑物 2: 道路 # 超参数配置 nc: 3 # 类别数量 batch: 16 # 批次大小 imgsz: 640 # 输入尺寸数据集划分建议采用70-15-15比例分配训练/验证/测试集确保不同集合间的空间分布均衡对时序数据要保持时间连续性4.3 训练启动与监控使用YOLOv8的训练命令示例yolo taskdetect modetrain modelyolov8s.pt datadataset/dataset.yaml epochs100 imgsz640 batch16训练过程监控要点指标观察mAP0.5主要精度指标损失曲线关注train/val损失同步下降数据增强启用Mosaic增强调整HSV色域变换参数早停策略设置patience20防止过拟合# 训练结果可视化代码 from ultralytics import YOLO import matplotlib.pyplot as plt model YOLO(yolov8s.pt) results model.train(datadataset.yaml, epochs100) # 绘制精度曲线 plt.figure(figsize(10, 6)) plt.plot(results.results[metrics/mAP50(B)], labelmAP0.5) plt.xlabel(Epoch) plt.ylabel(Precision) plt.legend() plt.show()5. 实际应用与优化技巧5.1 模型部署方案将训练好的YOLO模型集成回ArcGIS Pro的三种方式Python脚本工具通过ArcPy创建自定义地理处理工具使用ONNX运行时加速推理Deep Learning Package将模型出为.esdl格式利用检测对象工具批量处理REST服务部署模型为影像服务支持分布式计算和大范围应用# ArcGIS Pro中调用YOLO模型的示例 import arcpy import torch from PIL import Image def detect_objects(input_raster, output_fc, model_path): # 加载模型 model torch.hub.load(ultralytics/yolov5, custom, pathmodel_path) # 创建输出要素类 arcpy.CreateFeatureclass_management( os.path.dirname(output_fc), os.path.basename(output_fc), POLYGON, spatial_referencearcpy.Describe(input_raster).spatialReference ) arcpy.AddField_management(output_fc, Class, TEXT) # 分块处理影像 with arcpy.da.InsertCursor(output_fc, [SHAPE, Class]) as cursor: for tile in generate_tiles(input_raster, tile_size640): img Image.fromarray(tile) results model(img) for *xyxy, conf, cls in results.xyxy[0]: # 将检测框转换为多边形 polygon arcpy.Polygon( arcpy.Array([ arcpy.Point(xyxy[0], xyxy[1]), arcpy.Point(xyxy[2], xyxy[1]), arcpy.Point(xyxy[2], xyxy[3]), arcpy.Point(xyxy[0], xyxy[3]) ]) ) cursor.insertRow([polygon, model.names[int(cls)]])5.2 性能优化策略针对遥感影像特点的专项优化多尺度训练在dataset.yaml中添加fl_gamma0.5参数增强小目标检测TTA测试时增强推理时启用多尺度预测模型剪枝使用通道剪枝技术减小模型体积处理超大影像的技巧采用滑动窗口检测时设置50%重叠度使用NMS非极大值抑制合并重复检测对边缘区域采用镜像填充避免信息丢失# 大影像滑动窗口处理示例 def process_large_image(image_path, model, window_size640, stride320): img Image.open(image_path) width, height img.size results [] for y in range(0, height, stride): for x in range(0, width, stride): # 计算实际窗口范围 x1 max(0, x) y1 max(0, y) x2 min(width, x window_size) y2 min(height, y window_size) # 提取窗口并预测 window img.crop((x1, y1, x2, y2)) detections model(window) # 转换坐标到原图坐标系 for det in detections.xyxy[0]: global_x1 x1 det[0] global_y1 y1 det[1] global_x2 x1 det[2] global_y2 y1 det[3] results.append([global_x1, global_y1, global_x2, global_y2, det[4], det[5]]) # 应用NMS过滤重复检测 return apply_nms(results, iou_threshold0.5)

向量查询调优实战：召回率、延迟与吞吐量的博弈

系列导读你现在看到的是《向量数据库选型与调优全攻略：从原理到工程实践》的第 5/10 篇，当前这篇会重点解决：用实验数据说话，给出可量化的调优建议，帮助读者在真实业务中找到最佳平衡点。上一篇回顾：第 4 篇《索引原理深扒：IVF_FLAT、HNSW、PQ 到底怎么选？》主要聚…...

2026/6/5 13:11:00 阅读更多 →

牛津半导体桥接芯片：PCIe转Local Bus与多串口扩展实战指南

1. 项目概述：为什么我们需要桥接芯片？在嵌入式系统、工控主板或者一些老设备的升级改造项目中，我们经常会遇到一个头疼的问题：新平台和老外设之间的“语言不通”。比如，你手头有一块基于现代x86或ARM架构的工控板&…...

2026/6/5 13:10:02 阅读更多 →

卡梅德生物技术快报｜酵母表达系统工程：裂殖酵母穿梭载体分子改造与载体构建技术总结

一、提出问题（分子工程痛点）分子克隆实操中，基于酵母表达系统搭建粟酒裂殖酵母重组载体时，商用 pREP3X 载体存在克隆效率低、筛选不安全、启动子受培养条件制约三大工程缺陷。现有酵母表达系统载体改造方案大多单点优化&#xff0…...

2026/6/5 13:08:57 阅读更多 →

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…...

2026/6/3 16:54:28 阅读更多 →

Lindy路线图前瞻：3个已被验证的信号，预示Q3将启动下一代AI原生平台重构

更多请点击： https://intelliparadigm.com 第一章：Lindy路线图前瞻：3个已被验证的信号，预示Q3将启动下一代AI原生平台重构信号一：核心基础设施层API调用量连续8周突破临界阈值 Lindy平台的 /v2/execute与 /v3/plan端…...

2026/6/3 1:19:41 阅读更多 →

【AI工具智能排行榜TOP10】：2024年实测数据驱动的生产力跃迁指南（仅限本周开放下载）

更多请点击： https://kaifayun.com 第一章：AI工具智能排行榜TOP10的底层逻辑与评估范式 AI工具排行榜并非主观评分的产物，而是由多维可量化指标驱动的系统性工程。其核心在于构建一个兼顾能力广度、推理深度、工程鲁棒性与生态协同性的评估范…...

2026/6/4 8:46:30 阅读更多 →

3步解决博德之门3模组管理难题：BG3ModManager完整使用指南

3步解决博德之门3模组管理难题：BG3ModManager完整使用指南【免费下载链接】BG3ModManager A mod manager for Baldurs Gate 3. This is the only official source! 项目地址: https://gitcode.com/gh_mirrors/bg/BG3ModManager BG3ModManager是专为《博德之…...

2026/6/4 10:59:42 阅读更多 →