CANN 视觉模型部署：ResNet、YOLO 等经典模型的 NPU 落地

张

张建站

2026/5/23 1:07:09

10分钟阅读

一、视觉模型分类1.1 模型类型视觉模型三大类: 分类模型 (Classification) ResNet, VGG, EfficientNet, ViT 输入: 图像 → 输出: 类别概率检测模型 (Detection) YOLO, SSD, Faster R-CNN, DETR 输入: 图像 → 输出: 边界框类别分割模型 (Segmentation) U-Net, DeepLab, Mask R-CNN 输入: 图像 → 输出: 像素级掩码1.2 部署流程通用部署流程: PyTorch 模型 → ONNX 导出 → ATC 转换 → .om 模型 → 推理分类模型: 简单直接转换成功率高检测模型: 后处理复杂可能需要自定义算子分割模型: 输出尺寸大显存需求高二、分类模型部署2.1 ResNet 部署importtorchimporttorchvision.modelsasmodels# 1. 导出 ONNXmodelmodels.resnet50(pretrainedTrue)model.eval()dummy_inputtorch.randn(1,3,224,224)torch.onnx.export(model,dummy_input,resnet50.onnx,input_names[image],output_names[logits],dynamic_axes{image:{0:batch_size}},opset_version14)print(ONNX 模型已导出)# 2. ATC 转换atc--modelresnet50.onnx\--framework5\--outputresnet50\--input_shapeimage:1,3,224,224\--soc_versionAscend310\--loginfo# 3. 推理实现importnumpyasnpclassResNetClassifier:def__init__(self,model_path):self.modelself._load_model(model_path)self.meannp.array([0.485,0.456,0.406])self.stdnp.array([0.229,0.224,0.225])defpreprocess(self,image):图像预处理fromPILimportImage# Resizeimageimage.resize((224,224))# 转 numpyimagenp.array(image)/255.0# 归一化image(image-self.mean)/self.std# 转置 CHWimageimage.transpose(2,0,1)# 添加 batch 维度imagenp.expand_dims(image,axis0).astype(np.float32)returnimagedefpredict(self,image):推理input_dataself.preprocess(image)outputself._run_model(input_data)# Softmaxprobsnp.exp(output)/np.sum(np.exp(output))returnprobsdeftop_k(self,image,k5):Top-K 预测probsself.predict(image)# 加载 ImageNet 类别classesself._load_imagenet_classes()# 获取 Top-Ktop_k_idxnp.argsort(probs[0])[-k:][::-1]top_k[(classes[idx],probs[0][idx])foridxintop_k_idx]returntop_k# 使用示例classifierResNetClassifier(resnet50.om)fromPILimportImage imageImage.open(cat.jpg)top5classifier.top_k(image,k5)forclass_name,probintop5:print(f{class_name}:{prob:.4f})三、检测模型部署3.1 YOLO 部署importtorch# 1. 导出 YOLO ONNXfromultralyticsimportYOLO modelYOLO(yolov8n.pt)# 导出model.export(formatonnx,imgsz640,simplifyTrue)print(YOLO ONNX 已导出)# 2. YOLO 后处理classYOLOPostprocessor:def__init__(self,conf_threshold0.5,iou_threshold0.45):self.conf_thresholdconf_threshold self.iou_thresholdiou_thresholddefprocess(self,output,original_size):YOLO 后处理# output shape: (1, 84, 8400) for YOLOv8# 转置outputoutput[0].T# (8400, 84)# 提取边界框和类别boxesoutput[:,:4]# x1, y1, x2, y2scoresoutput[:,4:]# 类别分数# 获取最大类别分数max_scoresnp.max(scores,axis1)class_idsnp.argmax(scores,axis1)# 过滤低置信度maskmax_scoresself.conf_threshold boxesboxes[mask]max_scoresmax_scores[mask]class_idsclass_ids[mask]# NMSkeep_idsself._nms(boxes,max_scores,self.iou_threshold)# 缩放到原始尺寸boxesboxes[keep_ids]boxesself._scale_boxes(boxes,original_size)return{boxes:boxes,scores:max_scores[keep_ids],class_ids:class_ids[keep_ids]}def_nms(self,boxes,scores,iou_threshold):非极大值抑制x1boxes[:,0]y1boxes[:,1]x2boxes[:,2]y2boxes[:,3]areas(x2-x1)*(y2-y1)orderscores.argsort()[::-1]keep[]whilelen(order)0:iorder[0]keep.append(i)xx1np.maximum(x1[i],x1[order[1:]])yy1np.maximum(y1[i],y1[order[1:]])xx2np.minimum(x2[i],x2[order[1:]])yy2np.minimum(y2[i],y2[order[1:]])wnp.maximum(0,xx2-xx1)hnp.maximum(0,yy2-yy1)intersectionw*h iouintersection/(areas[i]areas[order[1:]]-intersection)indsnp.where(iouiou_threshold)[0]orderorder[inds1]returnkeepdef_scale_boxes(self,boxes,original_size):缩放边界框orig_h,orig_woriginal_size# 假设输入是 640x640scale_xorig_w/640scale_yorig_h/640boxes[:,[0,2]]*scale_x boxes[:,[1,3]]*scale_yreturnboxes# 使用示例yoloYOLOInference(yolov8n.om)postprocessorYOLOPostprocessor(conf_threshold0.5)imageload_image(street.jpg)raw_outputyolo.detect(image)detectionspostprocessor.process(raw_output,image.shape[:2])# 绘制结果forbox,score,class_idinzip(detections[boxes],detections[scores],detections[class_ids]):print(f类别:{class_id}, 置信度:{score:.4f}, 边界框:{box})四、分割模型部署4.1 U-Net 部署classUNetSegmentor:def__init__(self,model_path):self.modelself._load_model(model_path)defsegment(self,image):语义分割# 预处理input_dataself.preprocess(image)# 推理outputself._run_model(input_data)# 后处理maskself.postprocess(output,image.shape[:2])returnmaskdefpreprocess(self,image):预处理fromPILimportImage# Resize 到模型输入尺寸imageimage.resize((256,256))# 转 numpyimagenp.array(image)/255.0# 归一化image(image-[0.485,0.456,0.406])/[0.229,0.224,0.225]# 转置 CHWimageimage.transpose(2,0,1)# 添加 batch 维度imagenp.expand_dims(image,axis0).astype(np.float32)returnimagedefpostprocess(self,output,original_size):后处理# output shape: (1, num_classes, H, W)# 获取类别masknp.argmax(output[0],axis0)# 缩放到原始尺寸masknp.array(Image.fromarray(mask.astype(np.uint8)).resize((original_size[1],original_size[0]),Image.NEAREST))returnmask# 使用示例segmentorUNetSegmentor(unet.om)imageImage.open(medical.jpg)masksegmentor.segment(image)print(f分割掩码形状:{mask.shape})print(f类别数:{len(np.unique(mask))})五、常见问题问题原因解决方案检测框不准后处理参数不对调整 NMS 阈值分割边缘模糊输出分辨率低使用上采样或高分辨率模型推理速度慢预处理在 CPU使用 NPU 预处理类别错误ImageNet 类别映射错检查类别文件显存不足输入分辨率太大降低分辨率或使用分块推理相关仓库torchvision- 视觉模型 https://gitee.com/pytorch/visionultralytics- YOLO 模型 https://github.com/ultralytics/ultralyticstorch_npu- 昇腾推理 https://gitee.com/ascend/torch_npu

SQL 最常用技能详解与实战示例

引言 SQL（Structured Query Language，结构化查询语言）是与关系型数据库交互的核心工具。无论是数据分析师、后端开发工程师还是产品经理，掌握 SQL 的核心技能都至关重要。本文将系统性地介绍 SQL 中最常用、最核心的技能&#xff…...

2026/5/23 0:56:22 阅读更多 →

百度智能云部署DeepSeek R1模型（企业级生产环境实录）：GPU资源利用率提升217%的5个隐藏参数

更多请点击： https://intelliparadigm.com 第一章：DeepSeek R1模型在百度智能云的企业级部署全景概览 DeepSeek R1作为高性能开源大语言模型，其在百度智能云千帆大模型平台上的企业级部署已形成覆盖模型接入、服务编排、弹性扩缩与安全治理的…...

2026/5/23 0:52:49 阅读更多 →

【仅限前500名开发者】ElevenLabs江苏话语音私有化部署手册（含Docker镜像+苏州话G2P字典+RTSP流式播控SDK）：2024Q3已停止公开下载

更多请点击： https://intelliparadigm.com 第一章：ElevenLabs江苏话语音私有化部署的背景与演进脉络近年来，随着AIGC技术在垂直方言场景中的深度渗透，江苏话（含苏州、南京、南通等片区口音）作为长三角区…...

2026/5/23 0:52:44 阅读更多 →

CircuitPython嵌入式开发实战：从传感器采集到数据存储的完整方案

1. 项目概述与核心价值如果你刚开始接触嵌入式开发，面对琳琅满目的传感器、通信协议和存储需求，可能会感到无从下手。今天，我想分享一个基于CircuitPython的综合性实践项目，它串联了从模拟信号采集、数字通信到数据存储的多个核心…...

2026/5/22 17:23:01 阅读更多 →

3PEAK思瑞浦 TPA2644-TS2R TSSOP14 运算放大器

特性供电电压:3V至36V 偏移电压:2mV(最大值) 差分输入电压范围至电源轨，可作为比较器工作带宽:1.5MHz，斜率:0.5V/us 输入轨至-Vs，无内部ESD二极管至Vs 低1/f噪声:在10Hz时为50nV/Hz 高PSRR:100kHz时60dB 开关电源时无显著输出抖动工作温度…...

2026/5/21 21:54:05 阅读更多 →

如何用免费开源通信调试工具Wu.CommTool提升工业自动化效率

如何用免费开源通信调试工具Wu.CommTool提升工业自动化效率【免费下载链接】Wu.CommTool 基于C#、WPF、Prism、MaterialDesign、HandyControl开发的通讯调试工具。支持Modbus Rtu调试、Mqtt调试、TCP调试、串口调试、UDP调试项目地址: https://gitcode.com/gh_mirrors/wu/W…...

2026/5/22 17:49:20 阅读更多 →