保姆级教程：在RK3588开发板上用NPU跑YOLOv5s，再通过FFmpeg推流到RTMP服务器

张

张建站

2026/4/21 12:53:37

10分钟阅读

保姆级教程：在RK3588开发板上用NPU跑YOLOv5s，再通过FFmpeg推流到RTMP服务器

RK3588边缘AI全流程实战基于NPU的YOLOv5s实时目标检测与RTMP推流指南当我们需要在边缘设备上实现实时目标检测并远程查看结果时RK3588凭借其强大的NPU算力成为理想选择。本文将完整呈现从环境搭建到最终部署的全过程特别针对开发过程中容易遇到的依赖冲突、性能瓶颈等问题提供解决方案。1. 开发环境准备与系统配置RK3588开发板的性能优势在边缘计算场景中尤为突出。我们推荐使用官方Ubuntu 20.04镜像作为基础系统这个版本经过充分验证且驱动支持完善。系统安装完成后首要任务是更新软件源并安装基础开发工具sudo apt update sudo apt upgrade -y sudo apt install -y build-essential cmake git wget unzip关键组件版本选择对项目成功至关重要。经过多次验证我们确定以下组件组合具有最佳兼容性组件名称推荐版本功能作用OpenCV4.5.4图像处理与摄像头采集FFmpegn4.4.1视频编码与RTMP推流libx264latestH.264编码核心库RKNN-Toolkit1.7.0NPU模型转换与推理工具链在编译OpenCV时以下配置参数可确保充分利用RK3588的硬件加速能力cmake -D CMAKE_BUILD_TYPERELEASE \ -D WITH_OPENMPON \ -D WITH_LIBV4LON \ -D WITH_GTKON \ -D BUILD_opencv_python3OFF \ -D BUILD_EXAMPLESOFF \ -D BUILD_TESTSOFF \ -D BUILD_PERF_TESTSOFF \ -D CMAKE_INSTALL_PREFIX/usr/local ..提示编译过程中若出现内存不足的情况可适当减少make的并行编译线程数如将-j16改为-j82. NPU模型转换与优化技巧YOLOv5s模型需要经过特定转换才能在RK3588的NPU上运行。使用RKNN-Toolkit进行模型转换时量化策略的选择直接影响推理精度和速度from rknn.api import RKNN rknn RKNN() ret rknn.config( mean_values[[0, 0, 0]], std_values[[255, 255, 255]], quantized_dtypeasymmetric_quantized-8, quantized_algorithmnormal, target_platformrk3588 )模型转换常见问题及解决方案精度损失过大尝试使用混合量化策略增加校准数据集样本数量调整量化算法参数推理速度不达标启用NPU硬件加速模式优化模型输入输出布局使用rknn.build(do_quantizationTrue, dataset./quant.txt)内存占用过高减小模型输入分辨率使用内存优化版的RKNN运行时库3. 视频处理流水线构建高效视频处理流水线是保证实时性的关键。我们设计的多线程处理架构如下图所示[摄像头采集] → [图像预处理] → [NPU推理] → [结果绘制] → [H.264编码] → [RTMP推流]性能优化关键点使用双缓冲机制避免内存拷贝开销采用零拷贝技术实现OpenCV与FFmpeg的高效交互合理设置编码参数平衡画质与延迟AVCodecContext *codec_ctx ...; codec_ctx-bit_rate 4000000; // 4Mbps codec_ctx-time_base (AVRational){1, 30}; codec_ctx-framerate (AVRational){30, 1}; codec_ctx-gop_size 30; codec_ctx-max_b_frames 0; codec_ctx-pix_fmt AV_PIX_FMT_YUV420P;实测表明经过优化的流水线在640x480分辨率下可实现超过25FPS的处理速度端到端延迟控制在200ms以内。4. RTMP服务器配置与推流优化Nginx搭配RTMP模块是最常用的流媒体服务器方案。编译安装时需注意以下关键配置./configure --add-module../nginx-rtmp-module \ --with-http_ssl_module \ --with-http_v2_module \ --with-cc-opt-O3推流质量调优参数参数推荐值作用说明-presetultrafast降低编码延迟-tunezerolatency最小化缓冲-x264optskeyint30关键帧间隔-movflagsfaststart流式播放优化-f flv-RTMP容器格式完整的FFmpeg推流命令示例ffmpeg -re -f rawvideo -pix_fmt bgr24 -s 640x480 -i - \ -c:v libx264 -preset ultrafast -tune zerolatency \ -f flv rtmp://server/live/stream5. 系统集成与性能调优将各模块整合后我们需要关注整体系统的资源占用和性能表现。通过top和nmon等工具监控发现主要瓶颈集中在以下几个方面内存带宽瓶颈启用CMA连续内存分配使用ION内存管理器减少拷贝CPU利用率不均设置线程亲和性taskset调整各模块线程优先级NPU利用率不足增加批处理大小使用异步推理模式实测性能数据对比优化措施帧率提升内存占用降低CPU负载降低双缓冲机制18%-5%零拷贝技术22%30%15%异步推理35%-25%内存池管理12%40%10%在项目后期调试中发现通过调整RK3588的CPU频率调度策略可以进一步降低功耗echo performance /sys/devices/system/cpu/cpufreq/policy0/scaling_governor最终实现的系统在连续运行24小时压力测试中表现出色平均帧率稳定在28FPS峰值内存占用不超过1.2GB完全满足工业级应用需求。

SAP ABAP开发实战：如何用SOTR_SERV_TABLE_TO_STRING和SCMS_STRING_TO_XSTRING函数，将内表数据一键导出为Excel文件（附防中文乱码技巧）

SAP ABAP开发实战：内表数据高效导出Excel的完整解决方案在SAP系统日常开发中，数据导出是最常见需求之一。当用户需要将内表数据导出为Excel文件时，传统方法往往需要处理复杂的OLE对象或依赖第三方工具。本文将介绍一种基于标准函数组合的高效…...

2026/4/21 12:53:10 阅读更多 →

孩子说话晚、发音不清？别只练嘴！北思则从感统根源同步提升，让娃敢说、会说、说得清～

“语言能力弱，根源可能在感统——说话晚、发音不清、表达弱，同步提升才是关键”——很多家长纠结于“孩子怎么还不会说完整话”，却没意识到，语言发展不只是“学说话”，更是大脑与感官协同作用的结果。行业数据显示&…...

2026/4/21 12:52:13 阅读更多 →

像素史诗智识终端：5分钟开启你的像素RPG研报冒险之旅

像素史诗智识终端：5分钟开启你的像素RPG研报冒险之旅 1. 欢迎来到像素研报冒险世界想象一下，当你需要撰写一份专业研究报告时，不再面对枯燥的文档界面，而是置身于一个充满复古像素风格的RPG世界。这就是像素史诗智识终端(Pixel…...

2026/4/21 12:50:52 阅读更多 →

告别UI管理混乱：DoozyUI的UICanvas与UIView如何帮你构建可维护的Unity项目架构

告别UI管理混乱：DoozyUI的UICanvas与UIView如何帮你构建可维护的Unity项目架构在开发中大型Unity项目时，UI系统的复杂度往往随着功能迭代呈指数级增长。当项目包含多个场景、数十个界面和数百个交互元素时，开发者常会遇到以下典型问题&#…...

2026/4/20 4:09:28 阅读更多 →

C语言之整型常量后缀探秘：从1ULL/1UL/1L到跨平台编程(五十五)

1. 整型常量后缀的底层原理第一次看到1ULL这种写法时，我盯着屏幕愣了三秒——数字后面加字母是什么黑魔法？直到在32位系统上调试一个计数器溢出bug后，才真正理解这些后缀的重要性。整型常量后缀实际上是告诉编译器："别用默认…...

2026/4/20 7:00:24 阅读更多 →

VisionMaster企业实操训练系列课程

VisionMaster企业实操训练系列课程主要出于，快速会设计视觉引导定位项目引导定位原理原理演示 1.单相机带角度定位引导 2.12点标定 3.单点抓取 4.上下相机对位引导 5.单相机带角度定位引导（相机在机械手上）...

2026/4/20 0:14:41 阅读更多 →

C#怎么限制Task最大并发数_C#如何自定义TaskScheduler【进阶】

SemaphoreSlim 是控制 Task 并发数最直接轻量的选择，通过异步闸门限制同时执行任务数，需配对 WaitAsync() 和 Release() 并在 finally 中确保释放；自定义 TaskScheduler 适用场景极窄，ParallelOptions.MaxDegreeOfParallelism 仅适…...

2026/4/20 6:29:58 阅读更多 →