MogFace人脸检测Streamlit应用从零开始：环境配置→模型加载→图片上传→结果导出

张

张建站

2026/4/16 5:08:18

10分钟阅读

MogFace人脸检测Streamlit应用从零开始环境配置→模型加载→图片上传→结果导出想快速搭建一个专业级的人脸检测工具吗今天我就带你从零开始一步步构建一个基于MogFace模型的Streamlit应用。这个工具不仅能帮你精准定位图片中的每一张脸还能把检测结果可视化出来甚至导出原始坐标数据整个过程就像搭积木一样简单。无论你是想做人脸分析、安防监控还是为后续的人脸识别、关键点检测做预处理这个工具都能成为你的得力助手。我们用的MogFace模型是CVPR 2022上发表的高性能算法专门对付各种“疑难杂症”——比如侧脸、遮挡、或者特别小的人脸它都能找出来。接下来我会手把手教你完成所有步骤从安装环境、加载模型到上传图片、查看结果最后还能把数据导出来。跟着做一遍你就能拥有一个完全在自己电脑上运行的、带可视化界面的智能人脸检测器。1. 环境准备搭建你的AI工作台在开始写代码之前我们需要先把“工作台”搭好。这个过程很简单就是安装几个必要的软件包。1.1 安装必备的Python库打开你的命令行终端Windows上是CMD或PowerShellMac/Linux上是Terminal然后一条一条地执行下面的命令。这些命令会从互联网上下载并安装我们需要的工具。pip install modelscope pip install opencv-python pip install torch torchvision pip install streamlit pip install Pillow pip install numpy让我简单解释一下每个包是干什么的modelscope这是阿里云ModelScope平台的Python库我们用它来加载和运行MogFace模型非常方便。opencv-python也叫cv2是处理图片的“瑞士军刀”比如读取图片、画框、保存图片都靠它。torch这是PyTorch深度学习框架MogFace模型就是基于它构建的必须安装。streamlit这是我们用来构建网页界面的神器用几行Python代码就能做出交互式应用。Pillow另一个常用的图片处理库有时候比OpenCV更轻便。numpyPython里做数学计算的基础包很多AI库都依赖它。小提示如果你有NVIDIA显卡并且想用GPU加速这样检测速度会快很多建议安装支持CUDA的PyTorch版本。可以去PyTorch官网根据你的系统选择对应的安装命令。1.2 准备模型文件我们的核心——MogFace模型需要提前下载好。这个模型比较大你可以从ModelScope的模型库中找到它模型ID通常是damo/cv_resnet101_face-detection_cvpr22papermogface。下载后你会得到一个文件夹里面包含模型权重文件比如.pth文件和配置文件。你需要记住这个文件夹在你电脑上的绝对路径。举个例子假设你把模型文件夹放在了/home/yourname/ai-models/mogface/那么这个路径就是后面代码里要用到的。请根据你的实际情况修改。2. 编写核心应用代码环境准备好了现在我们来写代码。创建一个新的Python文件比如叫face_detection_app.py然后把下面的代码复制进去。2.1 导入工具包代码开头我们先告诉Python需要用到哪些工具。import streamlit as st from modelscope.pipelines import pipeline from modelscope.utils.constant import Tasks import cv2 import numpy as np from PIL import Image import json import os2.2 加载MogFace模型这是最关键的一步。我们用Streamlit的一个特殊功能st.cache_resource它能让模型只加载一次然后一直保存在内存或显存里后面再检测就不用重复加载了速度飞快。st.cache_resource def load_face_detection_model(): 加载MogFace人脸检测模型。请将 model_dir 替换为你本地模型文件夹的实际路径。 # 重要请修改为你自己的模型路径 model_dir /root/ai-models/iic/cv_resnet101_face-detection_cvpr22papermogface # 创建人脸检测的pipeline face_detection_pipeline pipeline( taskTasks.face_detection, modelmodel_dir, devicecuda # 如果有GPU用cuda会更快。如果没有改成cpu ) return face_detection_pipeline # 加载模型 detector load_face_detection_model() st.success(✅ MogFace人脸检测模型加载成功)代码说明st.cache_resource这是Streamlit的“缓存”装饰器确保load_face_detection_model这个函数只运行一次。model_dir你必须把它改成你电脑上模型文件夹的真实路径。devicecuda如果你有NVIDIA显卡并且安装了PyTorch的CUDA版本就用这个速度极快。如果没有显卡或者没装CUDA就改成devicecpu用CPU也能跑只是慢一点。2.3 构建Streamlit网页界面现在我们来设计网页的样子。Streamlit用起来很直观代码的顺序基本就是网页从上到下的布局。# 设置网页标题和图标 st.set_page_config(page_titleMogFace 智能人脸检测器, layoutwide) # 主标题 st.title(️ MogFace 极速智能人脸检测工具) st.markdown(---) # 创建左右两列的布局 col_left, col_right st.columns(2) with col_left: st.header( 步骤一上传图片) uploaded_file st.file_uploader(选择一张包含人脸的图片支持JPG, PNG, type[jpg, jpeg, png]) if uploaded_file is not None: # 用PIL打开图片并显示预览 image Image.open(uploaded_file) st.image(image, caption你上传的原始图片, use_column_widthTrue) # 将PIL图片转换成OpenCV能处理的格式numpy数组 opencv_image np.array(image) # OpenCV默认是BGR颜色我们上传的通常是RGB需要转换一下 opencv_image cv2.cvtColor(opencv_image, cv2.COLOR_RGB2BGR) else: st.info(请先上传一张图片。) opencv_image None界面第一部分左列完成了设置了网页为宽屏模式看起来更舒服。创建了一个文件上传器允许用户选择电脑里的图片。如果用户上传了图片就在网页上显示出来并且把图片转换成后面模型检测需要的格式。2.4 添加检测按钮与处理逻辑图片上传后我们需要一个按钮来触发检测。with col_right: st.header( 步骤二检测与结果) detect_button st.button( 开始检测, typeprimary, use_container_widthTrue) if detect_button and opencv_image is not None: # 显示一个加载动画告诉用户模型正在工作 with st.spinner(MogFace正在努力识别人脸中...): # 调用模型进行检测这是最核心的一行代码 detection_result detector(opencv_image) # 检测完成后把结果画到图片上 result_image opencv_image.copy() faces detection_result[boxes] # 获取所有检测框的坐标 scores detection_result[scores] # 获取每个框的置信度 face_count 0 # 遍历每一个检测到的人脸框 for box, score in zip(faces, scores): # box格式是 [x1, y1, x2, y2]分别是左上角和右下角的坐标 x1, y1, x2, y2 map(int, box) # 转换成整数 # 用绿色矩形框出人脸线条粗细为2 cv2.rectangle(result_image, (x1, y1), (x2, y2), (0, 255, 0), 2) # 在框的左上角标出置信度保留两位小数 label f{score:.2f} cv2.putText(result_image, label, (x1, y1-10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 0), 2) face_count 1 # 把OpenCV格式的图片BGR转回RGB以便Streamlit显示 result_image_rgb cv2.cvtColor(result_image, cv2.COLOR_BGR2RGB) # 在右列展示结果 st.subheader(f检测结果发现了 {face_count} 张人脸) st.image(result_image_rgb, caption绿色框为人脸区域数字为置信度, use_column_widthTrue)这段代码做了几件重要的事在右列放置了一个显眼的蓝色按钮“开始检测”。用户点击按钮后程序调用之前加载好的detector模型把图片传给它分析。模型返回的结果里包含boxes人脸框坐标和scores置信度。我们用OpenCV的rectangle函数根据坐标在原图上画出绿色的框。用putText函数把置信度比如0.99标在框的旁边。最后把画好框的图片显示在网页右列。2.5 导出检测结果数据对于开发者来说光看到图片还不够我们可能需要原始的坐标数据来做进一步分析。所以我们增加一个数据展示和导出功能。# 在结果图片下方展示详细的JSON数据 st.subheader( 原始检测数据 (JSON)) # 把检测结果整理成字典格式方便转换成JSON result_data { image_file: uploaded_file.name, face_count: face_count, detections: [] } for i, (box, score) in enumerate(zip(faces, scores)): x1, y1, x2, y2 map(int, box) result_data[detections].append({ id: i, bbox: [x1, y1, x2, y2], # 边界框坐标 score: float(score), # 置信度得分 bbox_width: x2 - x1, # 框的宽度 bbox_height: y2 - y1 # 框的高度 }) # 以可展开的格式展示JSON看起来更清晰 st.json(result_data) # 提供一个按钮让用户下载这些JSON数据 json_str json.dumps(result_data, indent2, ensure_asciiFalse) st.download_button( label 下载检测结果 (JSON), datajson_str, file_namefdetection_result_{uploaded_file.name.split(.)[0]}.json, mimeapplication/json )这个功能非常实用st.json() 把Python字典用漂亮的、可折叠的格式展示在网页上你可以点开看每一个人的坐标。st.download_button() 生成一个下载按钮点击就能把上面展示的JSON数据保存成一个.json文件到你的电脑里。文件会自动用图片名来命名。2.6 添加侧边栏信息最后我们在网页的侧边栏加一些辅助信息让应用看起来更完整。# 侧边栏 with st.sidebar: st.header(⚙️ 模型信息) st.markdown( **模型名称**: MogFace (CVPR 2022) **骨干网络**: ResNet101 **任务类型**: 人脸检测 **最佳场景**: 复杂光照、遮挡、侧脸、小尺寸人脸 ) st.markdown(---) st.header(ℹ️ 使用提示) st.info( 1. 上传的图片尺寸不宜过大建议长边在2000像素以内。 2. 置信度越接近1.0表示检测结果越可靠。 3. 处理多人合照时请确保图片清晰。 ) # 一个重置按钮用于清理状态如果需要的话 if st.button( 清理缓存/重置应用): st.cache_resource.clear() st.rerun()3. 运行你的应用代码都写好了现在让它跑起来保存你的Python文件比如face_detection_app.py。打开命令行终端导航到这个文件所在的文件夹。输入以下命令并回车streamlit run face_detection_app.py几秒钟后你的默认浏览器会自动打开一个新标签页地址是http://localhost:8501。恭喜你你的专属人脸检测应用已经上线了4. 完整操作流程演示让我们从头到尾操作一遍看看效果。上传图片在网页左侧点击“Browse files”或者把图片拖拽到上传区域。选一张有人的照片比如团建合照、个人肖像都行。开始检测图片预览出来后点击右侧蓝色的“ 开始检测”按钮。你会看到一个旋转的加载图标表示模型正在工作。通常1-3秒内就会完成。查看结果视觉结果右侧会立刻显示画好绿色框的图片。每个人脸都被框出来了旁边还有像“0.99”这样的数字代表模型有多确信这里是人脸。数据结果往下滚动你会看到一个“原始检测数据 (JSON)”区域。点开它能看到每个人脸框的精确坐标[x1, y1, x2, y2]和置信度。导出数据点击JSON数据下方的“ 下载检测结果 (JSON)”按钮就能把这份结构化的数据保存到本地方便你导入到其他程序里做进一步分析。5. 总结到这里你已经成功搭建并运行了一个功能完整的本地人脸检测应用。我们回顾一下核心步骤和学到的东西核心步骤回顾配环境安装了6个必要的Python库搭建了AI工作环境。下模型准备了强大的MogFace模型文件它是检测准确度的保证。写代码用大约100行Python代码串联起了模型加载、图片处理、网页交互、结果可视化所有环节。跑应用一行命令启动服务通过浏览器就能使用。这个工具能帮你做什么快速验证拿到一张新图片几十秒内就能知道里面有多少人、人在哪。数据标注自动生成的人脸框坐标JSON格式可以直接用作训练其他人脸模型如识别、关键点的标注数据省去大量手工画框的时间。集成开发你可以很容易地把这里的核心检测代码detector(opencv_image)那一行拆出来放到你自己的Python项目里作为一个模块来调用。更进一步如果你觉得这个基础版本已经满足需求那太好了。如果你想玩点更花的这里有几个方向试试视频用OpenCV读取摄像头或者视频文件然后对每一帧图片调用检测就能实现实时的人脸检测。提高精度如果发现某些场景比如极度模糊检测不好可以尝试换用ModelScope上其他更专精的模型。美化界面Streamlit支持很多组件你可以增加滑块来调整画框的颜色、线条粗细或者增加选择框来切换不同的模型。希望这个教程能帮你打开AI应用开发的大门。最重要的是你拥有了一个完全在自己控制下的、离线的、可视化的人脸检测工具。快去试试用它处理你的照片吧获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

STM32CubeIDE实战：用HAL库PWM驱动RGB灯带，实现渐变呼吸效果（附完整代码）

STM32CubeIDE实战：用HAL库PWM驱动RGB灯带，实现渐变呼吸效果（附完整代码） 在智能家居和创客项目中，RGB灯带因其丰富的色彩表现和灵活的控制方式，成为打造氛围照明的首选方案。相比单一LED的呼吸灯效果&#…...

2026/4/16 5:06:17 阅读更多 →

别再手动拼接字符串了！Vant 时间选择器日期格式化与数据回填的避坑指南

别再手动拼接字符串了！Vant 时间选择器日期格式化与数据回填的避坑指南在移动端开发中，时间选择器是表单中最常见的组件之一。Vant 作为一款优秀的移动端组件库，提供了强大的 Calendar 和 Picker 组件，可以轻松实现日期和时间的选…...

2026/4/16 5:06:16 阅读更多 →

腾讯Kuikly跨端框架深度剖析：Kotlin Multiplatform赋能鸿蒙高效开发

1. 腾讯Kuikly框架的跨端开发革命第一次听说腾讯Kuikly框架时，我正在为一个跨平台项目头疼不已。当时需要在Android、iOS和鸿蒙三个平台上实现相同的功能，光是写三套UI代码就让我抓狂。直到发现Kuikly这个基于Kotlin Multiplatform（KMP&…...

2026/4/16 5:05:30 阅读更多 →

Snyk 依赖性安全漏洞扫描工具实战指南：从安装到多语言项目扫描

1. Snyk工具与依赖安全漏洞扫描基础第一次听说Snyk是在去年参与一个金融项目时，我们的技术负责人突然要求所有依赖包必须通过安全扫描才能上线。当时团队里没人知道该怎么操作，直到发现了这个神器。Snyk本质上是个"依赖包安检仪"，…...

2026/4/13 13:51:39 阅读更多 →

mbed OS 6+ 嵌入式TFTP服务器设计与实现

1. TFTPServer项目概述TFTPServer 是一个面向 ARM mbed OS 平台的轻量级 TFTP（Trivial File Transfer Protocol）服务器实现，专为嵌入式以太网设备设计。其核心目标是在资源受限的 MCU（如 STM32F4/F7/H7、NXP LPC1768/LPC54608、Re…...

2026/4/13 13:14:19 阅读更多 →

Windows效率神器PowerToys：30+免费工具让你的电脑生产力翻倍

Windows效率神器PowerToys：30免费工具让你的电脑生产力翻倍【免费下载链接】PowerToys Microsoft PowerToys is a collection of utilities that supercharge productivity and customization on Windows 项目地址: https://gitcode.com/GitHub_Trending/po/Powe…...

2026/4/14 3:20:16 阅读更多 →

RX63N驱动SSD1963显示控制器的HAL级配置指南

1. 项目概述Display_shield_config是为 Renesas GR-PEACH 开发板配套的显示扩展板（Display Shield）所设计的一套底层配置资源集合。GR-PEACH 是基于 Renesas RX63N 微控制器的高性能嵌入式开发平台，主频高达 100 MHz，内置 1 MB Fl…...

2026/4/14 4:56:47 阅读更多 →