docker vllm 开机启动

张

张建站

2026/5/13 8:06:08

10分钟阅读

vllm 启动inter val大模型/workspace/.devcontainer/devcontainer.json{ name: vLLM Dev Container, image: vllm/vllm-openai:v0.11.0, runArgs: [--gpus, all, -p, 8000:8000, -p, 8080:8080, --restartunless-stopped], mounts: [ source/data/lbg/models,target/data/lbg/models,typebind, source/data/lbg/latex_fanyi/,target/workspace,typebind ], workspaceFolder: /workspace, postCreateCommand: pip install --ignore-installed blinker1.9.0 flask flask-cors requests cd /workspace (vllm serve /data/lbg/models/brandonbeiler_InternVL3_5-8B-FP8-Dynamic --quantization compressed-tensors --served-model-name internvl3_5-8b --trust-remote-code --max-model-len 2048 --tensor-parallel-size 1 ) sleep 10 python3 /workspace/server.py, customizations: { vscode: { extensions: [ ms-python.python, ms-python.vscode-pylance ] } } }重启验证# 手动停止容器看它是否会自动重启 docker stop latex-ai-container # 等待 15 秒 sleep 15 # 检查容器是否自动启动 docker ps | grep latex-ai-container 预期结果容器应该自动重新启动因为 unless-stopped 策略。 3. 测试系统重启最终验证 bash # 重启整个系统 sudo reboot # 系统重启后重新登录执行 docker ps | grep latex-ai-container curl http://localhost:8080/health

WSL 常用命令

命令作用场景说明wsl -l -v查看所有子系统状态看看哪个在运行，哪个已停止，是 WSL1 还是 WSL2wsl --shutdown强制关掉所有 WSL 实例WSL卡死、或者不用时省内存wsl -t Ubuntu只关掉指定的发行版你装了多个系统时，只关其中一个wsl --update更新 …...

2026/5/13 7:59:26 阅读更多 →

ElevenLabs Starter计划 vs 市面8款免费TTS方案：11项指标横向测评（含音色自然度、SSML支持度、商用授权条款）

更多请点击： https://intelliparadigm.com 第一章：ElevenLabs Starter计划核心定位与适用边界 ElevenLabs Starter 计划是面向开发者与内容创作者的入门级语音合成服务方案，专为轻量级、非商业或探索性项目设计。它提供每月 10,000 字符的免…...

2026/5/13 7:49:13 阅读更多 →

FPGA纯逻辑HDMI显示核心：从时序到TMDS编码的工程实践

1. 项目概述：一个开源的FPGA HDMI显示项目最近在折腾FPGA，想找个能直接跑起来的HDMI显示项目来学习，发现GitHub上有个叫“WangXuan95/FPGA-HDMI”的仓库挺火的。这个项目本质上是一个用Verilog HDL写的、从零开始实现的HDMI视频信号生成器&am…...

2026/5/13 7:43:36 阅读更多 →

OpenClaw智能模型路由：基于任务复杂度与成本约束的动态调度实践

1. 项目概述：一个聪明的AI模型调度器如果你正在使用OpenClaw，并且手头同时接入了多个不同能力、不同成本的AI模型（比如Kimi、GPT、Claude等），那么你很可能遇到过这样的困扰：一个简单的文本总结任务&#xf…...

2026/5/12 23:12:06 阅读更多 →

机器学习的数据合成（二）

原文：annas-archive.org/md5/9d5ab593b867c3a47f27572d629020aa 译者：飞龙协议：CC BY-NC-SA 4.0 第十四章：合成到真实领域自适应本章向您介绍了一个常见的问题，通常限制了合成数据的使用性，称为领域差距…...

2026/5/12 14:55:27 阅读更多 →

cann/catlass MX FP8批量矩阵乘

MXFP8BatchMatmulTla Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 功能介绍演示 Ascend 950 上的 MX FP8 矩阵乘：A、B …...

2026/5/12 17:56:15 阅读更多 →