Qwen1.5-1.8B GPTQ模型服务化:内网穿透实现公网访问
Qwen1.5-1.8B GPTQ模型服务化内网穿透实现公网访问当你费了九牛二虎之力终于在本地或者内网的服务器上把Qwen1.5-1.8B GPTQ模型跑起来搭建了一个漂亮的API服务是不是特别想马上分享给同事或者客户看看效果但问题来了你的服务藏在公司内网或者家里的路由器后面别人根本访问不到。这时候你就需要一个“任意门”把你的本地服务临时暴露到公网上。这个“任意门”的技术就是我们今天要聊的内网穿透。这篇教程就是手把手教你怎么给部署好的Qwen模型服务开一扇临时的“公网窗户”。整个过程不复杂跟着步骤走半小时内就能搞定让你快速实现从“本地自嗨”到“公网演示”的飞跃。1. 准备工作明确目标和工具选择在开始动手之前我们先搞清楚两件事我们要做什么以及用什么工具来做。我们要做什么假设你已经用类似FastAPI、Flask或者vLLM这样的框架在http://localhost:8000或http://192.168.1.100:7860这样的本地地址上成功启动了Qwen1.5-1.8B GPTQ模型的服务。这个服务现在只有你自己能访问。我们的目标就是生成一个公网地址比如https://your-subdomain.ngrok.io任何人通过这个地址都能访问到你本地的模型服务。用什么工具内网穿透工具有很多为了快速上手我们主要介绍两类云端托管型推荐新手以ngrok为代表。它提供云端服务你只需要在本地运行一个客户端配置简单几分钟就能获得一个公网地址。缺点是免费版有连接时长、域名随机等限制适合临时演示。自建服务器型以frp (Fast Reverse Proxy)为代表。你需要自己有一台具有公网IP的服务器比如云服务器作为中转。配置稍复杂但完全自主可控性能好适合需要较长时间或更稳定穿透的场景。考虑到这篇教程的初衷是“快速、临时地提供公网演示”我们会以ngrok作为主要示例因为它最省心。同时我们也会简要提一下frp的思路供有自建条件的朋友参考。你需要准备一台已经部署并运行了Qwen模型API服务的本地机器Windows, macOS, Linux均可。一个可用的网络连接。对于ngrok需要一个邮箱来注册免费账户。2. 使用ngrok快速暴露本地服务ngrok是目前最流行的内网穿透工具之一我们先来看看怎么用它。2.1 注册与安装ngrok首先访问 ngrok 的官网注册一个免费账户。注册成功后在后台的“Getting Started”部分你会找到你的Authtoken一串长长的密钥把它复制下来。接下来根据你的操作系统下载并安装ngrok客户端。以Linux/macOS为例通常解压后就是一个可执行文件。Windows用户可以直接下载exe文件。打开你的终端或命令提示符运行以下命令来设置你的Authtoken./ngrok authtoken 你的Authtoken这行命令会将你的令牌保存到本地配置文件中之后运行就不需要每次都输入了。2.2 穿透你的模型API服务假设你的Qwen模型服务正运行在本地http://localhost:8000。在终端中运行以下命令./ngrok http 8000稍等片刻ngrok就会启动。你会在终端看到类似下面的输出ngrok (CtrlC to quit)