安装 LMDeploy 的 Docker 镜像 - 高志远的个人主页

https://hub.docker.com/r/openmmlab/lmdeploy，这是docker安装LMDeploy的镜像吗

对，openmmlab/lmdeploy 就是 LMDeploy 的 Docker 镜像，可以把它理解成“用 Docker 方式运行/安装 LMDeploy 的现成环境”。Docker Hub 页面直接写了它是 openmmlab/lmdeploy 镜像，描述为 “LMDeploy is a toolkit for compressing, deploying, and serving LLM.”，并给出了 docker pull openmmlab/lmdeploy:v0.12.1-cu12.8 这样的拉取命令。(Docker Hub)

但要注意一个关键区别：

pip 安装：把 LMDeploy 装进你当前机器的 Python 环境里。
这个 Docker 镜像：把“操作系统环境 + CUDA 相关依赖 + Python + LMDeploy”一起打包好了。(Docker Hub)

所以更准确地说，它不是“另一种 LMDeploy”，而是：

LMDeploy 的容器化运行环境/发布镜像。

还有一个细节很重要：LMDeploy 官方安装文档当前仍然把 pip install lmdeploy 写成“推荐”的安装方式，并没有把 Docker 镜像写成主安装入口。文档明确写了“使用 pip 安装（推荐）”，并给出了 conda + pip 的安装命令。(LMDeploy)

这说明：

是的，这个镜像能算 Docker 安装 LMDeploy 的镜像
但 LMDeploy 官方主线文档更偏向把 pip 当作默认安装方式
Docker 镜像更偏向现成环境、部署、复现、少折腾依赖

你可以把它理解成这两条路：

pip install lmdeploy

这是“把 LMDeploy 装到你机器里”。(LMDeploy)

docker pull openmmlab/lmdeploy:v0.12.1-cu12.8

这是“把装好 LMDeploy 的环境整个拉下来”。(Docker Hub)

一句话结论：

是，这个链接就是 LMDeploy 的 Docker 镜像；只是它表达的是“容器化环境”，不是单纯一个 Python 包。

你要的话，我可以下一条直接帮你把 “用 openmmlab/lmdeploy 跑 qwen3-vl” 的命令链写出来。

———————————————问题——————————————————————–

docker pull openmmlab/lmdeploy:v0.12.1-cu12.8，用这样的命令就可以安装LMDeploy吗不需要映射端口

对，docker pull openmmlab/lmdeploy:v0.12.1-cu12.8 只能算“把 LMDeploy 镜像下载到本地”，还不算已经把 LMDeploy 安装好并运行起来。Docker 官方对 docker image pull 的定义就是：从 registry 拉取镜像到本地镜像缓存。(Docker Documentation)

所以这里要分成两步看：

文章目录 隐藏

3.2 2. 你只做离线推理，不起 HTTP 服务

4 什么时候需要映射端口

4.1 1. 你想从宿主机访问 LMDeploy 的 API 服务

4.2 2. 你想让别的机器访问这个服务

5 你可以把它记成一句话

6 对你这个 LMDeploy 场景，最实用的判断

6.1 只是“装好环境”

6.2 想“在容器里手动试试”

6.3 想“把 LMDeploy 当服务跑起来，宿主机通过 HTTP 调它”

7 最后纠正一个容易混的点

第一步：拉镜像

docker pull openmmlab/lmdeploy:v0.12.1-cu12.8

这一步的作用是：

把 openmmlab/lmdeploy:v0.12.1-cu12.8 下载到你本机
让你后面可以基于这个镜像启动容器

这一步不需要端口映射。
因为你还没有启动任何服务，也没有容器在对外监听。(Docker Documentation)

第二步：运行容器

真正“用上”这个镜像，通常还要：

docker run ...

端口映射 -p 是在 docker run 创建容器时 才需要考虑的。Docker 官方文档写得很明确：端口发布是通过 docker run -p HOST_PORT:CONTAINER_PORT 在创建容器时完成的，用来把宿主机端口转发到容器端口。(Docker Documentation)

所以：

docker pull 不需要 -p
docker run 是否需要 -p，取决于你要不要从宿主机访问容器里的服务

什么时候不需要映射端口

这些情况通常不需要：

1. 你只是进容器里操作

例如：

docker run --rm -it openmmlab/lmdeploy:v0.12.1-cu12.8 bash

你只是进入容器 shell，跑命令、看环境、调试。
这种场景一般不用映射端口。

2. 你只做离线推理，不起 HTTP 服务

比如你在容器里直接执行 Python 脚本：

加载模型
输入一张图
输出结果到终端

这种情况下，如果没有对外提供 Web/API 服务，也通常不用映射端口。

什么时候需要映射端口

这些情况通常要：

1. 你想从宿主机访问 LMDeploy 的 API 服务

比如 LMDeploy 在容器里监听 23333，你想在宿主机访问：

docker run -p 23333:23333 ...

因为容器默认是隔离的；Docker 文档明确说明，容器里的服务默认不能直接从宿主机访问，要通过发布端口来“打通”这层网络隔离。(Docker Documentation)

2. 你想让别的机器访问这个服务

那更需要明确配置端口映射，甚至还要考虑防火墙和绑定地址。Docker 也提醒，发布端口后默认会对主机所有网络接口开放，要注意安全性。(Docker Documentation)

你可以把它记成一句话

docker pull = 下载镜像，不需要映射端口。
docker run = 启动容器；只有当容器里跑的是你要从外部访问的服务时，才需要 -p。

对你这个 LMDeploy 场景，最实用的判断

只是“装好环境”

docker pull openmmlab/lmdeploy:v0.12.1-cu12.8

够了，不用映射端口。

想“在容器里手动试试”

docker run --rm -it openmmlab/lmdeploy:v0.12.1-cu12.8 bash

通常也不用映射端口。

想“把 LMDeploy 当服务跑起来，宿主机通过 HTTP 调它”

这时才需要类似：

docker run -p 主机端口:容器端口 ...

最后纠正一个容易混的点

你说“这样就可以安装 LMDeploy 吗”——更准确的说法是：

对 Docker 来说，这一步是拉取了 LMDeploy 镜像
不是“像 pip 那样把 LMDeploy 安装进宿主机系统”
它只是把一个已经打包好 LMDeploy 环境的镜像放到了你的本地 Docker 镜像仓库里

所以答案是：

可以算“把 LMDeploy 的 Docker 镜像准备好了”，但还不算真正把服务跑起来。
而且 docker pull 这一步不需要端口映射。

我可以接着给你写一版：从 docker pull openmmlab/lmdeploy... 到实际启动 qwen3-vl 服务 的最小命令链。

———————————————问题——————————————————————–

所以我从哪看到完整的run代码我哪知道一个容器需要映射什么端口

看这 3 个地方，基本就够了。

第一，看项目文档里的启动命令。

文档:

文档：lmdeploy/docs/zh_cn/llm/api_server.md at main · InternLM/lmdeploy
对 LMDeploy，最直接的来源不是 Docker Hub 首页，而是 LMDeploy 自己的文档。它明确给了 Docker 启动示例：

docker run --runtime nvidia --gpus all \
  -v ~/.cache/huggingface:/root/.cache/huggingface \
  --env "HUGGING_FACE_HUB_TOKEN=<secret>" \
  -p 23333:23333 \
  --ipc=host \
  openmmlab/lmdeploy:latest \
  lmdeploy serve api_server internlm/internlm2_5-7b-chat

这里已经把“完整 run 命令”和“端口该怎么映射”写出来了：-p 23333:23333。LMDeploy 文档同时说明，lmdeploy serve api_server ... 默认会在本机 23333 端口启动 OpenAI 兼容服务，端口也可以用 --server-port 改。(GitHub)

第二，看应用本身监听哪个端口。
判断一个容器要不要映射端口，不是看“它是不是容器”，而是看“容器里启动的程序是否提供网络服务，以及监听哪个端口”。
在 LMDeploy 这里，文档已经直接说了：api_server 默认监听 23333，所以你要从宿主机访问它，就映射 23333:23333；如果你把服务端口改成别的，比如 --server-port 3000，那通常就映射成 -p 3000:3000。(LMDeploy)

第三，看 Docker 的规则：EXPOSE 不等于自动可访问。
Docker 文档明确说，镜像里的 EXPOSE 只是声明应用会用哪些端口，不会自动发布到宿主机。真正让宿主机能访问，要在 docker run 时用 -p；或者测试时用 -P 自动把所有 exposed ports 映射到随机宿主机端口。(Docker Documentation)

你可以把判断流程记成一句话：

先看项目文档的启动命令，再看服务默认监听端口，最后在 docker run 里用 -p 宿主机端口:容器端口 发布出来。

拿你这个 LMDeploy 来说，最实用的结论就是：

你只是 docker pull：不需要端口映射
你只是进容器里跑 shell：通常不需要端口映射
你要启动 lmdeploy serve api_server ... 并从宿主机访问：需要映射端口
默认端口就是 23333，因为 LMDeploy 文档就是这么定义的。(GitHub)

还有两个很好用的“事后确认”方法：

docker ps
docker port <容器名或容器ID>
docker inspect <容器名或容器ID>

Docker 官方文档里，docker port 可以直接查看某个容器当前已经发布了哪些端口；docker inspect 可以看更详细的容器信息。(Docker Documentation)

所以你不知道该映射什么端口时，优先级是：

项目文档 > 启动命令里的默认端口 > Dockerfile/EXPOSE > 启动后用 docker port / docker inspect 验证。

对你这个场景，最短可抄的思路是：

docker pull openmmlab/lmdeploy:v0.12.1-cu12.8

docker run --runtime nvidia --gpus all \
  -v ~/.cache/huggingface:/root/.cache/huggingface \
  -p 23333:23333 \
  --ipc=host \
  openmmlab/lmdeploy:v0.12.1-cu12.8 \
  lmdeploy serve api_server <你的模型名>

其中 <你的模型名> 换成你实际要跑的模型；如果是 Qwen-VL 系列，还要额外看 LMDeploy 对该模型的专门文档，因为部分 VLM 需要额外依赖。LMDeploy 的 Qwen2/2.5-VL 文档就明确提醒了要安装额外包，例如 qwen_vl_utils 或更高版本的 transformers。(GitHub)

你要的话，我下一条可以直接用 Qwen3-VL + openmmlab/lmdeploy 给你拼一条尽量完整的 docker run 命令。

作者：高志远

高志远，24岁，男生查看高志远的所有文章