九章智算云

Docker 基本使用与镜像源配置(2026)

拉镜像动辄超时、Docker Hub 限速、公共加速器一个个停摆——这是我们 2026 年在客户现场用的实际配置。

为什么这篇还要写

2024 年下半年起,国内大量公共 Docker 加速器(中科大、网易、上海交大、南京大学)陆续关闭或降速;Docker Hub 自身对未登录用户做了 100 pull/6h 的限制。结果就是客户拿到一台新 GPU 节点,第一条 docker pull pytorch/pytorch 就直接卡住。这里给一份 2026 年仍可用的方案。

一、Docker 命令速查

AI 工程师 90% 时间用得到的就以下几条:

docker pull <image>:<tag>            # 拉镜像
docker run --gpus all -it --rm <img> # 一次性运行
docker run -d --name web -p 80:80 <img>  # 后台跑+端口映射
docker exec -it <name> bash          # 进容器
docker logs -f <name>                # 看日志
docker cp file <name>:/path          # 拷文件
docker save -o m.tar <img>           # 离线导出
docker load -i m.tar                 # 离线导入
docker image prune -a                # 清旧镜像

GPU 容器额外要装 nvidia-container-toolkit,并且 --gpus all--gpus '"device=0,1"'

二、2026 年还能用的镜像源

地址说明
阿里云个人加速器https://<your-id>.mirror.aliyuncs.com注册阿里云后控制台拿专属地址,最稳定
DaoCloudhttps://docker.m.daocloud.io公共,速度中等,偶尔限速
腾讯云(仅腾讯云内网)https://mirror.ccs.tencentyun.com公网不可达
1Panel 社区镜像https://docker.1panel.live公共可用
九章智算云内网registry.alayanew.com(节点内网解析)CCI/CCS 节点默认接入

中科大、网易、Azure CN、上海交大的旧地址 2024–2025 已陆续停服,老博客上的清单大多过期,不要直接 copy。

三、配置 daemon.json

Linux 主机:

sudo mkdir -p /etc/docker
sudo tee /etc/docker/daemon.json <<'EOF'
{
  "registry-mirrors": [
    "https://<your-id>.mirror.aliyuncs.com",
    "https://docker.m.daocloud.io",
    "https://docker.1panel.live"
  ],
  "max-concurrent-downloads": 10,
  "log-driver": "json-file",
  "log-opts": { "max-size": "100m", "max-file": "3" }
}
EOF
sudo systemctl restart docker
docker info | grep -A3 "Registry Mirrors"

Mac/Windows Docker Desktop 在 Settings → Docker Engine 里改同样的 JSON。

四、绕开 gcr.io / ghcr.io / quay.io

很多 AI 镜像在 gcr.io/...nvcr.io/...,加速器只代理 Docker Hub。两种办法:

# 1) DaoCloud 反代(全协议)
docker pull docker.m.daocloud.io/gcr.io/google-containers/pause:3.9

# 2) 用脚本拉到本地再 tag
docker pull docker.m.daocloud.io/nvcr.io/nvidia/pytorch:24.10-py3
docker tag  docker.m.daocloud.io/nvcr.io/nvidia/pytorch:24.10-py3 \
            nvcr.io/nvidia/pytorch:24.10-py3

五、Buildx 多架构 & 离线分发

ARM 芯片越来越多(Grace、Ampere Altra),构建时一行 --platform linux/amd64,linux/arm64

docker buildx create --name multi --use
docker buildx build --platform linux/amd64,linux/arm64 \
  -t myrepo/app:1.0 --push .

机房无外网时,本机 docker save 后 scp 到节点 docker load,比从私服拉还快。

六、在九章智算云上的实践

CCI/CCS 节点内网默认接 registry.alayanew.com,对常用 base image(pytorch、cuda、vllm、llama-factory、megatron)做了缓存——这些在节点内拉峰值能到 1.2 GB/s。自定义镜像建议先 push 到客户私有 harbor,再在节点上拉,避免反复跨公网。

最后更新于

这篇文档对你有帮助吗?

目录