零基础学会Ollama模型管理：下载、运行与删除完整指南

知识分享

2026-06-17 16:40

7 阅读

如果你刚接触 Ollama 这个本地大模型运行工具，理解如何管理模型——包括查看已安装列表、下载新模型、切换运行版本、删除不再需要的模型——是后续有效使用的关键。
本文面向零基础用户，所有操作都在服务器终端中完成，只需要你有一台安装了 Ollama 的 Linux 服务器（或 WSL2 环境），跟着步骤走就能直接落地。

1. 开始前的准备：确认Ollama已经就绪

在管理模型之前，先确保 Ollama 服务正常运行。
如果你还没有安装，可以用下面的一行命令快速装好：

curl -fsSL https://ollama.com/install.sh | sh

安装完成后，启动服务并验证版本：

ollama serve &
ollama --version

正常情况下会显示类似 0.1.x 的版本号。
如果提示 command not found，需要把 Ollama 的安装路径（一般是 /usr/local/bin）加入 PATH，或者重新打开一个终端窗口。

避坑提醒：某些云服务器默认没有安装 curl，先执行 sudo apt install curl -y（Ubuntu/Debian）或 sudo yum install curl -y（CentOS）。

2. 查看与下载Ollama模型库中的模型

Ollama 官方模型库（ollama.com/library）提供了大量开源模型，比如 llama3、mistral、qwen、gemma 等。
管理模型的第一步是知道自己想用哪个，然后下载到本地。

2.1 列出当前已下载的模型

ollama list

输出类似：

NAME                    ID              SIZE    MODIFIED
llama3:8b               365c0bd3c000    4.7 GB  2 days ago
qwen:7b                 b5f1e6b7c0a1    4.0 GB  5 hours ago

如果列表为空，说明还没有任何模型。
随后我们下载一个。

2.2 下载（拉取）新模型

使用 ollama pull 命令，后面跟模型名称和标签（默认 latest）。
例如拉取阿里的通义千问 7B 模型：

ollama pull qwen:7b

下载过程会显示进度条，大小通常在 4~8GB 之间，取决于模型和量化版本。
网络慢的话可以先去喝杯茶。

注意：模型名中的冒号是 英文冒号，不要打成中文。标签（如 7b）表示参数规模或量化格式，常见的还有 qwen:14b、llama3:70b。首次接触建议先选小一点的（7B/8B），避免磁盘和显存不够。

3. 运行模型并切换默认版本

下载完成后，就可以直接用 ollama run 命令进入交互对话：

ollama run qwen:7b

终端会进入聊天模式，输入问题直接回车，模型就会回复。
想退出按 Ctrl+D 或输入 /bye。

3.1 在命令行中指定临时运行另一个版本

如果你本地有多个模型，运行时不加标签默认使用 latest。
如果想临时用另外一个，可以：

ollama run llama3:8b

3.2 变更默认运行版本

Ollama 本身没用“默认模型”的概念，但你可以通过别名或环境变量变通。
最常用的做法是直接删除旧标签再拉取新标签：

# 假设你想让 llama3:8b 成为默认的 llama3
ollama pull llama3:8b
ollama tag llama3:8b llama3:latest
ollama run llama3  # 现在默认跑的就是 8B 版

避坑提醒：ollama tag 不会删除原始标签，只是创建一个新的引用。如果磁盘空间紧张，建议手动删除不再需要的标签。

4. 删除不需要的模型释放空间

模型文件动辄几 GB，及时清理不用的模型很重要。

4.1 删除单个模型

ollama rm qwen:7b

4.2 删除多个模型（一次一个）

ollama rm llama3:8b qwen:7b

删除后可以通过 ollama list 确认。

避坑提醒：如果模型正在被某个会话使用，删除会失败。先用 ps 查看当前运行的模型：ollama ps，然后通过 Ctrl+C 退出会话或重启 Ollama 服务再删。

5. 常见问题与避坑说明

Q1：下载模型时卡在 0% 或速度极慢怎么办？
A：Ollama 从 GitHub Releases 和 Hugging Face 下载，国内网络不稳定。可以设置代理（如 export HTTP_PROXY=http://127.0.0.1:7890）或使用镜像源。目前官方没有国内镜像，但可以手动下载模型文件放入 ~/.ollama/models/blobs/ 路径（不推荐新手尝试）。

Q2：ollama list 显示模型但 ollama run 报错“model not found”？
A：检查模型名是否完全一致（包括标签）。例如 ollama list 显示 qwen:7b，运行就要写 ollama run qwen:7b，不要只写 qwen。

Q3：磁盘空间不足怎么办？
A：先用 du -sh ~/.ollama/models/ 查看占用，然后用 ollama rm 删除大模型。还可以通过软链接将模型目录迁移到数据盘。

Q4：如何查看模型文件的存放路径？
A：默认在 ~/.ollama/models/blobs/ 和 ~/.ollama/models/manifests/ 下。不建议手动修改，否则可能造成管理混乱。

避坑总结：

始终用 ollama list 和 ollama ps 确认当前状态。
下载大模型前先检查磁盘剩余空间：df -h。
如果在生产环境中使用，建议先在一台测试机上熟悉命令再操作正式服务器。
不要同时运行多个大模型，尤其是显存有限时，先用 ollama ps 查看已有会话。

如果你正在处理 Ollama 模型管理，建议先按本文步骤完整跑一遍，再根据自己的环境（显卡、内存、网络）调整模型版本。
遇到异常时优先回看避坑和高频问题部分，大部分错误都能在命令输出里找到线索。

本地LLM对比测评实操指南：从安装到性能对比一次讲清

LlamaCpp轻量化部署新手实战指南