零基础学会Ollama模型管理:下载、运行与删除完整指南
如果你刚接触 Ollama 这个本地大模型运行工具,理解如何管理模型——包括查看已安装列表、下载新模型、切换运行版本、删除不再需要的模型——是后续有效使用的关键。
本文面向零基础用户,所有操作都在服务器终端中完成,只需要你有一台安装了 Ollama 的 Linux 服务器(或 WSL2 环境),跟着步骤走就能直接落地。
1. 开始前的准备:确认Ollama已经就绪
在管理模型之前,先确保 Ollama 服务正常运行。
如果你还没有安装,可以用下面的一行命令快速装好:
curl -fsSL https://ollama.com/install.sh | sh
安装完成后,启动服务并验证版本:
ollama serve &
ollama --version
正常情况下会显示类似 0.1.x 的版本号。
如果提示 command not found,需要把 Ollama 的安装路径(一般是 /usr/local/bin)加入 PATH,或者重新打开一个终端窗口。
避坑提醒:某些云服务器默认没有安装curl,先执行sudo apt install curl -y(Ubuntu/Debian)或sudo yum install curl -y(CentOS)。
2. 查看与下载Ollama模型库中的模型
Ollama 官方模型库(ollama.com/library)提供了大量开源模型,比如 llama3、mistral、qwen、gemma 等。
管理模型的第一步是知道自己想用哪个,然后下载到本地。
2.1 列出当前已下载的模型
ollama list
输出类似:
NAME ID SIZE MODIFIED
llama3:8b 365c0bd3c000 4.7 GB 2 days ago
qwen:7b b5f1e6b7c0a1 4.0 GB 5 hours ago
如果列表为空,说明还没有任何模型。
随后我们下载一个。
2.2 下载(拉取)新模型
使用 ollama pull 命令,后面跟模型名称和标签(默认 latest)。
例如拉取阿里的通义千问 7B 模型:
ollama pull qwen:7b
下载过程会显示进度条,大小通常在 4~8GB 之间,取决于模型和量化版本。
网络慢的话可以先去喝杯茶。
注意:模型名中的冒号是英文冒号,不要打成中文。标签(如7b)表示参数规模或量化格式,常见的还有qwen:14b、llama3:70b。首次接触建议先选小一点的(7B/8B),避免磁盘和显存不够。
3. 运行模型并切换默认版本
下载完成后,就可以直接用 ollama run 命令进入交互对话:
ollama run qwen:7b
终端会进入聊天模式,输入问题直接回车,模型就会回复。
想退出按 Ctrl+D 或输入 /bye。
3.1 在命令行中指定临时运行另一个版本
如果你本地有多个模型,运行时不加标签默认使用 latest。
如果想临时用另外一个,可以:
ollama run llama3:8b
3.2 变更默认运行版本
Ollama 本身没用“默认模型”的概念,但你可以通过别名或环境变量变通。
最常用的做法是直接删除旧标签再拉取新标签:
# 假设你想让 llama3:8b 成为默认的 llama3
ollama pull llama3:8b
ollama tag llama3:8b llama3:latest
ollama run llama3 # 现在默认跑的就是 8B 版
避坑提醒:ollama tag 不会删除原始标签,只是创建一个新的引用。如果磁盘空间紧张,建议手动删除不再需要的标签。
4. 删除不需要的模型释放空间
模型文件动辄几 GB,及时清理不用的模型很重要。
4.1 删除单个模型
ollama rm qwen:7b
4.2 删除多个模型(一次一个)
ollama rm llama3:8b qwen:7b
删除后可以通过 ollama list 确认。
避坑提醒:如果模型正在被某个会话使用,删除会失败。先用ps查看当前运行的模型:ollama ps,然后通过Ctrl+C退出会话或重启 Ollama 服务再删。
5. 常见问题与避坑说明
Q1:下载模型时卡在 0% 或速度极慢怎么办?
A:Ollama 从 GitHub Releases 和 Hugging Face 下载,国内网络不稳定。可以设置代理(如 export HTTP_PROXY=http://127.0.0.1:7890)或使用镜像源。目前官方没有国内镜像,但可以手动下载模型文件放入 ~/.ollama/models/blobs/ 路径(不推荐新手尝试)。
Q2:ollama list 显示模型但 ollama run 报错“model not found”?
A:检查模型名是否完全一致(包括标签)。例如 ollama list 显示 qwen:7b,运行就要写 ollama run qwen:7b,不要只写 qwen。
Q3:磁盘空间不足怎么办?
A:先用 du -sh ~/.ollama/models/ 查看占用,然后用 ollama rm 删除大模型。还可以通过软链接将模型目录迁移到数据盘。
Q4:如何查看模型文件的存放路径?
A:默认在 ~/.ollama/models/blobs/ 和 ~/.ollama/models/manifests/ 下。不建议手动修改,否则可能造成管理混乱。
避坑总结:
- 始终用
ollama list和ollama ps确认当前状态。 - 下载大模型前先检查磁盘剩余空间:
df -h。 - 如果在生产环境中使用,建议先在一台测试机上熟悉命令再操作正式服务器。
- 不要同时运行多个大模型,尤其是显存有限时,先用
ollama ps查看已有会话。
如果你正在处理 Ollama 模型管理,建议先按本文步骤完整跑一遍,再根据自己的环境(显卡、内存、网络)调整模型版本。
遇到异常时优先回看避坑和高频问题部分,大部分错误都能在命令输出里找到线索。