零基础学会Ollama模型管理:下载、运行与删除完整指南

如果你刚接触 Ollama 这个本地大模型运行工具,理解如何管理模型——包括查看已安装列表、下载新模型、切换运行版本、删除不再需要的模型——是后续有效使用的关键。
本文面向零基础用户,所有操作都在服务器终端中完成,只需要你有一台安装了 Ollama 的 Linux 服务器(或 WSL2 环境),跟着步骤走就能直接落地。

1. 开始前的准备:确认Ollama已经就绪

在管理模型之前,先确保 Ollama 服务正常运行。
如果你还没有安装,可以用下面的一行命令快速装好:

curl -fsSL https://ollama.com/install.sh | sh

安装完成后,启动服务并验证版本:

ollama serve &
ollama --version

正常情况下会显示类似 0.1.x 的版本号。
如果提示 command not found,需要把 Ollama 的安装路径(一般是 /usr/local/bin)加入 PATH,或者重新打开一个终端窗口。

避坑提醒:某些云服务器默认没有安装 curl,先执行 sudo apt install curl -y(Ubuntu/Debian)或 sudo yum install curl -y(CentOS)。

2. 查看与下载Ollama模型库中的模型

Ollama 官方模型库(ollama.com/library)提供了大量开源模型,比如 llama3、mistral、qwen、gemma 等。
管理模型的第一步是知道自己想用哪个,然后下载到本地。

2.1 列出当前已下载的模型

ollama list

输出类似:

NAME                    ID              SIZE    MODIFIED
llama3:8b               365c0bd3c000    4.7 GB  2 days ago
qwen:7b                 b5f1e6b7c0a1    4.0 GB  5 hours ago

如果列表为空,说明还没有任何模型。
随后我们下载一个。

2.2 下载(拉取)新模型

使用 ollama pull 命令,后面跟模型名称和标签(默认 latest)。
例如拉取阿里的通义千问 7B 模型:

ollama pull qwen:7b

下载过程会显示进度条,大小通常在 4~8GB 之间,取决于模型和量化版本。
网络慢的话可以先去喝杯茶。

注意:模型名中的冒号是 英文冒号,不要打成中文。标签(如 7b)表示参数规模或量化格式,常见的还有 qwen:14bllama3:70b。首次接触建议先选小一点的(7B/8B),避免磁盘和显存不够。

3. 运行模型并切换默认版本

下载完成后,就可以直接用 ollama run 命令进入交互对话:

ollama run qwen:7b

终端会进入聊天模式,输入问题直接回车,模型就会回复。
想退出按 Ctrl+D 或输入 /bye

3.1 在命令行中指定临时运行另一个版本

如果你本地有多个模型,运行时不加标签默认使用 latest
如果想临时用另外一个,可以:

ollama run llama3:8b

3.2 变更默认运行版本

Ollama 本身没用“默认模型”的概念,但你可以通过别名或环境变量变通。
最常用的做法是直接删除旧标签再拉取新标签:

# 假设你想让 llama3:8b 成为默认的 llama3
ollama pull llama3:8b
ollama tag llama3:8b llama3:latest
ollama run llama3  # 现在默认跑的就是 8B 版
避坑提醒ollama tag 不会删除原始标签,只是创建一个新的引用。如果磁盘空间紧张,建议手动删除不再需要的标签。

4. 删除不需要的模型释放空间

模型文件动辄几 GB,及时清理不用的模型很重要。

4.1 删除单个模型

ollama rm qwen:7b

4.2 删除多个模型(一次一个)

ollama rm llama3:8b qwen:7b

删除后可以通过 ollama list 确认。

避坑提醒:如果模型正在被某个会话使用,删除会失败。先用 ps 查看当前运行的模型:ollama ps,然后通过 Ctrl+C 退出会话或重启 Ollama 服务再删。

5. 常见问题与避坑说明

Q1:下载模型时卡在 0% 或速度极慢怎么办?
A:Ollama 从 GitHub Releases 和 Hugging Face 下载,国内网络不稳定。可以设置代理(如 export HTTP_PROXY=http://127.0.0.1:7890)或使用镜像源。目前官方没有国内镜像,但可以手动下载模型文件放入 ~/.ollama/models/blobs/ 路径(不推荐新手尝试)。

Q2:ollama list 显示模型但 ollama run 报错“model not found”?
A:检查模型名是否完全一致(包括标签)。例如 ollama list 显示 qwen:7b,运行就要写 ollama run qwen:7b,不要只写 qwen

Q3:磁盘空间不足怎么办?
A:先用 du -sh ~/.ollama/models/ 查看占用,然后用 ollama rm 删除大模型。还可以通过软链接将模型目录迁移到数据盘。

Q4:如何查看模型文件的存放路径?
A:默认在 ~/.ollama/models/blobs/~/.ollama/models/manifests/ 下。不建议手动修改,否则可能造成管理混乱。

避坑总结

  • 始终用 ollama listollama ps 确认当前状态。
  • 下载大模型前先检查磁盘剩余空间:df -h
  • 如果在生产环境中使用,建议先在一台测试机上熟悉命令再操作正式服务器。
  • 不要同时运行多个大模型,尤其是显存有限时,先用 ollama ps 查看已有会话。

如果你正在处理 Ollama 模型管理,建议先按本文步骤完整跑一遍,再根据自己的环境(显卡、内存、网络)调整模型版本。
遇到异常时优先回看避坑和高频问题部分,大部分错误都能在命令输出里找到线索。

分享到:
上一篇
本地LLM对比测评实操指南:从安装到性能对比一次讲清
下一篇
LlamaCpp轻量化部署新手实战指南
1
系统公告

高考专属福利来袭|凭准考证免费领香港 CN2 云服务器

值高考落幕之际,泽御云开启考生专属回馈 + 产品限时特惠双重活动,助力学子暑期学习建站 高考 考生专属福利 全体应届高考生,凭高考准考证即可免费申领【香港 CN2 轻量云服务器,4 核 4G AMD 处理器】,免费使用周期 30 天,可用于搭建个人站点、编程实操、技术实训,祝各位考生金榜题名,前程似锦! 泽御云资质齐全合规自营机房,线路覆盖香港 CN2、国内 BGP、内蒙电信、美国精品线路,售后全天候技术支持。 官方网站:www.zeyuyun.com,活动限时有效,优惠逾期不再保留。
服务中心
客服
在线客服
24小时为您服务
咨询
联系我们
联系我们,为您的业务提供专属服务。
24/7 技术支持
如果您遇到寻求进一步的帮助,请过工单与我们进行联系。
24/7 即时支持
泽御云
售前客服
泽御云
泽御云
售后客服
泽御云
技术支持
评价
您对当前页面的整体感受是否满意?
😞
非常不满意
😕
不满意
😐
一般
🙂
满意
😊
非常满意