Linux+AI学习路线:零基础 Linux+AI
很多刚接触 AI 的朋友都会问:Linux 对 AI 学习到底重不重要?
我的回答是——非常重要。
当前主流的深度学习框架如 PyTorch、TensorFlow 在 Linux 下的性能和兼容性最好,而且服务器环境也默认使用 Linux。
本文就从零开始,带你走完一条实用的 Linux+AI 学习路线,包括环境准备、工具安装、模型测试和常见坑点。
第一阶段:准备一个干净的 Linux 环境
不管你是用本地虚拟机、云服务器还是 WSL,建议使用 Ubuntu 22.04 LTS,稳定且社区文档多。
如果是云服务器,选择带有 Ubuntu 22.04 镜像的实例;
如果是本地,安装 WSL2 后从 Microsoft Store 下载 Ubuntu 22.04 即可。
安装完成后,先做两件事:
- 更新系统包:
sudo apt update && sudo apt upgrade -y
- 安装基本编译工具:
sudo apt install build-essential git curl wget -y
这一步确保后续安装 Python 或驱动时不会缺依赖。
第二阶段:搭建 Python 与深度学习环境
AI 开发主力语言是 Python,推荐使用 Miniconda 管理环境和包,避免污染系统 Python。
安装 Miniconda:
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
按提示确认路径并初始化 conda。
完成后重启终端或执行 source ~/.bashrc。
创建专用环境并安装 PyTorch:
conda create -n ai-env python=3.10 -y
conda activate ai-env
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 # 如无 GPU 可去掉 cu118
验证安装:
python -c "import torch; print(torch.__version__)"
如果能正常输出版本号,说明环境就绪。
第三阶段:运行第一个 AI 模型(手写数字识别)
选一个简单的项目验证整个链路。
下面用 PyTorch 加载预训练的 LeNet 模型,识别 MNIST 图片。
- 安装 Jupyter Notebook(方便交互):
pip install jupyter
jupyter notebook --ip=0.0.0.0 --port=8888 --no-browser &
按提示复制 token 到浏览器打开。
- 新建一个 Notebook,输入以下代码测试:
import torch
import torchvision
from torchvision import transforms
transform = transforms.Compose([transforms.ToTensor()])
trainset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)
model = torchvision.models.resnet18(num_classes=10)
criterion = torch.nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)
# 简单训练一个 epoch
for images, labels in trainloader:
outputs = model(images)
loss = criterion(outputs, labels)
optimizer.zero_grad()
loss.backward()
optimizer.step()
break
print("训练完成,无报错")
如果正常运行没有 ImportError,恭喜你已经跑通了第一个 AI 模型。
避坑指南:Linux+AI 常见问题
- GPU 驱动:如果使用 NVIDIA GPU,务必先安装官方驱动和 CUDA,再装 PyTorch。用
nvidia-smi查看驱动版本,确保与 PyTorch 的 CUDA 版本匹配。 - 内存不足:训练较大模型时,如果系统内存不够,可以添加交换空间:
sudo fallocate -l 4G /swapfile
sudo chmod 600 /swapfile
sudo mkswap /swapfile
sudo swapon /swapfile
- Python 版本冲突:始终使用 conda 虚拟环境,不要用
pip install直接装到系统 Python。 - Jupyter 无法访问:云服务器需在安全组放行 8888 端口,或者通过 SSH 隧道转发。
效果验证:检查你的学习路线是否走通
完成以上步骤后,你可以用下面几条命令检查你的环境是否完整:
conda info --envs # 查看环境列表
python -c "import torch; print(torch.cuda.is_available())" # GPU 是否可用
jupyter notebook list # 查看运行的 notebook
如果一切正常,说明你已具备在 Linux 下进行 AI 开发的基础能力。
后续可以继续学习数据预处理、模型调优和部署到生产环境。
如果你在搭建过程中遇到任何报错,先检查版本兼容性,再搜索具体错误信息。
这条 Linux+AI 学习路线越走越顺,坚持动手一定会有收获。