1. 官网

https://ollama.com/

2. 安装

curl -fsSL https://ollama.com/install.sh | sh

一键安装脚本会自动完成以下操作:

  • 添加 Ollama APT 仓库
  • 安装 Ollama 二进制文件
  • 创建 ollama 系统用户
  • 注册 ollama.service 系统服务
  • 启动服务并设置开机自启

3. 环境配置

3.1 修改访问权限为所有 IP

默认 Ollama 只监听 127.0.0.1,局域网其他设备无法访问。修改为监听所有网络接口:

vim /etc/systemd/system/ollama.service

[Service] 段下添加:

Environment="OLLAMA_HOST=0.0.0.0"

重启服务:

sudo systemctl daemon-reexec
sudo systemctl restart ollama

3.2 更改模型存储位置

默认模型下载到 ~/.ollama/models/,系统盘空间不足时可迁移到数据盘:

# 创建目标目录
mkdir -p /jgsteel/ollama

# 修改目录所有者
chown -R ollama:ollama /jgsteel/ollama

# 编辑服务配置
vim /etc/systemd/system/ollama.service

[Service] 段下添加:

Environment="OLLAMA_MODELS=/jgsteel/ollama"

重启服务:

sudo systemctl daemon-reexec
sudo systemctl restart ollama

3.3 环境变量说明

环境变量 默认值 说明
OLLAMA_HOST 127.0.0.1 监听地址,设为 0.0.0.0 允许远程访问
OLLAMA_MODELS ~/.ollama/models 模型文件存储目录
OLLAMA_PORT 11434 服务端口
OLLAMA_KEEP_ALIVE 5m 模型在内存中的保持时间
OLLAMA_NUM_PARALLEL 1 并行处理请求数

4. 模型管理

拉取模型

# 拉取模型(以 qwen3:32b 为例)
ollama pull qwen3:32b

查看已安装模型

ollama list

输出示例:

NAME              ID              SIZE      MODIFIED
qwen3:32b         abc123def456    18 GB     2 minutes ago

删除模型

ollama rm qwen3:32b

运行模型

# 交互式运行
ollama run qwen3:32b

# 单次推理
ollama run qwen3:32b "请用Python写一个快速排序"

5. 查看 GPU 使用情况

watch -n 1 nvidia-smi

每 1 秒刷新一次 GPU 状态,监控显存和 GPU 利用率。


6. API 调用

Ollama 提供 OpenAI 兼容的 API,部署后可通过 HTTP 调用:

# 部署地址
http://192.168.0.134:11434

# 示例:调用 chat 接口
curl http://192.168.0.134:11434/api/chat \
  -d '{
    "model": "qwen3:32b",
    "messages": [{"role": "user", "content": "Hello"}]
  }'

7. 常用操作速查

操作 命令
安装 curl -fsSL https://ollama.com/install.sh | sh
查看服务状态 systemctl status ollama
重启服务 sudo systemctl restart ollama
拉取模型 ollama pull <model>
列出模型 ollama list
运行模型 ollama run <model>
删除模型 ollama rm <model>
查看日志 journalctl -u ollama -f
GPU 监控 watch -n 1 nvidia-smi

Professional English Terms

Term Meaning
Ollama 本地大模型运行框架,支持一键部署和运行 LLM
Model Pull 拉取模型,从远程仓库下载模型到本地
Environment Variable 环境变量,控制 Ollama 运行时行为
GPU Monitoring GPU 监控,通过 nvidia-smi 查看显存和利用率
OpenAI-compatible API OpenAI 兼容 API,可用标准 OpenAI 客户端库调用 Ollama