Ollama 本地部署与运行大型语言模型指南

Ollama 本地部署与运行大型语言模型指南 | 极客日志

curl -fsSL https://ollama.com/install.sh | sh

systemctl status ollama

ollama -v

docker pull ollama/ollama
docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

[Service]
Environment="OLLAMA_HOST=0.0.0.0"

systemctl daemon-reload
systemctl restart ollama

[Service]
Environment="OLLAMA_MODELS=/data/ollama/models"

chown -R ollama:ollama /data/ollama/models
chmod -R 755 /data/ollama/models

Environment="CUDA_VISIBLE_DEVICES=0,1"

journalctl -u ollama -f

命令	描述
`ollama serve`	启动 Ollama 服务
`ollama create`	从 Modelfile 创建自定义模型
`ollama show`	显示模型元数据
`ollama run`	运行模型进行对话
`ollama pull`	从仓库拉取模型
`ollama push`	将模型推送到仓库
`ollama list`	列出已下载模型
`ollama rm`	删除模型

# 拉取模型
ollama pull llama3:8b

# 查看已下载模型
ollama list

# 运行模型
ollama run llama3:8b

FROM ./Llama3-FP16.gguf
PARAMETER temperature 0.7
PARAMETER top_p 0.9
SYSTEM "你是一个专业的技术助手。"

ollama create my-model -f Modelfile

ollama run my-model

curl http://localhost:11434/api/generate -d '{
  "model": "llama3",
  "prompt": "你好啊"
}'

curl http://localhost:11434/api/chat -d '{
  "model": "llama3",
  "messages": [
    { "role": "user", "content": "解释一下什么是大语言模型" }
  ]
}'

import requests

response = requests.post(
    'http://localhost:11434/api/chat',
    json={
        'model': 'llama3',
        'messages': [{'role': 'user', 'content': '你好'}],
        'stream': False
    }
)
print(response.json()['message']['content'])

curl http://localhost:11434/api/chat -d '{
  "model": "llama3",
  "messages": [{"role": "user", "content": "写一首诗"}],
  "stream": true
}'

docker run --name one-api -d --restart always -p 3001:3000 \
  -e TZ=Asia/Shanghai justsong/one-api

docker run -d -p 3000:8080 \
  -v open-webui:/app/backend/data \
  --name open-webui \
  ghcr.io/open-webui/open-webui:main

# 停止服务
systemctl stop ollama
systemctl disable ollama

# 删除二进制文件
rm $(which ollama)

# 清理服务配置
rm /etc/systemd/system/ollama.service

# 删除用户和数据
userdel ollama
groupdel ollama
rm -r /usr/share/ollama

Ollama 本地部署与运行大型语言模型指南

Ollama 概述

系统要求与前置条件

安装指南

Linux 系统安装

验证安装状态

Docker 部署

配置详解

1. 网络访问配置

2. 模型存储路径配置

3. GPU 加速配置

4. 调试日志

常用命令参考

拉取与运行模型

自定义模型开发

基于 GGUF 导入

参数调优

从 PyTorch/Safetensors 转换

REST API 集成

基础请求

聊天接口

Python 客户端示例

流式响应

生态工具集成

One-API 管理

Open WebUI 界面

Docker 部署

连接 Ollama

常见问题排查

1. 服务无法启动

2. 显存不足

3. 远程连接失败

卸载步骤

总结

更多推荐文章

相关免费在线工具

Ollama 本地部署与运行大型语言模型指南

Ollama 概述

系统要求与前置条件

安装指南

Linux 系统安装

验证安装状态

Docker 部署

配置详解

1. 网络访问配置

2. 模型存储路径配置

3. GPU 加速配置

4. 调试日志

常用命令参考

拉取与运行模型

自定义模型开发

基于 GGUF 导入

参数调优

从 PyTorch/Safetensors 转换

REST API 集成

基础请求

聊天接口

Python 客户端示例

流式响应

生态工具集成

One-API 管理

Open WebUI 界面

Docker 部署

连接 Ollama

常见问题排查

1. 服务无法启动

2. 显存不足

3. 远程连接失败

卸载步骤

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具