使用 Ollama 本地部署与运行 Llama 3.1 模型

使用 Ollama 本地部署与运行 Llama 3.1 模型 | 极客日志

curl -fsSL https://ollama.com/install.sh | sh

ollama --version

ollama run llama3.1

> what's your name?
I am Llama 3.1, a large language model trained by Meta.

> 请用 Python 写一个快速排序算法

def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quick_sort(left) + middle + quick_sort(right)

ollama list

ollama rm llama3.1

ollama serve

curl http://localhost:11434/api/generate -d '{
  "model": "llama3.1",
  "prompt": "为什么天空是蓝色的？",
  "stream": false
}'

import requests

response = requests.post('http://localhost:11434/api/generate', json={
    'model': 'llama3.1',
    'prompt': '解释量子纠缠',
    'stream': False
})
print(response.json()['response'])

ollama pull llama3.1:70b-q4_0

使用 Ollama 本地部署与运行 Llama 3.1 模型

Meta Llama 3.1 简介

环境准备

安装 Ollama

1. 下载并安装

2. 验证安装

运行 Llama 3.1 模型

1. 拉取模型

2. 交互测试

3. 查看已下载模型

4. 删除模型

本地 API 服务

1. 开启服务

2. API 调用示例

性能优化与常见问题

1. 量化版本选择

2. 内存不足处理

3. 网络延迟

总结

更多推荐文章

相关免费在线工具

使用 Ollama 本地部署与运行 Llama 3.1 模型

Meta Llama 3.1 简介

环境准备

安装 Ollama

1. 下载并安装

2. 验证安装

运行 Llama 3.1 模型

1. 拉取模型

2. 交互测试

3. 查看已下载模型

4. 删除模型

本地 API 服务

1. 开启服务

2. API 调用示例

性能优化与常见问题

1. 量化版本选择

2. 内存不足处理

3. 网络延迟

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具