本地运行 Llama3 极简教程

本地运行 Llama3 极简教程 | 极客日志

Model	Parameters	Size
Llama 3	8B	4.7GB
Llama 3	70B	40GB
Mistral	7B	4.1GB
Dolphin Phi	2.7B	1.6GB
Phi-2	2.7B	1.7GB
Neural Chat	7B	4.1GB
Starling	7B	4.1GB
Code Llama	7B	3.8GB
Llama 2 Uncensored	7B	3.8GB
Llama 2 13B	13B	7.3GB
Llama 2 70B	70B	39GB
Orca Mini	3B	1.9GB
LLaVA	7B	4.5GB
Gemma	2B	1.4GB
Gemma	7B	4.8GB
Solar	10.7B	6.1GB

curl -fsSL https://ollama.com/install.sh | sh

ollama run llama3

User: Hello, how are you?
Assistant: I am an AI assistant created by Meta. I can help you with various tasks...

docker pull ghcr.io/ollama-webui/ollama-webui:main

docker run -d --network=host -v open-webui:/app/backend/data -e OLLAMA_BASE_URL=http://127.0.0.1:11434 --name open-webui --restart always ghcr.io/open-webui/open-webui:main

pip install litellm

from litellm import completion

response = completion(
    model="ollama/llama3",
    messages=[{ "content": "respond in 20 words. who are you?", "role": "user"}],
    api_base="http://localhost:11434"
)

print(response.choices[0].message.content)

from langchain_community.llms import Ollama

llm = Ollama(model="llama3")
result = llm.invoke("Why is the sky blue?")
print(result)

from llama_index.llms.ollama import Ollama

llm = Ollama(model="llama3")
response = llm.complete("Why is the sky blue?")
print(response.text)

ollama run llama3:8b

本地运行 Llama3 极简教程

本地运行 Llama3 极简教程

支持的模型列表

安装 Ollama

macOS 和 Linux

Windows

在 WSL 中安装 CUDA 加速

运行 Llama3

使用 Web UI 界面

1. 拉取 Docker 镜像

2. 启动容器

3. 访问与配置

与 Python 结合使用

LiteLLM 集成

LangChain 集成

LlamaIndex 集成

常见问题与故障排除

1. 模型下载失败

2. 显存不足

3. 网络不通

总结

更多推荐文章

相关免费在线工具

本地运行 Llama3 极简教程

本地运行 Llama3 极简教程

支持的模型列表

安装 Ollama

macOS 和 Linux

Windows

在 WSL 中安装 CUDA 加速

运行 Llama3

使用 Web UI 界面

1. 拉取 Docker 镜像

2. 启动容器

3. 访问与配置

与 Python 结合使用

LiteLLM 集成

LangChain 集成

LlamaIndex 集成

常见问题与故障排除

1. 模型下载失败

2. 显存不足

3. 网络不通

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具