Ollama 本地 CPU 部署开源大模型实战

Ollama 本地 CPU 部署开源大模型实战 | 极客日志

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

ollama --version

命令	描述
`ollama run <model>`	运行指定模型，若未下载则自动拉取
`ollama pull <model>`	从仓库拉取模型到本地
`ollama list`	查看已下载的模型列表
`ollama rm <model>`	删除指定的模型
`ollama serve`	启动服务进程（通常安装后自动后台运行）
`ollama help`	查看所有可用命令及参数

# 下载并运行 Qwen2 模型
ollama run qwen2

# 下载 Llama3 模型
ollama pull llama3

# 查看本地模型
ollama list

ollama run qwen2
> 你好，请介绍一下你自己。
> 我是一个人工智能助手...

pip install ollama

import ollama

response = ollama.chat(
    model='qwen2',
    messages=[{
        'role': 'user',
        'content': '请赏析这段文字：我已经不是那个当年的穷小子了，我是今年的那个穷小子。'
    }]
)

print(response['message']['content'])

from openai import OpenAI

client = OpenAI(
    base_url='http://localhost:11434/v1/',
    api_key='ollama'  # 本地部署无需真实 Key
)

completion = client.chat.completions.create(
    model='qwen2',
    messages=[{
        'role': 'user',
        'content': '爱一个人的眼神是藏不住的，爱两个人就一定要藏住。'
    }],
    stream=True
)

for chunk in completion:
    if chunk.choices[0].delta.content:
        print(chunk.choices[0].delta.content, end='', flush=True)

try:
    response = ollama.chat(model='qwen2', messages=[...])
except Exception as e:
    print(f"请求失败：{e}")

import sys
from IPython.core.magic import magics_class, line_cell_magic
from IPython.display import display, clear_output
from openai import OpenAI

class Ollama:
    def __init__(self, model='qwen2', max_chat_rounds=20, stream=True):
        self.model = model
        self.history = []
        self.max_chat_rounds = max_chat_rounds
        self.stream = stream
        self.register_magic()

    def build_messages(self, query=None, history=None, system=None):
        messages = []
        if system:
            messages.append({'role': 'system', 'content': system})
        for prompt, response in (history or []):
            messages.extend([{'role': 'user', 'content': prompt}, 
                            {'role': 'assistant', 'content': response}])
        if query:
            messages.append({'role': 'user', 'content': query})
        return messages

    def chat(self, messages, stream=True):
        client = OpenAI(base_url='http://localhost:11434/v1/', api_key='ollama')
        return client.chat.completions.create(messages=messages, model=self.model, stream=stream)

    def __call__(self, query):
        if len(self.history) >= self.max_chat_rounds + 1:
            self.history = self.history[-self.max_chat_rounds:]
        messages = self.build_messages(query=query, history=self.history)
        
        if not self.stream:
            completion = self.chat(messages, stream=False)
            response = completion.choices[0].message.content
            self.history.append((query, response))
            return response

        completion = self.chat(messages, stream=True)
        response = ""
        for chunk in completion:
            content = chunk.choices[0].delta.content
            if content:
                response += content
                clear_output(wait=True)
                print(response)
        self.history.append((query, response))
        return response

    def register_magic(self):
        from IPython.core.magic import Magics, magics_class, line_cell_magic
        @magics_class
        class ChatMagics(Magics):
            def __init__(self, shell, pipe):
                super().__init__(shell)
                self.pipe = pipe
            @line_cell_magic
            def chat(self, line, cell=None):
                if cell is None:
                    return self.pipe(line)
                else:
                    return self.pipe(cell)
        ipython = get_ipython()
        magic = ChatMagics(ipython, self)
        ipython.register_magics(magic)

%chat 你好，我们来聊聊编程。

Ollama 本地 CPU 部署开源大模型实战

Ollama 本地 CPU 部署开源大模型实战

一、安装与配置

1. 系统支持

2. Docker 部署（可选）

3. 验证安装

二、基础命令操作

三、命令行交互体验

四、Python 接口交互

1. 使用官方 ollama-python 库

2. 使用 OpenAI 兼容接口

五、Jupyter Notebook 魔法命令集成

1. 自定义 Magic Class

2. 使用方式

六、进阶优化与注意事项

1. 性能调优

2. 安全性

3. 常见问题排查

七、总结

更多推荐文章

相关免费在线工具

Ollama 本地 CPU 部署开源大模型实战

Ollama 本地 CPU 部署开源大模型实战

一、安装与配置

1. 系统支持

2. Docker 部署（可选）

3. 验证安装

二、基础命令操作

三、命令行交互体验

四、Python 接口交互

1. 使用官方 ollama-python 库

2. 使用 OpenAI 兼容接口

五、Jupyter Notebook 魔法命令集成

1. 自定义 Magic Class

2. 使用方式

六、进阶优化与注意事项

1. 性能调优

2. 安全性

3. 常见问题排查

七、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具