OpenAI 开源模型 gpt-oss 本地部署详细教程

Ne0inhk

22 Mar 2026 — 10 min read

OpenAI 最近发布了其首个开源的开放权重模型gpt-oss，这在AI圈引起了巨大的轰动。对于广大开发者和AI爱好者来说，这意味着我们终于可以在自己的机器上，完全本地化地运行和探索这款强大的模型了。

本教程将一步一步指导你如何在Windows和Linux系统上，借助极其便捷的本地大模型运行框架Ollama，轻松部署和使用 gpt-oss 模型。

一、准备工作：系统配置与性能预期

在开始之前，了解运行环境非常重要。本次部署将在我的个人电脑上进行，下面是推荐配置：

CPU: 现代多核 CPU，如 Intel Core i7 或 AMD Ryzen 7 系列
内存 (RAM): 32 GB 或更多
显卡 (GPU): 强烈推荐 NVIDIA GeForce RTX 4090 (24 GB 显存)。这是确保大型模型流畅运行与高效微调的理想选择。
操作系统: Linux 或 Windows 11
Python 版本: 推荐 3.12

性能预期：
在我自己电脑的配置下，运行 gpt-oss-20b 这样中等规模的模型，响应速度会比较慢，生成一段较长文本可能需要几十秒甚至更久。但这完全可用于功能测试、学习和轻度使用。如果你的显卡性能更强(如RTX 5090, 4090)，体验会流畅很多。当然我自己电脑的性能要差点

二、了解 gpt-oss 模型

gpt-oss 是 OpenAI 发布的开放权重语言模型，截止到2025年8月8日，提供了 gpt-oss-120b 和 gpt-oss-20b 两个版本。它旨在支持开发者在各种硬件上进行研究和创新。

官方 GitHub 仓库: https://github.com/openai/gpt-oss

三、安装 Ollama：本地部署的神器

Ollama 是一个开源框架，它极大地简化了在本地运行Llama, Mistral, Gemma 以及现在 gpt-oss等大模型的过程。

1. 访问 Ollama 官网并下载

打开浏览器，访问 Ollama 官网。你会看到一个简洁的界面，邀请你与开源模型一起对话和构建。

点击 “Download” 按钮后，页面会自动跳转到下载选择页面。

2. 选择操作系统

Ollama 支持 macOS, Linux 和 Windows。我们选择 Windows。

3. 安装 Ollama

下载完成后，运行安装程序。安装过程非常简单，基本就是一路“下一步”。

安装完成后，Ollama 会在你的系统托盘中以后台服务的形式运行。

四、拉取并运行 gpt-oss 模型

Ollama 的命令行操作与 Docker非常相似，主要使用 pull 和 run 命令。

1. 打开终端

打开你的Windows PowerShell或命令提示符 (CMD)。

2. 拉取 (Pull) 模型

gpt-oss 有多个版本，我们这里以对硬件要求稍低的 20b 版本为例。执行以下命令：

ollama pull gpt-oss:20b

这个过程会下载模型文件，根据你的网络速度，可能需要一些时间。

3. 运行 (Run) 模型

下载完成后，运行模型进行交互：

ollama run gpt-oss:20b

五、与 gpt-oss 模型交互

1. 基础对话

运行 ollama run 命令后，你就可以直接在终端中输入问题并与模型对话了。我们来问一个经典问题：“你是谁？”

注意：模型的回答中提到了 “ChatGPT”，这可能是因为 gpt-oss 的训练数据或基础架构与ChatGPT有很深的渊源。

2.使用 Ollama 桌面应用 GUI

除了命令行，Ollama 也提供了一个简洁的桌面应用

安装Ollama后，它通常会自动启动。
你可以在主界面的下拉菜单中，选择你已经 pull 下来的模型 (如 gpt-oss:20b)，然后直接开始对话。

3.创建你的 Ollama Hub 个人资料

4. 代码生成
gpt-oss 的代码能力还可以。我们可以让它尝试写一个pygame游戏。

3.联网搜索功能
一个令人惊喜的功能是，gpt-oss 在 Ollama 中可以联网！但这需要你先在 Ollama Hub 上创建并登录你的账户。

登录后，当你提出一个需要实时信息的问题时，模型会自动触发搜索功能。

六、在 Ubuntu上部署及使用 Web 客户端

对于Linux用户，特别是作为服务器使用时，命令行是基础，但搭建一个功能强大的Web界面能提供更好的体验。

1. 在 Ubuntu 上安装 Ollama

在Ubuntu上安装Ollama极其简单，官方提供了一键安装脚本。打开你的终端，执行以下命令：

curl-fsSL https://ollama.com/install.sh |sh

脚本会自动下载Ollama二进制文件，并将其设置为一个 systemd后台服务。安装完成后，Ollama服务会自动启动。你可以通过 systemctl status ollama验证其运行状态。

2. 拉取并运行模型 (命令行)

与Windows完全相同，在Ubuntu终端中执行：

ollama pull gpt-oss:20b ollama run gpt-oss:20b

3. 搭建Web客户端：Open WebUI

Open WebUI 是一个非常流行的、与Ollama完美兼容的开源Web客户端。

a. 安装 Docker
Open WebUI最简单的部署方式是使用Docker。如果你的系统尚未安装Docker，请执行：

apt-get update apt-getinstall-y docker.io # 启动并设置开机自启 systemctl start docker systemctl enabledocker

b. 运行 Open WebUI 容器
执行以下命令来下载并运行Open WebUI 容器：

docker run -d--network=host -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

命令解析：

-d:后台运行容器。
--network=host:让容器共享主机的网络，这样WebUI可以轻松访问在本机 11434 端口运行的Ollama服务。
-v open-webui:/app/backend/data:挂载一个数据卷，用于持久化WebUI的用户数据和配置。
--name open-webui: 给容器命名。
--restart always: 确保Docker服务重启时，该容器也会自动启动。

c. 访问并使用 Open WebUI

在你的浏览器中，访问 http://<你的Ubuntu服务器IP>:8080 (Open WebUI 默认使用8080端口)。
首次访问时，你需要注册一个管理员账户。
登录后，你就可以在界面上选择已经拉取到本地的 gpt-oss:20b 模型，并开始对话了！

总结

通过本教程，我们成功地在一台普通的Windows电脑上，使用Ollama轻松部署了OpenAI的gpt-oss模型。同时，我们也学习了如何在Ubuntu环境下完成同样的部署，并额外搭建了一个功能强大的 Open WebUI 客户端。我们体验了它的基础对话、代码生成乃至联网搜索等强大功能。虽然在中端硬件上性能有限，但这无疑为广大AI爱好者和开发者打开了一扇探索前沿大模型的大门。

Q&A 问答环节

1. 问：为什么模型在我电脑上运行这么慢？
答：模型运行速度主要取决于GPU性能和显存。gpt-oss-20b 是一个有200亿参数的模型，对资源要求较高。在RTX 3050这样的入门级/中端显卡上，推理速度自然会比较慢。Ollama会自动利用你的GPU，但如果显存不足，部分模型层会加载到CPU和内存中，进一步拖慢速度。

2. 问：除了gpt-oss，我还能用Ollama运行哪些模型？
答：非常多！Ollama支持目前几乎所有主流的开源模型，例如 Google 的Gemma，Meta 的Llama 3，Mistral AI 的Mistral等。你可以在Ollama官网的 “Models” 页面查看完整的模型库。

3. 问：联网搜索功能是如何实现的？需要额外配置吗？
答：这是 gpt-oss 模型本身在Ollama框架下集成的功能，可能利用了类似工具调用 (Tool Calling)或函数调用 (Function Calling)的机制。当你提出需要外部信息的问题时，模型会自动调用一个内置的搜索工具。除了登录Ollama Hub账户外，通常不需要你进行额外配置。

4. 问：如果我没有NVIDIA显卡，还能运行吗？
答：可以。Ollama支持纯CPU运行。它会自动检测你是否有兼容的GPU，如果没有，它会完全使用你的CPU和系统内存来运行模型。当然，纯CPU运行的速度会比GPU慢得多。

5. 问：我可以微调或定制 gpt-oss 模型吗？
答：可以。这正是开放权重模型的魅力所在。你可以使用自己的数据集对模型进行微调 (fine-tuning)。在Ollama中，你还可以通过编写 Modelfile来定制模型的系统提示词 (System Prompt)、参数等，然后构建一个属于你自己的新模型版本。

6. 问：如何查看我的 Open WebUI 容器的日志 (Ubuntu)？
答：如果Open WebUI无法启动或出现问题，你可以使用Docker命令查看其日志来排查错误。在终端中执行：

docker logs open-webui

如果你想实时跟踪日志，可以加上 -f 选项：docker logs -f open-webui。

日期：2025年8月8日
专栏：开源模型

【毕业论文没思路？paperxm智能写作一键解决！】

毕业论文写作困境的常见原因缺乏明确的研究方向或选题，导致难以展开论文框架。文献综述不足，无法有效支撑论点，造成写作停滞。时间管理不当，临近截止日期时压力倍增。对学术写作规范不熟悉，格式和逻辑容易出错。 paperxm的链接我就给大家放着了哈：www.paperxm.com Paperxm智能写作工具的核心功能基于自然语言处理技术，自动生成论文大纲和初稿，提供选题建议。内置文献检索模块，快速匹配相关学术资源，辅助文献综述。支持多语言写作，满足不同学科领域的表达需求。实时语法检查和格式修正，确保论文符合学术规范。如何使用Paperxm 它从开题报告、文献综述、论文写作还有仿写、到最后的答辩PPT都能帮我直接解决！优势一：节省时间使用paperxm写论文，可以让我告别繁琐的资料搜集和整理工作。paperxm能迅速从海量资料中筛选出有用的信息，为我的论文提供有力支持。这样一来，你就有更多的时间去思考、创新，提高论文质量。优势二：提高写作质量 paperxm具有强大的语言处理能力，可以帮助我优化句子结构、纠正语法错误，甚至提供写作建议。这意味着，我的论文在pape

2026最火的6款免费AI写作软件测评：ai写网文哪个好用？这款ai消痕工具

很多朋友想在业余时间写写番茄、起点网文或者搞搞短剧赚点外快，但总是卡在“憋不出字”或者“大纲写崩”上。现在都2026年了，用ai写作软件来辅助写小说早就不是秘密了。但是，网文平台的审核越来越严，很多新手直接用AI生成的文章发出去，立马就被平台判定为“AI生成”导致限流，不仅没流量，连全勤奖都拿不到。今天，我们就抛开那些晦涩难懂的技术术语，用大白话给大家实测目前市面上热度最高的6款免费ai写作平台。到底ai写网文哪家强？怎么解决让人头疼的“机器味”？这篇超详细的避坑指南，建议想靠文字搞钱的朋友直接收藏！一、 6大热门免费AI小说工具优缺点大盘点我们选了大家最常搜的几款工具，直接看它们在实际写小说、写剧本时的真实表现。 1. 豆包：起名和找灵感的“点子王” * 优点：速度飞快，完全免费。你如果卡文了，或者不知道主角叫什么、书名怎么起才能吸引人，直接问豆包，它能一秒钟给你吐出几十个极其符合抖音、小红书调性的网感标题和名字。 * 缺点：千万别让它直接给你写正文！它的AI味太重了，动不动就是“嘴角勾起一抹弧度”、“倒吸一口凉气”。把这种文发到小说平台，

GitHub Copilot 教程

文章来源：https://vscode.it-docs.cn/docs/copilot/overview.html GitHub Copilot 为 Visual Studio Code 增加了多代理开发功能。规划好你的方法，然后让AI代理在项目中实现并验证代码变更。并行运行多个代理会话：本地、后台或云端。从一个中心视角管理所有角色。内联建议、内联聊天和智能行为会帮助你完成整个编码流程。代理与代理会话代理端到端地处理完整的编码任务。给代理一个高级任务，它会将工作拆分成步骤，编辑文件，运行终端命令，调用工具，并在遇到错误或测试失败时自我纠正。每个任务都运行在一个代理会话中，这是一个持续存在的对话，你可以跟踪、暂停、继续或交接给另一个代理。重要你们组织可能在VS Code中禁用了代理。请联系你的管理员以启用此功能。从中央视图管理会话并行运行多个代理会话，每个会话专注于不同的任务。聊天面板中的会话视图为你提供了一个统一的地方来监控所有活跃会话，无论是本地运行、后台还是云端运行。查看每次会话的状态，切换，查看文件变更，

Visual Studio 使用 GitHub Copilot 与 IntelliCode 辅助编码【AI辅助开发系列】

🎀🎀🎀【AI辅助编程系列】🎀🎀🎀 1. Visual Studio 使用 GitHub Copilot 与 IntelliCode 辅助编码 2. Visual Studio 安装和管理 GitHub Copilot 3. Visual Studio 使用 GitHub Copilot 扩展 4. Visual Studio 使用 GitHub Copilot 聊天 5. Visual Studio 使用 GitHub Copilot 协助调试 6. Visual Studio 使用 IntelliCode AI 辅助代码开发 7. Visual Studio 玩转 IntelliCode AI辅助开发