GitHub Copilot 调用第三方模型API

优质文章学习记录

08 Apr 2026 — 3 min read

一、说明

OAI Compatible Provider for Copilot 的作用是：把 Copilot/Copilot Chat 发出的“类似 OpenAI API 的请求”，转发到指定的 OpenAI-Compatible 服务端（例如 ModelScope 推理网关、自建的兼容网关等）。

⚠️ Warning

登录 GitHub Copilot 的账号一定要是非组织方式开通 pro 会员的，不然无法管理模型。

推荐直接用免费的free账号登录即可。

二、插件安装

在 VS Code 扩展市场安装并启用：

GitHub Copilot
GitHub Copilot Chat
OAI Compatible Provider for Copilot（johnny-zhao.oai-compatible-copilot）

安装后：Developer: Reload Window 重载窗口一次。

确保已在 VS Code 中登录 GitHub，并且 Copilot 正常可用（不然你分不清是 Copilot 本身问题还是 provider 转发问题）。

三、配置示例

建议将配置放置在项目内的： .vscode/settings.json

1、单模型示例

{ "oaicopilot.baseUrl": "https://api.soraharu.com/v1", "oaicopilot.delay": 0, "oaicopilot.readFileLines": 0, "oaicopilot.retry": { "enabled": true, "max_attempts": 3, "interval_ms": 1000, "status_codes": [] }, "oaicopilot.commitLanguage": "English", "oaicopilot.models": [ { "id": "__provider__soraharu", "owned_by": "soraharu", "baseUrl": "https://api.api.soraharu.com/v1", "apiMode": "openai" }, { "id": "google/gemini-3-pro-preview", "owned_by": "soraharu", "baseUrl": "https://api.soraharu.com/v1", "context_length": 128000, "max_tokens": 4096, "vision": true, "apiMode": "openai", "temperature": 0 } ] }

2、多模型示例

{ "oaicopilot.baseUrl": "https://api.soraharu.com/v1", "oaicopilot.delay": 0, "oaicopilot.readFileLines": 0, "oaicopilot.retry": { "enabled": true, "max_attempts": 3, "interval_ms": 1000, "status_codes": [] }, "oaicopilot.commitLanguage": "English", "oaicopilot.models": [ { "id": "__provider__soraharu", "owned_by": "soraharu", "baseUrl": "https://api.soraharu.com/v1", "apiMode": "openai" }, { "id": "google/gemini-3-pro-preview", "owned_by": "soraharu", "baseUrl": "https://api.soraharu.com/v1", "context_length": 128000, "max_tokens": 4096, "vision": true, "apiMode": "openai", "temperature": 0 }, { "id": "anthropic/claude-opus-4-5-thinking", "owned_by": "soraharu", "baseUrl": "https://api.soraharu.com/v1", "context_length": 128000, "max_tokens": 4096, "vision": true, "apiMode": "openai", "temperature": 0 }, { "id": "anthropic/claude-sonnet-4-thinking", "owned_by": "soraharu", "baseUrl": "https://api.soraharu.com/v1", "context_length": 128000, "max_tokens": 8192, "vision": true, "apiMode": "openai", "temperature": 0 } ] }

3、配置讲解

配置主要分为两块：

顶层通用项（全局 API 地址、重试等）
oaicopilot.models数组（定义可选的大模型）

顶层通用项

字段	作用
oaicopilot.baseUrl	通用 API 基地址，推荐全局只用一处。
oaicopilot.delay	控制 Copilot 插件调用接口时的延迟，一般设 0（默认即可）
oaicopilot.readFileLines	配合 Copilot 文件分段补全时用，设 0 即可
oaicopilot.retry	Copilot Chat请求失败时的自动重试策略。
oaicopilot.commitLanguage	Copilot建议生成commit的语言，通常填"English"即可

模型池 oaicopilot.models

字段	作用
id	必须和/v1/models能获得的模型id一致（如"google/gemini-3-pro-preview"）
owned_by	一般填"provider名"即可，描述归属或来源
baseUrl	建议只在顶层写一处，模型对象里不强制（写也可以，冲突时顶层优先）
apiMode	绝大多数 Soraharu/OneAPI都填"openai"，如果是anthropic/olllama/自定义才需变
context_length	最大上下文长度（token数，依照模型能力填）
max_tokens	每次回应的最大输出（token数，官方建议4096/8192之类）
vision	支持多模态（如Gemini/Claude/Sonnet等具备图文能力才设true）
temperature	控制AI输出随机性，越低回答越稳定，代码任务建议设为0

4、配置KEY

在 VSCode 页面进行操作：

Windows/Linux 环境：Ctrl+Shift+P
Mac 环境：Cmd+Shift+P

输入下面的命令，然后将KEY输入进去：

Set OAl Compatible Multi-Provider Apikey

四、模型使用

点击进入 Copilot 聊天框
点击模型选择框
点击模型管理（Manage Modules....）
选择 OAI Compatible 将左侧的隐藏眼睛关闭，这样我们自己设定的模型就会出现在选择框了。

超越代码生成器：深度解析Triton-Copilot的人机协同设计哲学

超越代码生成器：深度解析Triton-Copilot的人机协同设计哲学最近和几位负责底层性能优化的同事聊天，大家普遍有个共鸣：现在做高性能算子开发，感觉像是在走钢丝。一边是模型复杂度指数级增长带来的性能压力，另一边是手写CUDA或Triton代码那令人望而生畏的学习曲线和调试成本。资深专家忙得脚不沾地，而应用层开发者面对性能瓶颈往往束手无策，只能干等着排期。这种“专家依赖症”已经成为AI工程化落地的一个典型瓶颈。正是在这种背景下，我第一次接触到Triton-Copilot。起初我以为它不过是又一个“智能代码补全”工具，但深入使用和剖析其架构后，我发现它的野心远不止于此。它不像ChatGPT那样，你问一句“写个矩阵乘法的Triton代码”，它给你一段可能能跑、但性能和正确性都无法保证的文本。Triton-Copilot构建的，是一套完整的、以验证和协作为核心的软件开发新范式。它试图回答一个根本性问题：如何将人类专家的领域知识（比如对硬件内存层次的理解、对数值稳定性的把握）与AI的代码生成和探索能力系统性地结合起来，而不仅仅是让AI“模仿”人类写代码？这篇文章，我想从一个系统设

LLaMA-Factory全流程训练模型

🤗本文主要讲述在docker下使用LLaMA-Factory训练推理模型。 🫡拉取镜像首先需要启动docker，然后在终端中输入： docker run -tid --gpus all -p 8000:8000 --name LLM -e NVIDIA_DRIVER_CAPABILITIES=compute,utility -e NVIDIA_VISIBLE_DEVICES=all --privileged=true ubuntu:20.04 * 这个命令启动了一个 Ubuntu 20.04 容器，使用所有可用的 GPU * 主机的 8000 端口映射到容器的 8000 端口 * 容器命名为 LLM，以特权模式运行容器进入容器 docker exec -it LLM

【30天从零玩转AI应用开发】第2篇：大模型API注册+调用实战

文章目录 * 前言 * 【30天从零玩转AI应用开发】第2篇：大模型API注册+调用实战（OpenAI/文心一言/通义千问） * 专栏副标题 * 专栏简介 * 摘要 * 关键词 * 前言 * 一、3大主流大模型API对比（新手必看） * 新手选择建议（避坑指南）： * 二、API注册+密钥获取（文字版超详细指南） * 2.1 OpenAI注册+密钥获取（含避坑技巧） * 准备工具： * 注册步骤（每一步都标清按钮位置）： * 避坑技巧： * 2.2 百度文心一言注册+密钥获取（10分钟搞定） * 准备工具： * 注册步骤： * 关键提醒： * 2.3 阿里通义千问注册+密钥获取 * 准备工具： * 注册步骤： * 三、API调用实战（Python代码可直接复制） * 3.

vscode 关闭 copilot 代码 AI 补全

vscode 关闭 copilot 代码 AI 补全在刷算法题时使用 vscode 常常被 copilot 代码补全，往往达不到训练的目的。现在试着将 AI 代码补全关闭依次点击红色框中 {} 按钮 --> Open Menu --> Disable Completions / Disable Completions for ‘c’ (仅对对应的编程语言关闭 AI 补全) 便可将 copilot 代码 AI 补全关闭