解决VsCode远程服务器上Copilot无法使用Claude的问题

优质文章学习记录

07 Apr 2026 — 1 min read

最近在用vscode中的GitHub copilot，发现无法使用claude系列的模型

很多小伙伴知道要开代理，开往带你以后claude确实会出来，本地使用没有任何问题，但是如果使用远程服务器ssh，claude系列的模型就消失了，参考这篇博客https://blog.ZEEKLOG.net/qq_40620465/article/details/152000104

按照博主的方法，需要加一个改动，在设置远程服务器（注意不是“用户”）的setting.json时需要加入"http.useLocalProxyConfiguration": true,

完成后再重启vscode，claude就有了：

文心一言4.5开源模型实战：ERNIE-4.5-0.3B轻量化部署与效能突破

文心一言4.5开源模型实战：ERNIE-4.5-0.3B轻量化部署与效能突破文心一言4.5开源模型实战：ERNIE-4.5-0.3B轻量化部署与效能突破，本文介绍百度文心一言 4.5 开源模型中 ERNIE-4.5-0.3B 的轻量化部署与效能。该 3 亿参数模型破解大模型落地的算力、效率、安全困局，在 FastDeploy 框架下实现单张 RTX 4090 承载百万级日请求等突破。文章解析其技术架构，给出本地化部署步骤，通过工业场景、中文特色、工程数学计算等测试验证其能力，还提供性能优化、安全加固及故障排查方法，展现其轻量高效与能力均衡特性。引言：轻量化部署的时代突围 ✨ 当行业还在为千亿参数模型的算力消耗争论不休时，百度文心一言4.5开源版本以颠覆性姿态撕开了一条新赛道。2025年6月30日，💥 文心一言4.5系列模型正式开源，其中ERNIE-4.5-0.3B这款仅3亿参数的轻量模型，为破解大模型产业落地的三大困局提供了全新方案： * 算力成本困局：

4个突破性策略提升llama.cpp启动效率：从加载延迟到毫秒级响应的系统优化指南

4个突破性策略提升llama.cpp启动效率：从加载延迟到毫秒级响应的系统优化指南【免费下载链接】llama.cppPort of Facebook's LLaMA model in C/C++ 项目地址: https://gitcode.com/GitHub_Trending/ll/llama.cpp 在本地部署大语言模型时，你是否经历过长达数分钟的启动等待？llama.cpp作为C/C++实现的高效推理框架，其启动性能直接影响开发效率和用户体验。本文将通过"问题诊断→核心原理→分级优化→场景适配"的系统方法，帮助你从根本上解决启动缓慢问题，实现本地部署环境下的毫秒级响应。无论是个人开发者调试模型、企业级服务部署还是边缘设备应用，这些经过验证的优化策略都能显著提升llama.cpp的启动速度和资源利用效率。问题诊断：llama.cpp启动性能瓶颈分析启动流程的四个关键阶段 llama.

5分钟部署Whisper语音识别：多语言大模型一键启动Web服务

5分钟部署Whisper语音识别：多语言大模型一键启动Web服务 1. 引言在当今全球化背景下，跨语言沟通需求日益增长。语音识别技术作为人机交互的重要入口，正逐步从单语种向多语种、高精度方向演进。OpenAI发布的Whisper系列模型凭借其强大的多语言支持和高准确率，已成为语音转录领域的标杆。本文聚焦于一款基于 Whisper Large v3 的预构建镜像——“Whisper语音识别-多语言-large-v3语音识别模型”，该镜像由开发者113小贝二次开发，集成了Gradio Web界面与GPU加速能力，真正实现“开箱即用”。用户无需配置复杂环境，仅需5分钟即可完成部署并启动一个支持99种语言自动检测与转录的Web服务。本教程将带你快速掌握该镜像的核心功能、部署流程及实际应用技巧，适用于科研测试、企业级语音处理系统搭建等场景。 2. 技术架构解析 2.1 模型核心：Whisper Large v3 Whisper Large v3 是 OpenAI 推出的第三代大规模语音识别模型，参数量高达 1.5B，训练数据覆盖超过 68万小时的多语言音频与文本对齐数据

文本生成：从原理到落地，一文读懂AIGC核心与人物故事

文本生成：从原理到落地，一文读懂AIGC核心与人物故事引言你是否好奇，一段流畅的文案、一行自动补全的代码，甚至一首符合格律的诗词，是如何被AI“创作”出来的？文本生成技术正以前所未有的速度渗透到编程、创作、教育等各个领域，成为推动生产力变革的核心引擎。本文将为你系统拆解文本生成的技术内核、热门应用、实用工具，并分享背后中国研究者的探索故事，助你快速把握这一浪潮的关键脉络。 1. 核心原理：三大技术支柱如何驱动文本生成？本节将深入浅出地解析当前文本生成的三大主流技术路径。 1.1 自回归生成：GPT家族的基石自回归生成是当前最主流的文本生成范式，其核心思想是 “预测下一个词” 。模型从左到右，根据已生成的文本（上下文），预测下一个最可能出现的词或子词（Token），如此循环往复，直至生成完整文本。这一切的基石是 Transformer架构，其核心的注意力机制让模型能够“关注”到上下文中的关键信息。近年来，两大关键进展极大地推动了其发展： * 上下文长度扩展：从GPT-3的2048个Token到如今动辄数十万甚至百万Token的上下文窗口，让模型能够处理并生

Read more

文心一言4.5开源模型实战：ERNIE-4.5-0.3B轻量化部署与效能突破

4个突破性策略提升llama.cpp启动效率：从加载延迟到毫秒级响应的系统优化指南

5分钟部署Whisper语音识别：多语言大模型一键启动Web服务

文本生成：从原理到落地，一文读懂AIGC核心与人物故事