彻底解决 Codex / Copilot 修改中文乱码【含自动化解决方案】

优质文章学习记录

07 Apr 2026 — 2 min read

引言

在使用 GitHub Copilot 或 OpenAI Codex 自动重构代码时，你是否遇到过这样的尴尬：AI 生成的代码逻辑完美，但原本注释里的中文却变成了 æˆ‘çˆ±ä¸æ–‡ 这样的乱码？有时候这种字符甚至会污染正确的代码，带来巨大的稳定性隐患。

一、问题核心：被忽视的“终端中转”

乱码的根源不在于 AI 的大脑，也不在于编辑器的显示，而在于执行链路的编码不一致。

Copilot/Codex 在执行某些修改任务（如：重构整个文件或批量替换）时，往往会通过终端调用系统指令。由于 Windows 终端（PowerShell/CMD）默认使用 GBK 编码，它在处理 AI 传来的 UTF-8 字节时会发生“误读”，导致写入文件的内容从源头上就损坏了。

二、解决方案：构建全链路 UTF-8 环境

本文给出一套全自动的解决方案。首先，先新建一个.txt 文件，然后将下方的代码复制进新建的.txt 文件中。接着，将.txt 文件保存并更名为 fix_all_encoding.bat，右键点击并以管理员身份运行即可：

@echo off setlocal enabledelayedexpansion title AI 编程环境编码一键优化工具 :: 1. 权限验证 net session >nul 2>&1 if %errorLevel% neq 0 ( echo [错误] 请右键点击此文件，选择“以管理员身份运行”！ pause exit /b ) echo [*] 正在初始化环境... :: 2. 设置系统级环境变量 echo [*] 配置系统环境变量 (UTF-8)... setx /m PYTHONUTF8 "1" >nul setx /m LESSCHARSET "utf-8" >nul :: 3. 配置 PowerShell Profile echo [*] 配置 PowerShell 启动策略... powershell -NoProfile -ExecutionPolicy Bypass -Command ^ "$p = Split-Path $PROFILE; if (!(Test-Path $p)) { New-Item -ItemType Directory -Path $p -Force }; ^ $content = '$OutputEncoding = [Console]::InputEncoding = [Console]::OutputEncoding = [System.Text.Encoding]::UTF8; [System.Console]::InputEncoding = [System.Text.Encoding]::UTF8; [System.Console]::OutputEncoding = [System.Text.Encoding]::UTF8'; ^ if (Test-Path $PROFILE) { $old = Get-Content $PROFILE; if ($old -notcontains '$OutputEncoding = [Console]::InputEncoding') { Add-Content -Path $PROFILE -Value $content } } else { Set-Content -Path $PROFILE -Value $content -Encoding UTF8 }" :: 4. 智能合并 VS Code 设置 echo [*] 同步 VS Code 全局设置... set "VSC_SETTINGS=%APPDATA%\Code\User\settings.json" if exist "%VSC_SETTINGS%" ( powershell -NoProfile -ExecutionPolicy Bypass -Command ^ "$path = '%VSC_SETTINGS%'; ^ $json = Get-Content $path -Raw | ConvertFrom-Json; ^ $json | Add-Member -NotePropertyName 'files.encoding' -NotePropertyValue 'utf8' -Force; ^ $json | Add-Member -NotePropertyName 'files.autoGuessEncoding' -NotePropertyValue $true -Force; ^ $json | ConvertTo-Json -Depth 100 | Set-Content $path -Encoding UTF8" echo [+] VS Code 设置已同步。 ) echo. echo --------------------------------------------------- echo [+] 配置成功！ echo [提示] 请重启 VS Code 终端或重启编辑器以使配置生效。 echo --------------------------------------------------- pause

2024：人工智能大模型的璀璨年代

大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要对2024年度人工智能大模型的创新和应用进行了总结，希望对学习大语言模型的同学们有所帮助。文章目录 * 1. 前言 * 2. 从OpenAI一方独霸到群雄逐鹿 * 3. 大模型的重要应用方向：代码助手、智能客服、知识搜索 * 4. 从专家专属到人人可用：提示词使用趋于简单 1. 前言人工智能的发展轨迹似乎正在印证一个有趣的历史规律：颠覆性技术往往以超出最初预期的方式迅速演进。回顾历史，电力的普及、互联网的崛起，乃至智能手机的诞生，无一不是以远超人们想象的速度改变了社会的方方面面。随着2022年底ChatGPT的问世，AI大模型如同一颗投入平静湖面的重磅炸弹

斯坦福HAI官网完整版《2025 AI Index Report》全面解读

一、这份报告真正想说什么如果把整份《2025 AI Index Report》压缩成一句话，我会这样概括：AI 已经从“技术突破期”进入“系统扩散期”。它一边继续提升性能，一边迅速降本、普及、商业化、制度化；与此同时，风险事件、治理压力、数据约束、社会信任问题也同步上升。换句话说，2025年的AI不是“更神奇了”这么简单，而是开始变成一种会重塑产业结构、教育体系、监管逻辑和公众心理预期的基础能力。这个判断基本贯穿斯坦福官网总览页的 12 条结论与各章节摘要。(斯坦福人工智能研究所) 斯坦福自己对AI Index的定位也很明确：它不是某家公司的宣传册，也不是对未来的主观想象，而是一个收集、整理、浓缩并可视化 AI 数据趋势的观测框架，目的是为政策制定者、研究者、企业与公众提供更全面、客观的判断基础。也正因为如此，这份报告最重要的价值，

终极语音识别神器：Whisper.cpp完整使用指南

终极语音识别神器：Whisper.cpp完整使用指南【免费下载链接】whisper.cppOpenAI 的 Whisper 模型在 C/C++ 中的移植版本。项目地址: https://gitcode.com/GitHub_Trending/wh/whisper.cpp Whisper.cpp是OpenAI Whisper自动语音识别模型的C/C++移植版本，提供了高性能的离线语音识别解决方案。这个项目最大的亮点在于完全用纯C/C++实现，无需任何外部依赖，就能在各种平台上实现高效的语音转文字功能。为什么选择Whisper.cpp 在众多语音识别工具中，Whisper.cpp凭借其独特的优势脱颖而出：跨平台兼容性 - 从macOS、iOS到Android、Linux，甚至WebAssembly和Windows系统都能完美运行，连Raspberry Pi和Docker容器都支持。极致性能优化 - 针对苹果Silicon芯片深度优化，支持ARM NEON、

文本生成图像：Stable Diffusion XL的进阶控制技巧

文本生成图像：Stable Diffusion XL的进阶控制技巧在AI绘画领域，Stable Diffusion XL（SDXL）凭借其高分辨率输出和强大的细节表现力，已成为创作者的核心工具。然而，如何突破基础操作，实现精准控制生成内容？本文将结合ZEEKLOG平台最新技术实践，从分辨率优化、ControlNet进阶控制、多维度参数调优三个维度展开，提供可落地的解决方案。一、分辨率优化：突破细节模糊的瓶颈 1. 原生分辨率与渐进式提示结合 SDXL原生支持1024×1024分辨率，但直接生成高分辨率图像易导致细节模糊。通过渐进式提示词和负提示词可显著提升质量： prompt ="cyberpunk cityscape, neon lights, photorealistic, 4K, ultra-detailed" negative_prompt ="blurry, lowres, distorted, watermark" 关键参数： * 采样步数：建议50-100步（步数过高可能过拟合，

引言

一、 问题核心：被忽视的“终端中转”

二、 解决方案：构建全链路 UTF-8 环境

Read more