ARIS:基于 Claude Code 的自动化科研与论文工作流
ARIS(Auto-Research-In-Sleep)是一款专为机器学习科研定制的开源工具,旨在通过自动化流程辅助研究人员完成从方向探索到论文定稿的全过程。其核心理念是利用 Claude Code 在后台执行代码、跑实验和整理结果,配合外部大模型进行评审与优化,实现'睡后科研'的高效闭环。
核心架构
ARIS 没有采用复杂的四智能体分工,而是通过跨模型协作实现闭环:
- 执行层:Claude Code 负责读文件、写代码、跑实验、收结果。
- 评审层:外部 LLM(通过 Codex MCP)专门负责打分、找弱点、建议修复。
两个模型互不评阅自己的作业,通过反复交叉辩论形成正向反馈。为了降低使用门槛,它支持 GLM + GPT 或 GLM + MiniMax 等替代模型组合,无需强制依赖 Claude API。
项目地址:https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep
本地部署指南
在本地跑通这套工作流非常简单,主要涉及安装 Skills 和配置 Codex MCP。
1. 安装 Skills
git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git
cd Auto-claude-code-research-in-sleep
# 全局安装所有 skills
cp -r skills/* ~/.claude/skills/
# 或者只安装特定 skill
cp -r skills/auto-review-loop ~/.claude/skills/
2. 配置 Codex MCP
npm install -g @openai/codex claude mcp add codex -s user -- codex mcp-server
3. 启动流程
claude > /idea-discovery "your research direction"
三大核心工作流
项目内的 Skills 共同构成了一条端到端的科研流水线,最核心的三大工作流既可以独立使用,也能无缝串联。
1. 探索新方向(Idea Discovery)
适用于还没有具体 idea,需要文献调研的场景。命令:/idea-discovery "你的研究方向"
流程包括:
- 调研:全景分析最新论文、开放问题及局限性。
- 头脑风暴:生成 8-12 个具体 idea。
- 初筛:评估可行性、算力成本及快速查新。
- 深度验证:对 top idea 进行完整查新和批判性 review。
- 并行 Pilot 实验:Top 2-3 个 idea 分别上不同 GPU 运行 30 分钟至 2 小时。
- 排序报告:输出
IDEA_REPORT.md,含假设、Pilot 结果及建议执行顺序。
2. 自动科研循环(Auto Review Loop)
适用于已有初步方案,需要迭代优化的场景。命令:/auto-review-loop "你的论文主题"
该工作流会自动执行以下循环:外部 LLM 评审 → Claude Code 实现修复 → 部署实验 → 收结果 → 再评审。关键安全机制包括:
- MAX_ROUNDS = 4:防止无限循环,达到分数阈值提前停止。
- GPU 预算保护:预估耗时超 4 小时的实验自动跳过,标记为需人工跟进。
- 优先改叙事:同样能解决问题时,选择成本更低的路径。
- 上下文压缩:每轮结束后持久化状态到
REVIEW_STATE.json,断点续传。
3. 论文写作流水线(Paper Writing)
适用于将研究报告转化为可投稿 PDF 的场景。命令:/paper-writing "NARRATIVE_REPORT.md"
输入一份描述研究内容的 NARRATIVE_REPORT.md,输出包含 LaTeX 源码、干净的 .bib 及编译好的 PDF。
典型流程:
/paper-plan:生成 claims-evidence 矩阵 + 分节计划。/paper-figure:生成对比表、训练曲线等图表。/paper-write:逐 section 生成 LaTeX(含 bib 清理、去 AI 痕迹打磨)。/paper-compile:编译 PDF、修复错误、页数验证。/auto-paper-improvement-loop:内容审稿 + 格式合规检查。
注意:/paper-figure 能自动生成数据驱动的图表(如折线图、柱状图),但架构图、流程图等仍需手动创建并放入 figures/ 目录。
进阶自定义
系统所有的 Skills 均为标准 Markdown 文件,开发者可自由修改底层参数或替换模型底座。
- 迭代阈值:默认最多执行 4 轮 review,论文得分达 6/10 即自动停止。
- 算力熔断:单次 idea 测试支持灵活设置超时限制与 GPU 总预算。
- 流程审批:通过
AUTO_PROCEED参数可一键切换'全自动跑通'或'步步人工审批'模式。 - 平替模型:原生支持免 Claude/OpenAI API 方案,例如切换为 GLM-5(执行)+ MiniMax-M2.5(评审)的双模博弈架构。
结语
目前这套工具已能跑通从找 Idea 到产出论文 PDF 的全流程。后续规划更看重生态集成,例如引入多模态反馈、W&B 对接读取训练曲线,以及开发 Zotero 与 Obsidian 的 MCP 集成以提升研究上下文的精准度。
对于感兴趣的研究者,可以直接访问 GitHub 仓库获取详细配置,用手头的 Idea 跑一轮试试效果。记住,这些工具加速科研,但不能替代你自己的思考。生成的 Idea 一定要用领域知识审视,最终决策权在你手上。最好的研究 = 人的洞察 + AI 的执行力。

