ARIS:基于 Claude Code 的自动化科研与论文工作流
ARIS(Auto-Research-In-Sleep)是一款专为机器学习科研定制的开源工具,旨在通过自动化流程辅助研究人员完成从方向探索到论文定稿的全过程。其核心理念是利用 Claude Code 在后台执行代码、跑实验和整理结果,配合外部大模型进行评审与优化,实现'睡后科研'的高效闭环。
核心架构
ARIS 没有采用复杂的四智能体分工,而是通过跨模型协作实现闭环:
- 执行层:Claude Code 负责读文件、写代码、跑实验、收结果。
- 评审层:外部 LLM(通过 Codex MCP)专门负责打分、找弱点、建议修复。
两个模型互不评阅自己的作业,通过反复交叉辩论形成正向反馈。为了降低使用门槛,它支持 GLM + GPT 或 GLM + MiniMax 等替代模型组合,无需强制依赖 Claude API。
项目地址:https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep
本地部署指南
在本地跑通这套工作流非常简单,主要涉及安装 Skills 和配置 Codex MCP。
1. 安装 Skills
git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git
cd Auto-claude-code-research-in-sleep
# 全局安装所有 skills
cp -r skills/* ~/.claude/skills/
# 或者只安装特定 skill
cp -r skills/auto-review-loop ~/.claude/skills/
2. 配置 Codex MCP
npm install -g @openai/codex claude mcp add codex -s user -- codex mcp-server
3. 启动流程
claude > /idea-discovery "your research direction"
三大核心工作流
项目内的 Skills 共同构成了一条端到端的科研流水线,最核心的三大工作流既可以独立使用,也能无缝串联。
1. 探索新方向(Idea Discovery)
适用于还没有具体 idea,需要文献调研的场景。命令:/idea-discovery "你的研究方向"
流程包括:
- 调研:全景分析最新论文、开放问题及局限性。
- 头脑风暴:生成 8-12 个具体 idea。
- 初筛:评估可行性、算力成本及快速查新。
- 深度验证:对 top idea 进行完整查新和批判性 review。
- 并行 Pilot 实验:Top 2-3 个 idea 分别上不同 GPU 运行 30 分钟至 2 小时。
- 排序报告:输出
IDEA_REPORT.md,含假设、Pilot 结果及建议执行顺序。

