CoPaw 和 OpenFang,两者软件本体都免费开源,但模型 API 可能产生费用。
CoPaw(阿里云)
- 软件本身:完全免费开源(Apache 2.0),无会员、无广告、无功能限制
- 本地部署:免费,仅需 Python 环境,可跑本地模型(Ollama 等),零 API 费用
- 云端部署:魔搭创空间有免费测试额度;长期使用按云资源(CPU/GPU/ 存储)计费
- 模型 API:调用通义千问、OpenAI、DeepSeek 等按官方标准按量付费
CoPaw GitHub 地址
https://github.com/agentscope-ai/CoPaw
OpenFang(AI Agent 操作系统)
- 软件本身:完全免费开源(Apache-2.0 + MIT),可商用、可二次开发
- 本地部署:免费,支持 Ollama、LM Studio 等本地模型,零 API 费用
- 云端部署:免费,仅承担云服务器 / 算力成本
- 模型 API:调用云端大模型按各厂商标准付费
OpenFang GitHub 地址
https://github.com/RightNow-AI/openfangGitHub
一句话总结:工具免费,模型可能花钱;本地跑模型则全程免费。
Ollama 本地运行的内存需求,核心看模型大小 + 量化等级,CoPaw 调用时和直接用 Ollama 一致。
📌 主流模型内存参考(纯 CPU,Q4 量化)
- 0.5B / 1B:≥4GB 内存即可跑(入门聊天 / 简单任务)
- 3B:≥6GB 内存(日常对话、写文案)
- 7B:≥8GB 内存(流畅对话、代码、写作)
- 13B:≥16GB 内存(强推理、长文本)
- 32B:≥32GB 内存(复杂分析、专业场景)
- 70B:≥64GB 内存(企业级、深度推理)
🧠 关键影响因素
- 量化等级:Q2/Q3 比 Q4 更省内存,但效果略降;Q5/Q8 效果更好但更占内存
- GPU 加速:有 NVIDIA/Apple Silicon 时,显存分担内存压力,16GB 内存 + 4GB 显存可流畅跑 7B
- 上下文窗口: 越大越占内存,默认 2048 够用,开 8192 会多占 1–2GB


