Monster API 是一个最新火起来的 API 平台,支持 LLaMA、GPT、StableLM 等开源生成式模型的零代码微调。该工具将微调步骤尽可能简易化,让开发者不用再手动进行一系列设置,同时也提供便宜的 GPU 资源及内存优化。
五步零代码搞定
具体过程如下:
第一步,选择一个模型进行微调。比如 LLaMA-7B、GPT-J-6B、StableLM-7B 等,Monster API 提供了至少 10 个基础大模型。

第二步,选择或创建微调任务。比如指令微调、文本分类等,或者自定义任务。

第三步,选择一个 HuggingFace 数据集。Monster API 可以无缝集成 HuggingFace 数据集,可选择范围很大;还可以根据任务类型推荐数据集。并且不用自己手动操作,就能自动设置好格式。

第四步,设置超参数。

第五步,检查和提交。在设置好如上所有步骤后,确定没有错误就可以提交了。Monster API 表示可以通过 WandB 上的日志来监测任务。
在其博客中写道,用 DataBricks Dolly 15k 微调 LLaMA-7B 完成 3 个 epoch,成本仅需不到 20 美元(折合人民币约 144 元)。官网显示,注册用户后会赠送 2500 积分。会员分为三档,收费分别是每月 9 美元/29 美元/39 美元。

除了微调以外,Monster API 还提供各种生成式 AI 的 API 接口,并表示成本比其他方案低 80%。

背后公司已获 110 万美元融资
消息显示,Monster API 背后公司拿下了110 万美元的种子前资金(pre-seed funding)。这家 AI 初创公司给自己的定位是要做'GPU 领域的爱彼迎',把全世界分散的 GPU 资源实现灵活调度,让开发者们能够以更低的价格使用。

创始人是两兄弟 Gaurav Vij 和 Saurabh Vij。其中 Gaurav Vij 还创立了一家 CV 公司,正是因为 CV 公司需要面临巨大的云计算资本,才启发了他们要做这样一个平台。Saurabh Vij 之前是欧洲核研究中心的粒子物理学家,同时也研究分布式计算。
兄弟俩表示在经过多轮技术迭代后,他们优化了消费级 GPU 在机器学习任务上的性能,使得运行 Whisper AI 模型的成本相较于 AWS 平台降低了 90%,所以他们就想着为什么不利用这个方法来帮助数以万计的开发者们。同时他们透露公司的一个客户使用他们的分散的 GPU 计算资源,已经节省了 30 万美元。


