使用 SiliconCloud 免费体验 Llama3.1-405B 开源大模型

当国内还有人说开源是智商税的时候，Meta 发布了开源标杆 Llama3.1。该系列包含三种不同参数规模：8b、70b 和 405b。其中 405b 版本在多项基准测试中已经达到了最先进的闭源模型水平。

Llama3.1 模型介绍

开源模型与推理挑战

开源模型简单理解就是你可以把代码下载下来，在你自己的电脑上跑。但是受限于模型参数，普通的个人电脑一般只能跑 2b 或 8b 的模型。405b 的参数太大，个人电脑显存无法承载，因此需要借助云端推理服务。

开源的好处，对其他厂商来说是可以参考、复制或微调人家的模型；对个人用户来说，则是成本更低且可控。

怎样才能体验到 Llama3.1-405b？一些厂商会自己部署这些模型，然后提供给大家使用。在 Llama3.1 出来之后，虽然 Groq 号称推理速度最快，但早期仅支持 8b 和 70b 模型。很快，国产厂商 SiliconCloud 提供了这个 405b 的模型，不需要科学上网，就可以在官网注册、实名认证，然后利用提供的 API 参数在你喜欢的客户端中使用。

本文将介绍如何在 SiliconCloud 获取相应参数，然后在 Chatbox 客户端调用 Llama3.1-405b，以及利用 Sider 浏览器插件随时总结、解释、翻译选中的文本。

注册 SiliconCloud，获取 API Key

首先访问 SiliconCloud 官网进行注册。新用户通常会获赠一定的 Token 额度（具体以官方最新活动为准），个人使用通常足够体验几个月。

1. 创建 API 密钥

登录后，进入「API 密钥」页面，点击「创建新 API 密钥」。系统会生成一个密钥字符串，点击前边的小眼睛图标即可明文展示密钥，此时可以将其复制保存。

创建 API 密钥

2. 获取基础配置信息

我们需要去「文档」中心获取 base_url 和具体的模型名称，以便填在其他客户端里。

以下是常用的两个模型名称及接口地址：

base_url: https://api.siliconflow.cn
model name: meta-llama/Meta-Llama-3.1-405B-Instruct
deploy model: deepseek-ai/DeepSeek-V2-Chat

注意：如果你想用 405b 模型，目前通常需要完成实名认证，这是合规要求。你可以在账户设置中进行认证。

在 Chatbox 里调用各种模型

Chatbox 是一个流行的大模型客户端，作者最初是为了自己使用方便开发，后来因其跨平台和支持多模型而广受欢迎。

1. 下载与安装

前往官方网站下载对应操作系统的客户端并安装。

2. 配置 OpenAI API

安装好之后，打开软件进入「设置」，找到 OpenAI API 配置项。因为 SiliconCloud 的 API 跟 OpenAI 的是兼容的，所以这里选择 OpenAI API 协议来配置。

Chatbox 设置界面

使用 SiliconCloud 免费体验 Llama3.1-405B 开源大模型