使用 SiliconCloud 免费体验 Llama3.1-405B 开源大模型
当国内还有人说开源是智商税的时候,Meta 发布了开源标杆 Llama3.1。该系列包含三种不同参数规模:8b、70b 和 405b。其中 405b 版本在多项基准测试中已经达到了最先进的闭源模型水平。

开源模型与推理挑战
开源模型简单理解就是你可以把代码下载下来,在你自己的电脑上跑。但是受限于模型参数,普通的个人电脑一般只能跑 2b 或 8b 的模型。405b 的参数太大,个人电脑显存无法承载,因此需要借助云端推理服务。
开源的好处,对其他厂商来说是可以参考、复制或微调人家的模型;对个人用户来说,则是成本更低且可控。
怎样才能体验到 Llama3.1-405b?一些厂商会自己部署这些模型,然后提供给大家使用。在 Llama3.1 出来之后,虽然 Groq 号称推理速度最快,但早期仅支持 8b 和 70b 模型。很快,国产厂商 SiliconCloud 提供了这个 405b 的模型,不需要科学上网,就可以在官网注册、实名认证,然后利用提供的 API 参数在你喜欢的客户端中使用。
本文将介绍如何在 SiliconCloud 获取相应参数,然后在 Chatbox 客户端调用 Llama3.1-405b,以及利用 Sider 浏览器插件随时总结、解释、翻译选中的文本。
注册 SiliconCloud,获取 API Key
首先访问 SiliconCloud 官网进行注册。新用户通常会获赠一定的 Token 额度(具体以官方最新活动为准),个人使用通常足够体验几个月。
1. 创建 API 密钥
登录后,进入「API 密钥」页面,点击「创建新 API 密钥」。系统会生成一个密钥字符串,点击前边的小眼睛图标即可明文展示密钥,此时可以将其复制保存。

2. 获取基础配置信息
我们需要去「文档」中心获取 base_url 和具体的模型名称,以便填在其他客户端里。
以下是常用的两个模型名称及接口地址:
base_url: https://api.siliconflow.cn
model name: meta-llama/Meta-Llama-3.1-405B-Instruct
deploy model: deepseek-ai/DeepSeek-V2-Chat
注意:如果你想用 405b 模型,目前通常需要完成实名认证,这是合规要求。你可以在账户设置中进行认证。
在 Chatbox 里调用各种模型
Chatbox 是一个流行的大模型客户端,作者最初是为了自己使用方便开发,后来因其跨平台和支持多模型而广受欢迎。
1. 下载与安装
前往官方网站下载对应操作系统的客户端并安装。
2. 配置 OpenAI API
安装好之后,打开软件进入「设置」,找到 OpenAI API 配置项。因为 SiliconCloud 的 API 跟 OpenAI 的是兼容的,所以这里选择 OpenAI API 协议来配置。






