使用 SiliconCloud 免费体验 Llama3.1-405B 开源大模型
本文介绍了通过 SiliconCloud 平台免费调用 Llama3.1-405B 及 DeepSeek-V2-Chat 等大模型的方法。内容包括注册获取 API Key,配置 Chatbox 客户端进行本地对话,以及利用 Sider 浏览器插件实现网页文本总结翻译。同时涵盖了 API 安全设置、Token 额度管理及常见错误排查,帮助用户低成本体验先进开源模型。

本文介绍了通过 SiliconCloud 平台免费调用 Llama3.1-405B 及 DeepSeek-V2-Chat 等大模型的方法。内容包括注册获取 API Key,配置 Chatbox 客户端进行本地对话,以及利用 Sider 浏览器插件实现网页文本总结翻译。同时涵盖了 API 安全设置、Token 额度管理及常见错误排查,帮助用户低成本体验先进开源模型。

当国内还有人说开源是智商税的时候,Meta 发布了开源标杆 Llama3.1。该系列包含三种不同参数规模:8b、70b 和 405b。其中 405b 版本在多项基准测试中已经达到了最先进的闭源模型水平。

开源模型简单理解就是你可以把代码下载下来,在你自己的电脑上跑。但是受限于模型参数,普通的个人电脑一般只能跑 2b 或 8b 的模型。405b 的参数太大,个人电脑显存无法承载,因此需要借助云端推理服务。
开源的好处,对其他厂商来说是可以参考、复制或微调人家的模型;对个人用户来说,则是成本更低且可控。
怎样才能体验到 Llama3.1-405b?一些厂商会自己部署这些模型,然后提供给大家使用。在 Llama3.1 出来之后,虽然 Groq 号称推理速度最快,但早期仅支持 8b 和 70b 模型。很快,国产厂商 SiliconCloud 提供了这个 405b 的模型,不需要科学上网,就可以在官网注册、实名认证,然后利用提供的 API 参数在你喜欢的客户端中使用。
本文将介绍如何在 SiliconCloud 获取相应参数,然后在 Chatbox 客户端调用 Llama3.1-405b,以及利用 Sider 浏览器插件随时总结、解释、翻译选中的文本。
首先访问 SiliconCloud 官网进行注册。新用户通常会获赠一定的 Token 额度(具体以官方最新活动为准),个人使用通常足够体验几个月。
登录后,进入「API 密钥」页面,点击「创建新 API 密钥」。系统会生成一个密钥字符串,点击前边的小眼睛图标即可明文展示密钥,此时可以将其复制保存。

我们需要去「文档」中心获取 base_url 和具体的模型名称,以便填在其他客户端里。
以下是常用的两个模型名称及接口地址:
base_url: https://api.siliconflow.cn
model name: meta-llama/Meta-Llama-3.1-405B-Instruct
deploy model: deepseek-ai/DeepSeek-V2-Chat
注意:如果你想用 405b 模型,目前通常需要完成实名认证,这是合规要求。你可以在账户设置中进行认证。
Chatbox 是一个流行的大模型客户端,作者最初是为了自己使用方便开发,后来因其跨平台和支持多模型而广受欢迎。
前往官方网站下载对应操作系统的客户端并安装。
安装好之后,打开软件进入「设置」,找到 OpenAI API 配置项。因为 SiliconCloud 的 API 跟 OpenAI 的是兼容的,所以这里选择 OpenAI API 协议来配置。

按照下图所示进行配置:
https://api.siliconflow.cn。meta-llama/Meta-Llama-3.1-405B-Instruct 或 deepseek-ai/DeepSeek-V2-Chat。
配置完成后,即可在对话框中输入问题,开始与模型对话。

Sider 是一个浏览器插件,使用起来非常方便。它是少数允许用户使用自己的 API Key 来调用大模型的插件之一,适合网页阅读辅助场景。
有两种主要使用方式:

如果你不想处理网络问题,建议使用微软 Edge 浏览器,在扩展商店搜索 Sider 安装。
点击右下角「设置」,进入通用配置页,选择 "OpenAI API key",按照以下信息配置:
https://api.siliconflow.cn。deepseek-v2-chat 或 llama-3.1-405b。
SiliconCloud 提供的免费额度通常以 Token 计算。Token 数量大致等于字数(英文单词)或字符数(中文)。405B 模型消耗 Token 的速度较快,建议定期查看后台用量,避免超额。
大模型的技术发展日新月异,应用上也在不断涌现新的最佳实践。像 SiliconCloud 这样的公司,把个人接触最先进大模型的门槛降到了最低。利用 SiliconCloud 提供的免费 Token,再结合 Chatbox 和 Sider,你就可以在工作的各个场景中无缝调用大模型,随时随地向它提问,就像一个百科全书一样陪在身边。不管未来怎样,先用起来再说。
通过上述步骤,你已经掌握了在本地客户端和浏览器插件中调用顶级开源大模型的核心方法。希望这些工具能提升你的工作效率和学习体验。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online