蓝耘科技上线DeepSeek满血版:500万Tokens专享,解锁AI推理新体验

蓝耘科技上线DeepSeek满血版:500万Tokens专享,解锁AI推理新体验

蓝耘科技:智算云平台的创新者

作为专注于高性能AI基础设施的科技企业,蓝耘科技于2024年11月正式发布元生代智算云平台,整合了智算算力调度、AI应用市场和协作开发三大模块。该平台通过裸金属调度和容器化技术,为用户提供灵活高效的算力资源管理,同时支持团队协作开发,大幅提升AI模型训练与推理效率。

DeepSeek-R1满血版:技术突破与实战优势

此次上线的DeepSeek-R1满血版,基于MoE(Mixture of Experts)架构优化,在32K上下文窗口下实现了动态稀疏激活

  • 数学推理:通过RLHF+DPO混合训练策略,在MATH数据集上准确率达到68.3%(GPT-4为74.9%),但推理成本降低97%。
  • 代码生成:集成代码检索增强技术(RAG),支持Python/Java/C++等12种语言,HumanEval pass@1得分82.1%。
  • 长文本理解:采用滑动窗口注意力机制(SWA),在16K tokens文本摘要任务中ROUGE-L得分提升15%。

开发者可通过量化压缩技术(支持FP16/INT8)灵活控制显存占用,在单卡RTX 4090上即可部署7B版本模型,实测生成速度达45 tokens/秒。

元生代推理引擎:释放AI无限潜能

通过元生代推理引擎,开发者可轻松实现以下功能:

  1. 复杂任务处理:支持多模态数据输入与动态推理,适用于科学计算、金融分析等高精度场景。
  2. 高效资源调度:结合容器化技术,自动优化算力分配,降低延迟与成本。
  3. 安全合规:内置策略引擎确保模型输出符合安全规范,减少重大错误概率。

 

三步调用大模型接口:OpenAI SDK无缝兼容

蓝耘的API接口完全兼容OpenAI官方规范,开发者只需简单配置即可迁移现有应用:

  1. 替换API参数:将base_url设置为蓝耘接口地址(例如[https://api.lkeap.cloud.tencent.com/v1 ](https://api.lkeap.cloud.tencent.com/v1 )),并使用平台生成的api_key
  2. 选择模型:调用时指定model参数为deepseek-r1deepseek-v3
  3. 发送请求:通过标准OpenAI SDK发起对话,享受与ChatGPT一致的开发体验

如果使用python进行终端回答调用

创建一个python文件命名为ark_example.py,将下面示例代码拷贝进文件。并替换密钥为您的API KEY。替换content中的<你是谁>为您想要的提问内容。点击运行,稍等您可以在终端窗口中看到模型调用的返回结果。这样您就完成了您的首次型服务调用。

from openai import OpenAI # 构造 client client = OpenAI( api_key="sk-xxxxxxxxxxx", # APIKey base_url="https://maas-api.lanyun.net/v1", ) # 流式 stream = True # 请求 chat_completion = client.chat.completions.create( model="/maas/deepseek-ai/DeepSeek-R1", messages=[ { "role": "user", "content": "你是谁", } ], stream=stream, ) if stream: for chunk in chat_completion: # 打印思维链内容 if hasattr(chunk.choices[0].delta, 'reasoning_content'): print(f"{chunk.choices[0].delta.reasoning_content}",) # 打印模型最终返回的content if hasattr(chunk.choices[0].delta, 'content'): if chunk.choices[0].delta.content != None and len(chunk.choices[0].delta.content) != 0: print(chunk.choices[0].delta.content,) else: result = chat_completion.choices[0].message.content 

 回答的答案为:

 

开发者实战:OpenAI SDK进阶用法 

场景1:流式输出与速率控制

from openai import OpenAI client = OpenAI(base_url="https://api.lkeap.cloud.tencent.com/v1", api_key="sk-xxx") response = client.chat.completions.create( model="deepseek-r1", messages=[{"role": "user", "content": "用Python实现快速排序"}], temperature=0.3, stream=True, # 启用流式输出 max_tokens=500, timeout=10 # 设置超时阈值 ) for chunk in response: print(chunk.choices[0].delta.content,, flush=True) 

 场景2:函数调用(Function Calling)

response = client.chat.completions.create( model="deepseek-r1", messages=[{"role": "user", "content": "北京明天天气怎么样?"}], tools=[{ "type": "function", "function": { "name": "get_weather", "parameters": { "type": "object", "properties": { "location": {"type": "string"}, "date": {"type": "string"} } } } }] ) # 解析返回的JSON Schema并执行外部API调用 

 

搭配Chatbox:打造本地化AI助手

获取 API Key

 

 

点击API开放平台,然后点击API KEY管理,单击创建API KEY 

 

 

搭配chatbox 

Chatbox作为开源跨平台客户端,是连接蓝耘API的绝佳工具:

  1. 下载安装:支持Windows、Mac、Linux及移动端,从官网或第三方平台获取最新版本。
  2. 配置API:在设置中选择“自定义提供方”,填写蓝耘的base_urlapi_key,模型名称设为deepseek-r1

进行填写

 

1.名称(随便填,比如可以是 lanyun,方便区分)

2.API 地址:https://maas-api.lanyun.net

3.API 路径:/v1/chat/completions

4.API 密钥:填写刚刚复制的APIKEY

5.填写模型名称,比如/maas/deepseek-ai/DeepSeek-R1

6.点击保存

7.创建对话
,确认要使用的模型,开始聊天吧

 

 聊天测试

功能扩展:利用Prompt模板定制专属助手,如代码生成器、多语言翻译等,提升工作效率。 

结束语

注册蓝耘智算云平台即可:
✅ 免费获取500万tokens,畅享DeepSeek-R1满血版。
✅ 体验元生代推理引擎,解锁高效AI开发流程。
✅ 搭配Chatbox客户端,零门槛构建智能应用。

抓住技术红利,加速您的AI项目落地!点击立即注册,开启智能新纪元。

官网链接: https://cloud.lanyun.net//#/registerPage?promoterCode=0131

Read more

Godot被AI代码“围攻”!维护者崩溃发声:“不知道还能坚持多久”

Godot被AI代码“围攻”!维护者崩溃发声:“不知道还能坚持多久”

整理 | 郑丽媛 出品 | ZEEKLOG(ID:ZEEKLOGnews) 当大模型能在几秒钟内生成一段“看起来像那么回事”的补丁时,开源社区却开始付出另一种代价。 最近,开源游戏引擎 Godot 的核心维护团队公开吐槽:他们正被大量“AI 生成的低质量代码”淹没。那些代码往往结构完整、注释齐全、描述洋洋洒洒,但真正的问题是——提交者可能并不理解自己交上来的内容。 这件事,并不是简单的“有人偷懒用 AI 写代码”。它正在触及开源协作最核心的东西:信任。 一场悄无声息的“AI 洪水” 事情的导火索来自一条 Bluesky 讨论帖。 Godot 主要维护者之一、同时也是 Godot 商业支持公司 W4 Games 联合创始人的 Rémi Verschelde 表示,所谓的“AI slop”

By Ne0inhk
“现在的AI就像1880年的笨重工厂!”微软CSO斯坦福泼冷水:别急着造神

“现在的AI就像1880年的笨重工厂!”微软CSO斯坦福泼冷水:别急着造神

大模型仍未对上商业的齿轮? 编译 | 王启隆 来源 | youtu.be/aWqfH0aSGKI 出品丨AI 科技大本营(ID:rgznai100) 现在的硅谷,空气里都飘着一股“再不上车就晚了”的焦躁感。 最近 OpenClaw 风头正旺,强势登顶 GitHub,终结了 React 神话,许多人更是觉得“AI 自己干活赚钱”的日子就在明天了。 特别是在斯坦福商学院(GSB)这种地方,台下坐着的都是成天琢磨怎么用下一个技术风口搞个独角兽出来的狠人。 微软的首席科学官(CSO)Eric Horvitz 被请到了这个几乎全美最想用 AI 变现的礼堂里。作为从上世纪 80 年代就开始搞 AI 的绝对老炮、也是微软技术底座的“扫地僧”,这位老哥并没有顺着台下的胃口,去吹捧下个月大模型又要颠覆什么行业,而是兜头给大家浇了一盆带点学术味的冷水。 他讲了一个挺有画面感的比喻:大家都在聊

By Ne0inhk
诺奖得主辛顿最新访谈:1 万个 AI 可以瞬间共享同一份“灵魂”,这就是为什么人类注定被超越

诺奖得主辛顿最新访谈:1 万个 AI 可以瞬间共享同一份“灵魂”,这就是为什么人类注定被超越

当宇宙级的“嘴炮”遇到降维打击。 编译 | 王启隆 来源 | youtu.be/l6ZcFa8pybE 出品丨AI 科技大本营(ID:rgznai100) 打开最新一期知名播客 StarTalk 的 YouTube 评论区,最高赞的一条留言是这样写的: “我长这么大,第一次看到尼尔·德葛司·泰森(Neil deGrasse Tyson)在一档节目里几乎全程闭嘴,像个手足无措的小学生一样乖乖听讲。” 作为全美最知名的天体物理学家,泰森平时的画风是充满激情、喋喋不休、用宇宙的宏大来震撼嘉宾。但这一次,坐在他对面的那位满头银发、带着温和英音的英国老人,仅仅用最平淡的语气,就让整个演播室陷入了数次令人窒息的沉默。 这位老人是 Geoffrey Hinton。深度学习三巨头之一,2024 年诺贝尔物理学奖得主,被公认为“AI 教父”。 对经常阅读 Hinton 演讲的我来说,这也是比较新奇的一幕—

By Ne0inhk
48小时“烧光”56万!三人创业团队濒临破产,仅因Gemini API密钥被盗:“AI账单远超我们的银行余额”

48小时“烧光”56万!三人创业团队濒临破产,仅因Gemini API密钥被盗:“AI账单远超我们的银行余额”

整理 | 苏宓 出品 | ZEEKLOG(ID:ZEEKLOGnews) 「仅过了 48 小时,一笔 8.2 万美元的天价费用凭空出现,较这家小型初创公司的正常月费暴涨近 46000%。」 这不是假设的虚幻故事,而是一家墨西哥初创公司正在经历的真实危机。 近日,一位名为 RatonVaquero 的开发者在 Reddit 发帖求助称,由于他的 Gemini API 密钥被盗用,原本每月仅约 180 美元(约 1242 元)的费用,在短短 48 小时内暴涨到 82,314.44 美元(约 56.8 万元)。对于这家只有三名开发者的小型创业团队来说,这笔突如其来的账单,几乎等同于灭顶之灾。 “我现在整个人都处在震惊和恐慌之中。”RatonVaquero

By Ne0inhk