LFM2-1.2B 模型
一、模型概述
LFM2 是由 Liquid AI 开发的新一代混合模型,专为边缘人工智能和设备端部署而设计。它在质量、速度和内存效率方面树立了新的标准。此次公开了三个经过后训练的检查点权重,分别包含 3.5 亿、7 亿和 12 亿参数。这些模型具备以下关键特性,以助力创建基于人工智能的边缘应用:
- 快速训练与推理:与上一代相比,LFM2 的训练速度提升了 3 倍。在 CPU 上,其解码和预填充速度是 Qwen3 的 2 倍。
- 最佳性能表现:在知识、数学、指令遵循以及多语言能力等多类基准测试中,LFM2 超越了同尺寸的其他模型。
- 新架构:LFM2 是一种新型的混合液体模型,采用乘法门控和短卷积结构。
- 灵活部署:该模型能够在 CPU、GPU 和 NPU 硬件上高效运行,适用于智能手机、笔记本电脑或车辆等设备的灵活部署。
二、模型细节
鉴于其较小的模型尺寸,建议对 LFM2 模型进行针对特定用例的微调,以实现性能最大化。它们特别适合用于代理任务、数据提取、RAG(检索增强生成)、创意写作和多轮对话等场景。不过,不推荐将它们用于知识密集型任务或需要编程技能的任务。
模型参数
| 属性 | 值 |
|---|---|
| 参数数量 | 1,170,340,608 |
| 层数 | 16(10 个卷积层 +6 个注意力层) |
| 上下文长度 | 32,768 个标记 |
| 词汇表大小 | 65,536 |
| 精度 | bfloat16 |
| 训练预算 | 10 万亿个标记 |
许可证
LFM2 采用 LFM 开放许可证 v1.0。
支持语言
支持英语、阿拉伯语、中文、法语、德语、日语、韩语和西班牙语。
生成参数
推荐使用以下参数:
- temperature=0.3
- min_p=0.15
- repetition_penalty=1.05
聊天模板
LFM2 采用类似 ChatML 的聊天模板,示例如下:
<|startoftext|><|im_start|>system You are a helpful assistant trained by Liquid AI.<|im_end|> <|im_start|>user What is C. elegans?<|im_end|> <|im_start|>assistant It's a tiny nematode that lives in temperate soil environments.<|im_end|>
可使用 Hugging Face transformers 中的 apply_chat_template() 函数应用该模板。
工具使用
工具使用包含四个主要步骤:
- 函数定义:LFM2 将 JSON 函数定义作为输入(位于
<|tool_list_start|>和<|tool_list_end|>特殊标记之间的 JSON 对象),通常在系统提示中。 - 函数调用:LFM2 编写类似 Python 的函数调用(位于
<|tool_call_start|>和<|tool_call_end|>特殊标记之间的 Python 列表),作为助手的回答。 - 函数执行:执行函数调用,并返回结果(位于
<|tool_response_start|>和 特殊标记之间的字符串),作为'工具'角色。



