Mistral AI 发布开源多模态模型 Pixtral Large 并升级 le Chat | 极客日志

编程语言AI算法

Mistral AI 发布开源多模态模型 Pixtral Large 并升级 le Chat

Mistral AI 发布了开源多模态模型 Pixtral Large，该模型基于 Mistral Large 2 构建，拥有 1230 亿参数解码器和 10 亿参数视觉编码器，支持 128K 上下文窗口。在 MMMU、MathVista 等多个基准测试中表现优于 GPT-4o、Gemini-1.5 Pro 及 Llama-3.2 90B，成为当前最强的开源多模态模型。同时，Mistral AI 升级了免费聊天助手 le Chat，新增网页搜索、画布、文件理解和图像生成等功能，并开源了多模态基准测试 MM-MT-Bench 用于评估视觉语言模型的实际用例。

神经兮兮发布于 2025/2/7更新于 2026/4/191 浏览

Mistral AI 发布开源多模态模型 Pixtral Large 并升级 le Chat

Mistral AI 在 9 月份甩出了自家的首款多模态大模型 Pixtral 12B，如今，Pixtral 12B 技术报告全公开。

Pixtral Large 架构示意图

主页：https://mistral.ai/news/pixtral-12b/

论文地址：https://arxiv.org/abs/2410.07073

开源代码：https://github.com/mistralai

从论文的测试结果来看，Pixtral 12B 明显优于其他类似大小的开源模型（比如 Llama-3.2 11B 和 Qwen-2-VL 7B），甚至在一些评测中，表现比 Meta 家的多模态老大哥 Llama-3.2 90B 还要好。

Pixtral Large 性能对比图

Mistral AI 发布了最新开源多模态模型 Pixtral Large，该模型基于 Mistral Large 2 构建，展示出强大的图像理解能力，能够理解文档、图表和自然图像，同时还保持了 Mistral Large 2 优秀的纯文本理解能力。

Mistral 的 AI 聊天助手 le Chat 也新增了网页搜索、画布、文件理解和图像生成等功能。

此外，Mistral 还开源了一个新的多模态基准测试 MM-MT-Bench，用于在实际场景中评估视觉语言模型。

开源多模态大模型 Pixtral Large

Pixtral Large 是 Mistral AI 多模态家族中的第二个模型。

Pixtral Large 旨在通过大规模数据训练，提供高效的语言理解和生成能力。它支持中文、法文、英文等十多种主流语言，适用于多种自然语言处理任务，如文本生成、翻译和问答等。

Pixtral Large 包括一个 1230 亿参数解码器和一个 10 亿参数视觉编码器，使其在文本和视觉数据处理方面均表现出色。

Pixtral Large 详细架构

Pixtral Large 上下文窗口为 128K，至少可以处理 30 张高分辨率图像或大约一本 300 页的书，这相当于领先的 OpenAI GPT 系列模型的能力。

根据测试数据显示：

Pixtral Large 在 MMMU、MathVista、ChartQA、DocVQA、VQAv2 等基准测试的数据，超过了 GPT-4o、Gemini-1.5 Pro、Claude-3.5 Sonnet、Llama-3.2 90B，成为目前最强的开源多模态模型。

Pixtral Large 在 MM-MT-Bench 上也展示了强有力的竞争力，优于 Claude-3.5 Sonnet（新版）、Gemini-1.5 Pro 和 GPT-4o（最新版）。

极客日志微信公众号二维码

更多推荐文章

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online
Markdown转HTML
将 Markdown（GFM）转为 HTML 片段，浏览器内 marked 解析；与 HTML转Markdown 互为补充。在线工具，Markdown转HTML在线工具，online