Kimi 视觉思考版实测：推理与多模态能力解析

Kimi 更新了视觉交互界面，整体风格更加沉稳。经过几天的实际体验，效果令人意外：它不再只是直接给出答案，而是将完整的思考过程——从初步猜测到最终定论的推理链条，清晰呈现。

以前只能看到结果，现在则可以跟着模型的思路一起探索，亲眼目睹它如何搭建起每个逻辑环节。选取了几个典型场景进行测试，观察其实际表现。

这个测试有点挑战性。根据车内拍摄的一张图片来推测车的品牌和型号。品牌比较好说，看方向盘上的标，但是根据内饰来推断是什么型号就比较困难，Kimi 完成的很好！

测试输入：

Kimi 视觉思考版界面

模型分析过程：

它先回忆了特斯拉有哪些车型，再根据座椅、控制台等设计推测可能是 Model 3 或者 Model Y。

Kimi 视觉思考版界面

结果验证：

经过通盘考虑标志、内饰、座椅颜色等，模型很确信是：Model Y，答对了。

Kimi 视觉思考版界面

效果很惊艳。经第三方验证，推断结果与实际情况高度吻合。

测试输入：

Kimi 视觉思考版界面

模型分析中...

推测朋友对商业和职业发展比较感兴趣，这种特质的人可能是产品经理或者企业家。

Kimi 视觉思考版界面

推测 MBTI..

Kimi 视觉思考版界面

结论输出：

模型给出了明确的结论，准确性较高。

更多推荐文章