国产大模型挑战 2024 高考:作文数学物理三科评测结果分析
2024 年高考期间,多家媒体对十余款国产及国际主流人工智能大模型进行了作文、数学、物理三科的综合评测。结果显示,讯飞星火在综合排名中位列第一,通义千问和文心一言紧随其后。在数学测试中,多数模型表现未达预期,部分题目甚至出现“全军覆灭”,仅 GLM-4-0520 超过及格线。物理科目受限于图像识别能力,部分模型存在读图失败问题。评测揭示了当前大模型在逻辑推理、抽象思维及复杂计算方面的局限性,同时也展示了其在创造性写作上的进步。未来随着技术完善,AI 在教育领域的应用潜力仍值得期待。


