xAI 计划推出独立应用程序
埃隆·马斯克的人工智能初创公司 xAI 计划于 12 月推出独立应用程序,使旗下聊天机器人 Grok 能够直接与 OpenAI 的 ChatGPT 竞争。目前,Grok 仅通过订阅 X(前称 Twitter)服务访问。此外,xAI 近期完成了一轮 5 亿美元的融资,公司估值达到 500 亿美元。主要投资者包括卡塔尔投资局、Valor Equity Partners、红杉资本和 Andreessen Horowitz 等。新资金将用于购买 10 万块英伟达芯片,以训练 AI 模型,并计划将孟菲斯数据中心的规模扩大一倍。xAI 的主要产品 Grok 目前可供 X 的高级订阅用户使用,并已扩展至企业客户。马斯克表示,Grok 的第三版将于 12 月发布,届时将成为全球最强大的 AI。然而,xAI 在资源共享方面面临审查,特斯拉股东已对此提起法律诉讼。尽管如此,xAI 仍在 AI 领域取得进展,最近为 Grok 添加了图像生成功能。
OpenAI 申请'o1'商标保护
OpenAI 已向美国专利商标局(USPTO)提交'OpenAI o1'商标申请,旨在强化其最新 AI 模型 o1 的知识产权保护。早在今年 5 月,OpenAI 已在牙买加申请了相关商标,显示出其对 o1 模型的战略布局。o1 是 OpenAI 首个'推理'模型,未来计划扩展为可执行复杂任务的模型系列。该模型通过深入思考和自我事实核查,提升了 AI 的准确性和可靠性。目前,USPTO 尚未正式授予该商标,申请正等待进一步审查。
Ai2 发布全新开源语言模型系列 OLMo 2
艾伦人工智能研究所(Ai2)近日发布了全新开源语言模型系列 OLMo 2,包括 70 亿和 130 亿参数的基础版和指令版模型。这些模型在英语学术基准测试中表现出色,70 亿参数版本超越了 Meta 的 Llama 3.1 80 亿参数模型,130 亿参数版本在使用更少计算资源的情况下,性能优于 Qwen 2.5 70 亿参数模型。OLMo 2 采用创新的双阶段训练策略,首先在包含 3.9 万亿标记的大规模数据集上进行初步训练,然后利用高质量的学术内容、数学练习册和指令集数据进行精细化训练。为确保训练稳定性,团队对模型架构和训练流程进行了关键性调整。此外,OLMo 2 基于 Ai2 近期开发的开源训练系统 Tülu 3,使其在指令遵循任务中表现出色。研究人员和开发者可通过 Ai2 的在线平台或 Hugging Face 平台访问 OLMo 2,所有资源均在 Apache 2.0 许可证下发布,允许自由学习、修改和开发。
昆仑万维发布中文推理 AI 模型 Skywork o1
昆仑万维集团近日推出了'天工大模型 4.0'o1 版(Skywork o1),这是国内首款具备中文逻辑推理能力的 o1 模型。Skywork o1 在模型输出中内生了思考、计划和反思等能力,使其在标准评测集上的推理能力相比普通模型有显著提升。此次发布包括三款模型:Skywork o1 Open 基于 Llama 3.1 8B,在同类开源模型中表现领先,并解锁了复杂数学任务;Skywork o1 Lite 在保持完整思考能力的同时,优化了中文支持和推理速度;Skywork o1 Preview 作为完整版推理模型,搭载自研的线上推理算法,提供更深入的思考过程和更高质量的推理结果。此外,昆仑万维还开源了两个推理任务的 Process Reward Model(PRM),以进一步提升模型的推理和思考能力。Skywork o1 的发布标志着国内人工智能领域在中文逻辑推理方面的重大进展,为相关应用提供了有力支持。
360 发布纳米搜索
360 公司正式发布多模态内容创作引擎'纳米搜索',引领搜索引擎进入'搜索即创作'时代。该产品突破传统搜索模式,通过语音提问、拍照搜索等方式,用户可直接将信息转化为创意内容,并生成图文或视频。发布会上,创始人周鸿祎用一部短剧展示了'搜、读、写、创'四大核心能力,现场反响热烈。纳米搜索独特的语音定制功能可生成'脱口秀'式视频,甚至支持用户上传自己或家人的声音,增加互动趣味,体现人文关怀。周鸿祎表示,多模态技术降低了 AI 使用门槛,实现 AI 普惠的愿景,助力国家 AI 产业发展。纳米搜索的发布标志着 360 在大模型应用领域的重要布局,为人类带来了 AI 时代的全新技能解锁与创作体验。
阿里巴巴发布 QwQ-32B-Preview 模型
阿里巴巴 Qwen 团队近日发布了 QwQ-32B-Preview 模型,拥有 325 亿参数,支持处理长达 32,000 词的输入提示。在 AIME 和 MATH 等基准测试中,该模型表现优异,尤其在解决复杂逻辑和数学问题方面。QwQ-32B-Preview 具备自我事实核查功能,能有效减少错误,但可能导致推理过程耗时。目前,该模型已在 Hugging Face 平台上发布,采用 Apache 2.0 许可协议,适用于商业用途。然而,模型存在一些局限性,如可能无故切换语言、陷入推理循环,以及在常识推理任务上表现不佳。
谷歌实验室推出 GenChess
谷歌实验室近日推出了 GenChess,这是一款基于文本提示生成个性化棋子的在线国际象棋游戏。用户需使用 Gmail 账户登录,通过输入主题,如'寿司'或'比萨',即可定制棋子。GenChess 提供'经典'和'创意'两种风格,用户可进一步编辑单个棋子的设计。完成定制后,玩家可选择生成对手并开始对弈,系统提供三个难度级别和两种计时模式供选择。谷歌表示,该项目旨在展示人工智能、设计与国际象棋的融合,使用户通过图像生成技术参与游戏。此外,谷歌宣布将在其 AI 聊天机器人 Gemini 中推出新游戏 Chess Gem,允许用户与语言模型对战并交流,预计下月上线,限 Gemini 高级订阅用户使用。


