GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

关注前沿科技  2024年11月11日 13:04 北京

梦晨 发自 凹非寺
量子位 | 公众号 QbitAI

猛料来了,OpenAI下一代旗舰模型被曝提升不如预期

消息来自The Information,具体指代号“猎户座”(Orion)的模型相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段

或许这也是奥特曼曾说,可能不会把新模型命名为GPT-5的原因之一。

www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

消息一出,著名悲观派学者Gary Marcus直接半场开香槟,宣布自己胜利。

www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

在更详细的一篇文章中,他认为整个AI行业公司的高估值建立在模型能力不断增强、迅速达到AGI的预期之上

如果改进放慢了,多数AI公司都能赶上最前沿模型的水平。从此行业进入价格战,收入保持在低位。同时因芯片成本高昂,利润也将难以获得。

当每个人都意识到这一点时,金融泡沫可能会迅速破灭,即使是英伟达也可能受到打击
www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

并且遇到瓶颈的或许不只是OpenAI,此前Anthropic没有如期发布Claude 3.5 Opus,并且从官网删除了相关描述。

以及谷歌Gemini 2虽然计划很快发布,但也被曝性能提升也不及DeepMind创始人的预期。

www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

大模型Scaling Law真的撞墙了吗?

“猎户座”被曝不及预期,奥特曼:AGI 2025

根据目前消息,长期跟踪ChatGPT进展和网页源码的“光头哥”Tibor Blaho总结如下:

参与测试新模型的OpenAI员工称, “猎户座”仅完成20%训练时就达到了GPT-4级别的性能。

但最终质量提升小于从GPT-3到GPT-4的飞跃,这表明传统的Scaling可能由于高质量数据变得有限而放缓。

训练“猎户座”使用了先前模型(GPT-4和o1)生成的数据,可能导致它重现旧模型的一些行为。

OpenAI创建了一个“基础团队”,在高质量数据供应减少的情况下寻找新方法。

o1类模型成本是传统模型的6倍,“猎户座”可能提高OpenAI数据中心的运营成本,进一步增加财务压力。

OpenAI正在做“猎户座”的安全测试,计划于明年初发布,可能不会再命名为GPT系列

www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

与此同时,从OpenAI CEO和许多资深员工那里,传来的却是不同的故事。

首先是奥特曼接受YC总裁Garry Tan采访,在回答最后一个问题“2025年什么会让你兴奋”时,脱口而出“AGI”,没有半秒犹豫。

www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

这段采访引起争议后,强化学习大牛Noam Brown发声:

我听人们说奥特曼只是在炒作,但从我的观察来看,他说的一切都符合OpenAI一线研究员的中位数观点。
www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

今年1月才入职OpenAI的特斯拉前工程师也表达了认同:

自从我加入以来,我的观点已经从“这是毫无成效的炒作”转变成“AGI基本就在这里”
恕我直言,接下来的科学创新会相对很少,将由多年的艰苦工程代替
www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

那么,究竟发生了什么?

在Garry Tan与奥特曼的对话中,两人从奥特曼早期在YC的经历,谈到OpenAI的创立、发展过程,以及给如今创业公司的建议等等。

在接近结束的时候,Garry Tan抛出了这样的问题:你从去年秋天的动荡中学到了什么?你对一些人员离职有什么感受?

奥特曼回答:很累,但感觉很好。

ChatGPT还不到两岁,我们有点像在两年内速通了中型甚至大型科技公司的发展历程,通常需要十年时间。
这带来了很多痛苦的事情。任何公司在扩张时,都会以某种速度经历管理团队的更替。擅长从0到1的人不一定适合从1到10或从10到100的阶段。
……我希望我们现在正走向一个更平稳的时期,但我确信将来还会有其他时期,事情会再次变化剧烈。

Garry Tan接着提问:我想知道OpenAI现在运作的如何?目前的质量和推进速度如何?

奥特曼接下来的回答虽然一如既往的打太极,但引起很多关注:

这是我们第一次真正知道该做什么。构建AGI仍然需要大量的工作,有一些已知和未知,还需要一段时间,而且会很困难,但这非常令人兴奋。
……我们的研究路径相当清晰,我们的基础设施路径相当清晰,产品路径也越来越清晰……很长一段时间,我们都不是这样。
www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

评论区网友显然不买账,有人怀疑这只是奥特曼在试图修改AGI的定义,按照合同,一旦董事会宣布AGI达成,就可以停止与微软分享技术了。

www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

也有人指出,这无法解释最近OpenAI人才频繁出走。

www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

对于人才流动,OpenAI模型架构研究员Rohan Pandey表示并没有人们以为的那么严重。

今年早些时候OpenAI员工总数被曝已超过1700,比去年董事会叛变时期增加了上千人。

www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

也有网友认为,反过来也说得通:

OpenAI高管看到技术进展很快,所以提前离开去创办AI智能体公司。
www.zeeklog.com  - GPT-5被曝不及预期,OpenAI员工:没什么科学突破了,接下来只需要工程

参考链接:
[1]https://www.theinformation.com/articles/openai-shifts-strategy-as-rate-of-gpt-ai-improvements-slows
[2]https://www.youtube.com/watch?v=xXCBz_8hM9w
[3]https://garymarcus.substack.com/p/confirmed-llms-have-indeed-reached
[4]https://www.theverge.com/2024/10/25/24279600/google-next-gemini-ai-model-openai-december
[5]https://x.com/btibor91/status/1855381376054251654

Read more

60个“特征工程”计算函数(Python代码)

60个“特征工程”计算函数(Python代码)

转自:coggle数据科学 近期一些朋友询问我关于如何做特征工程的问题,有没有什么适合初学者的有效操作。 特征工程的问题往往需要具体问题具体分析,当然也有一些暴力的策略,可以在竞赛初赛前期可以带来较大提升,而很多竞赛往往依赖这些信息就可以拿到非常好的效果,剩余的则需要结合业务逻辑以及很多其他的技巧,此处我们将平时用得最多的聚合操作罗列在下方。 最近刚好看到一篇文章汇总了非常多的聚合函数,就摘录在下方,供许多初入竞赛的朋友参考。 聚合特征汇总 pandas自带的聚合函数 * 其它重要聚合函数 其它重要聚合函数&分类分别如下。 def median(x):     return np.median(x) def variation_coefficient(x):     mean = np.mean(x)     if mean != 0:         return np.std(x) / mean     else:         return np.nan def variance(x):     return

By Ne0inhk
90w,确实可以封神了!

90w,确实可以封神了!

要说24年一定最热的技术,还得是AIGC! 前段时间阿里旗下的开源项目,登上GitHub热榜! AI大热,如今ChatGPT的优异表现,必然会出现各种细分场景应用的工具软件,和大量岗位项目! 山雨欲来风满楼,强人工智能的出现,所有科技公司已经开始巨量扩招此领域的人才。算法的岗位,近三个月已经增长68%!这件事在HR届也是相当震撼的。 目前各行各业都不景气的市场,人工智能岗位却一直保持常青!甚至同属AI边缘岗都比其他岗薪资高40%! 与此同时,AI算法岗上岸也不简单,竞争激烈,好公司核心岗位不用说,谁都想去。 所以事实就是,想要上岸,门槛也逐渐变高,项目经历、实习经历都很重要,越早明白这个道理就越能提前建立起自己的优势。 但我在b站逛知识区的时候,经常看到有些同学,因为一些客观原因导致无法参加实习,这种情况下,如果你想提升背景,增加项目经历的话,可以试试这个《CV/NLP 算法工程师培养计划》。 目前已经有上千位同学通过该计划拿到offer了,最新一期学员就业薪资最高能拿到78K!年薪94w! 优势就是有BAT大厂讲师带领,手把手带做AI真实企业项目(包含CV、NLP等

By Ne0inhk
再见nohup!试试这个神器,Python Supervisor!

再见nohup!试试这个神器,Python Supervisor!

👇我的小册 45章教程:() ,原价299,限时特价2杯咖啡,满100人涨10元。 作者丨Ais137 https://juejin.cn/post/7354406980784373798 1. 概述 Supervisor 是一个 C/S 架构的进程监控与管理工具,本文主要介绍其基本用法和部分高级特性,用于解决部署持久化进程的稳定性问题。 2. 问题场景 在实际的工作中,往往会有部署持久化进程的需求,比如接口服务进程,又或者是消费者进程等。这类进程通常是作为后台进程持久化运行的。 一般的部署方法是通过 nohup cmd & 命令来部署。但是这种方式有个弊端是在某些情况下无法保证目标进程的稳定性运行,有的时候 nohup 运行的后台任务会因为未知原因中断,从而导致服务或者消费中断,进而影响项目的正常运行。 为了解决上述问题,通过引入 Supervisor 来部署持久化进程,提高系统运行的稳定性。 3. Supervisor 简介 Supervisor is a client/

By Ne0inhk
第一本给程序员看的AI Agent图书上市了!

第一本给程序员看的AI Agent图书上市了!

AI Agent火爆到什么程度? OpenAI创始人奥特曼预测,未来各行各业,每一个人都可以拥有一个AI Agent;比尔·盖茨在2023年层预言:AI Agent将彻底改变人机交互方式,并颠覆整个软件行业;吴恩达教授在AI Ascent 2024演讲中高赞:AI Agent是一个令人兴奋的趋势,所有从事AI开发的人都应该关注。而国内的各科技巨头也纷纷布局AI Agent平台,如:钉钉的AI PaaS、百度智能云千帆大模型平台等等。 Agent 是未来最重要的智能化工具。对于程序员来说,是时候将目光转向大模型的应用开发了,率先抢占AI的下一个风口AI Agent。 小异带来一本新书《大模型应用开发 动手做 AI Agent》,这本书由《GPT图解》的作者黄佳老师创作,从0到1手把手教你做AI Agent。现在下单享受5折特惠! ▼点击下方,即可5折起购书 有这样一本秘籍在手,程序员们这下放心了吧,让我们先来揭开 Agent 的神秘面纱。 AI Agent 面面观

By Ne0inhk