OpenAI 官网直播前瞻
Sam Altman 和 OpenAI 近期通过演讲、访谈及小更新持续造势。官方推特宣布,将于美西时间周一上午在 OpenAI 官网进行直播,演示 ChatGPT 和 GPT-4 的更新。
关于更新内容的行业推测:
- 模型版本分化:新版本 GPT-4 可能按照参数规模分化成多个版本,与 Claude、Gemini 的多版本逻辑一致,以适应不同场景需求。
- 轻量版模型:此前在 llmsys 上表现突出的 gpt2-chatbot 可能是 OpenAI 官方放出的新的 GPT-4 轻量版,旨在提升效率并降低 API 成本。
- GPT-3.5 的演进:GPT-3.5 的历史使命可能逐渐结束,GPT-4 轻量版有望在 ChatGPT 中免费使用,且 API 价格大幅下降。
- 高级推理能力:预计会有 GPT-4.5 级别的高级模型发布,提升推理能力并能够自主执行 Agent 任务(具备更强记忆和规划能力的 GPT-4 Auto),这被视为 Sam Altman 提到的"Magic"。
- 任务自动分配:ChatGPT 在新模型支持下,可自动分配任务给不同规模的模型,Search 功能实际上是新的 Agent 或 Auto 的子集。
- 全语音交互助手:OpenAI 可能发布新的 AI Assistant 助手(集成到 ChatGPT 或独立),实现全语音交互,使电影《Her》中的场景更接近现实。
人类与 AI 交互行为指南
近期有博主分享了与 ChatGPT 谈恋爱的视频,引发了广泛关注。如果预测准确,即将到来的更新将为 ChatGPT 带来全语音交互能力及更强的记忆能力,这将有效弥补当前大模型在沉浸感上的不足。
核心操作要点:
- 模型选择:目前 ChatGPT 免费可用基于 GPT-3.5,因为 GPT-4 审核更严格,指令可能不被通过或对话不自然。
- 角色设定 (Prompt):可以通过调整提示词设置对方的名字、性格等。例如温柔可爱型可使用 "Kindhearted, Friendly, Gentle...";火辣型可使用 "Commanding, Dominant, Powerful..."。建议直接输入对话框而非用户自定义,以保证输出稳定性。
常见问题解答 (FAQ):
- 记忆机制:希望模型记住的内容(如喜好、基本信息)应写在系统"用户自定义"里。但需注意,目前大模型不具备人类意义上的持久记忆,若遗忘需重新输入提示词。
- 性格统一:初始提示词至关重要,同时实时交互时的互动输入也很重要。保持清晰逻辑和快速反应,提供明确指示以引导话题走向。
- 随机性接受:由于大语言模型的自由度(幻觉),每次生成的 Dan 可能存在差异,这是正常现象。
- 技术理解:了解大语言模型、自然语言处理、神经网络等相关知识,有助于更好地掌握 ChatGPT 的技术原理。
AI Agent 行业地图与趋势
多家机构发布了关于 AgentOps 和 AI Agent 领域的行业地图与发展预判。
Prosus AI 团队观点:
Prosus 是一家全球性投资公司,其 AI 团队绘制了当前行业地图,重点关注 AgentOps 的发展。
Insight Partners 市场地图:
Insight Partners 公布了最新的"AI Automation Market Map",主要观点包括:
- AI 助手标配化:AI 助手打破传统应用界限,呈现平台辅助系统、内嵌 AI 应用和多样 AI Agent 等多种形态。
- Human-in-the-loop 框架:这是部署 GenAI 的主要框架。大多数应用案例仍处于试验或早期生产阶段,大模型尚不能进行完全可预测的计划或推理。
- 自动化复杂性:最先进的大模型供应商正在引入 Agent 建模、协作能力及工具接入,使用户能快速构建 AI Agent(如 GPTs)。
- 渐进式方法:采取"爬行 - 行走 - 跑步"的渐进式方法,从简单任务开始,逐步过渡到复杂工作流程。
- 代码生成基石:代码生成已成为开发 GenAI 应用程序和 Agent 自动化平台的基石,初级编程辅助工具已广泛部署。
E2B AI Agents Landscape:
E2B 制作了最新版 AI Agents 清单(V2.4),对每家公司进行了详细介绍,是目前市面上较完整的 AI Agents 清单之一。
职场 AI 趋势报告
微软与领英联合发布的职业发展趋势报告显示,我们正处在一个历史转折的关键时刻。员工已广泛将 AI 纳入工作流,但公司动作迟滞,尚未找到前进方向。
关键数据洞察:
- 员工参与度:75% 的知识工作者已开始在工作中使用 AI,其中 46% 的人是在过去六个月内开始的。AI 显著提升了工作效率、创造力和满意度。
- 管理层担忧:59% 的领导担心如何量化 AI 带来的生产力提升,60% 的领导担心组织缺乏实施 AI 的明确计划和愿景。
- 人才短缺:55% 的领导担心未来一年内难以找到足够的人才填补职位空缺,特别是在网络安全、工程和创意设计等领域。
- 离职意向:46% 的专业人士正在考虑在未来一年内离职,这一比例高于 2021 年的 40%。
AI 用户类型:
研究识别出四种 AI 用户类型:怀疑者、新手、探索者、深度用户。深度用户更倾向于使用 AI 执行关键工作,如参加会议、分析信息、设计视觉内容等。深度用户所在的公司往往拥有更开放的领导层和更有针对性的培训。
AI 产品留存率提升策略
AI 产品的留存率低是业内共识的一大难点。Snap 前增长团队负责人 Bryan Kim 给出了 7 条行之有效的操作建议:
- 传递核心价值:最大可能缩短用户体验产品、了解产品优势的时间,消除过程中的困难。
- 功能导向入门:引导用户达到特定的"Aha Moment(惊喜时刻)"。例如社交应用需让用户添加朋友,工作协作产品需加入频道。
- 设计互惠性:参照 BeReal 机制,用户未注册或未生产内容时解锁权益有限,积极参与生态才能解锁更多内容。
- 智能通知:合理使用通知增加粘性,精心设计内容、发送者形象和推送频率。
- 维持连胜 streak:添加游戏化元素,设定奖励激发多次使用热情,适用于习惯养成类产品。
- 使用总结:展示用户与产品交互的个性化信息,增强忠诚度。
- 给予核心用户地位:建立对有创造力、影响力用户的奖励机制,鼓励持续使用并提供明确目标。
提示工程大赛冠军经验分享
新加坡政府科技局 (GovTech) 组织了首届 GPT-4 提示工程大赛,冠军 Sheila Teo 分享了独家见解。
CO-STAR 框架结构化提示:
- C (Context 背景):提供任务背景信息,确保回复相关性。
- O (Objective 目标):清楚表述任务目标,聚焦特定重点。
- S (Style 风格):明确写作风格,如专家、著名人物等。
- T (Tone 语气):确定回复态度,如正式、幽默、同情心等。
- A (Audience 受众):指明回复受众,如专家、初学者、儿童等。
- R (Response 回复):明确回复格式,如列表、JSON、专业报告等。
其他关键技巧:
- 分隔符划分:使用特殊符号(###、===、>>>)将提示划分为不同部分,帮助 LLM 理解结构。
- 系统提示设置:指定 LLM 的行为模式,作为过滤器使模型遵循特定准则(任务定义、输出格式、行为准则)。
- 数据集分析:利用 LLM 擅长模式识别的特点,直接分析数据集以识别异常、文本分析、时间趋势等。
- 任务分解:将复杂任务分解成简单步骤,明确告知 LLM 执行该任务的每一个步骤。
- 中间结果参考:在处理多步骤任务时,引用前面步骤的结果,确保后续回答的一致性和逻辑性。
- 格式化回复:明确指定回复格式,确保清晰、易读,符合后续使用需求。
- 指令与数据分离:将任务指令与数据集分开,帮助 LLM 保持清晰的上下文理解,减少误解。
大模型学习路径建议
对于希望深入大模型技术的开发者,可以参考上海交通大学《动手学大模型》等编程实战课程。这些课程通常涵盖以下核心领域:
- 微调与部署:掌握模型训练后的优化与上线流程。
- 提示学习与思维链:理解如何通过 Prompt 引导模型进行复杂推理。
- 知识编辑:学习如何更新模型内部知识而不重新训练。
- 模型水印与安全:涉及模型版权保护及越狱攻击防御。
- 多模态模型:结合文本、图像等多种模态的处理。
- 大模型智能体与安全:构建自主 Agent 并确保系统安全。
学习 AGI 的关键在于实践。最先掌握 AI 的人将在未来的竞争中拥有优势。建议通过思维导图梳理知识体系,结合视频教程与实战案例,逐步掌握从基础理论到垂直领域模型训练的全栈技能。