AI 产品经理如何拥抱大模型时代
全球视角下的开源 LLM 生态
当前,中文圈与欧美圈在开源大语言模型(LLM)生态上已呈现明显的分化趋势。这种分化主要源于数据集构建策略和目标语言环境的差异,导致两边各自独立发展。日韩及东南亚语系目前仍处于相对边缘的地位。
从应用场景来看,如果目标市场是中文环境,那么依赖不支持中文的基座模型意义不大。将非中文基座微调以支持中文的价值也在逐渐降低,例如早期的 Chinese-LLaMA 和 OpenBuddy 等方案已不再是主流选择。
尽管架构具有普适性,全球生态下的模型结构正趋同演化。目前尚未出现因需求差异导致模型结构完全独立演化的因素。虽然训练 ChatGPT-3.5-turbo 级别的模型似乎触手可及,但现有开源方案受限于数据集质量和定位,在多语言通用性上仍有差距,不过行业重心可能已不再单纯追求多语言普适性。
全球竞争的核心维度主要集中在以下方面:
- 训练量:低于 1T token 的方案已鲜见,数据规模成为基础门槛。
- 开源协议:近期方案对商业使用的限制更少,友好度提升。
- 上下文窗口:更长的 Context Window 正在起步阶段,旨在处理更长文档或对话历史。
国内中文场景的开源 LLM 生态
6 月期间,国内连续发布了多个从零开始预训练的中文基座模型,表明国内并未在第一阶段大幅落后于国外。训练一个 6B 左右规模的基座模型,各团队已具备独立复现能力。然而,由于精力和资源分配问题,更大规模的模型发布以及针对 Chat 对话的微调模型推出速度相对较慢。
推测国内研发团队的战略重心已转向尽快迭代自己的 Baseline 方案,并将其作为最高优先级。为此,部分团队可能暂时放弃超大参数规模的尝试,转而为了加速训练进程而牺牲部分效果。这种思路是合理的,优先卷迭代速度很可能是当前的最优研发路径。毕竟人类对于 LLM 的训练经验远未达到最佳实践状态,待 Baseline 更强后再进行大规模模型训练也是可行的策略。
国内竞争的核心维度包括:
- 开源协议:几乎全部支持商业可用,平均水平优于国际。
- 训练量:近一个月发布的模型均达到 1T token 水平,追平国际。
- Benchmark 榜单:频繁更新,但代表性存疑,易作弊,参考价值有限。
- 内部迭代速度:国内团队对此重视程度极高,国际团队情况尚不明确。
- 长上下文窗口:如 ChatGLM2-6b 达到 32k,虽效果有待验证,但实际可用长度明显超过国际开源方案。
目前可见国内开源团队正在快速调整 Baseline 方案,从业者可从这些结果的趋同变化中识别真正有效的技术 Trick。
应用方向探索
ChatGPT 所代表的大语言模型应用方向,目前可归纳为三大类:
1. 模型服务
以 OpenAI 为典型代表,孵化大模型后开放接口,提供公共模型能力。OpenAI 的接口不仅支持 GPT 系列的能力调用,还支持二次微调。在大规模商业合作上,Notion、Office 全家桶、Bing 等均在推进集成。
2. B2B 垂直工具
以 Copy.ai、Jasper 为例,主打生成内容,瞄准有明确价值需求的领域,如自动生成 SEO 文章、广告创意、社交媒体文案等。海外发展较好,受益于 SaaS 付费接受度高,且用户群明确(电商从业者)。代码校验提示、会议纪要生成、专业文档写作等也可能是扩展方向,但需考量 Fine-tuning 效果及商业价值,通常不如电商领域高。
3. C 端娱乐类
C 端场景最匹配 ChatGPT 应用,用户对体验的容忍度较高。困难在于两点:一是找到可落地的具体场景,单纯聊天无价值,附加场景才产生价值;二是商业模式需突破成本线。按 GPT-3.0 刊例价估算,每输出 3700 字需赚取 1 元(参考起点中文网付费阅读约 20000 字/元)。国内社交分类 APP Glow 曾冲榜前列,主流娱乐类 Chat 围绕二次元/宅群体展开。若扩展至年轻、黏性高、愿意尝试新事物的明星粉丝群体,亦有可能。但孤独是人类永恒命题,下一个爆款来源难以预测。
商业层面思考
当前互联网环境下,收益是第一要务。无论是外部投融资还是内部项目盘点,商业变现都是核心问题。商业拆解为战略与战术两个模块,AI PM 的话语权随公司规模和团队结构不同而衰减。
战略层思考
启动 ChatGPT 项目时,需明确用户群、商业模式、壁垒及演进步骤。这涉及'做不做'和'往哪走'的决策。核心能力在于知识获取与推理。知识获取依赖过往经验及调研信息的挖掘、辨别与结构化整理。知识推理则利用思维工具(如商业画布)推导商业答案,沉淀分析肌肉记忆。


