ChatGPT 发布一周年了,切实改变了我的工作方式和职业路径。作为一名普通程序员,回顾过去一年大模型领域的发展情况以及个人的所思所想,文章分为四个部分:从初次接触 ChatGPT 沉迷追 AI 新闻,到开始亲身实践利用 LLM 进行有价值的工作,以开发者视角总结一年来大模型各个层面的发展,最后浅谈对 AI 未来的一些展望。
初次接触 ChatGPT
2022 年 11 月 30 日,OpenAI 正式发布 ChatGPT,在短短一年时间里,ChatGPT 不仅成为了生成式 AI 领域的热门话题,更是开启了新一轮技术浪潮。从最初的 GPT-3.5 模型,到如今的 GPT-4.0 Turbo 模型,OpenAI 的每一次更新都不断拓宽着我们对于人工智能可能性的想象。最开始,ChatGPT 只是通过文字聊天进行互动,而现在,已经能够借助 GPT-4V 解说视频。
文字是思想的载体,第一次看到 ChatGPT 的演示效果,就被震撼到了。看着对话框中的文字逐个跳现,流畅的内容表达、尽情展现想象力,这与以往任何智能对话机器人截然不同,真正展示了智能的可能性。随后,便开始搜寻一切关于 ChatGPT 的信息,频繁刷新 Reddit 上的 ChatGPT 话题讨论,检索 X 平台的 ChatGPT 关键词,查看科技媒体是否有相关报道。
在接下来的一个月里,既兴奋又焦虑。兴奋源于每当有空闲时间,就能与 ChatGPT 这款'真正的人工智能'进行对话;而焦虑则缘于工作时总忍不住去刷新新闻,生怕错过其他用户分享的新玩法展示和有趣的提示词。当时在国内没引起太大的关注,微信指数、百度指数以及新浪指数也只有浅浅的波动。
随着年假的结束,各类生成式 AI 产品不断走红,包括 AI 生成图像和编写代码等。在此期间,一位朋友分享给我一篇文章,发表在红杉资本美国官方网站上,标题为《生成式 AI:一个创造性的新世界》。我既非投资者,也不负责公司战略,仅是一名普通程序员,对我而言,这些由底层逻辑推导出的宏观趋势不过是'正确的废话',并不能指导我的实际行动,然而,作为一个契机,却激发了我深层的思考:如何借助这些能力做个人层面实实在在的实践,为自己打补丁,构建对别人有益的产品,最大化的传递这其中的价值,这才是最重要的。
即使到当下,还有很多人通过追 AI 新闻的方式,关注 AI 领域的最新动态。在这里推荐几个优质的资讯来源,所有这些都支持通过 RSS 进行订阅,部分可以邮件订阅,希望能解决你的信息焦虑,节省你的时间,更专注于手头的工作。
信息源推荐
- deeplearning.ai 官网上的 The Batch 栏目,提供近一周的 AI 相关消息和观点
- Hugging Face 的 Daily Papers
- BriefGPT 上按照自己关注的细分领域订阅最新论文
亲自去实践
对于程序员个人发展来说,目前最理想的选择是加入大厂模型训练或推理平台的基础设施团队,其次,可以考虑前往大模型初创公司的非核心部门。如果这两者不可行,那么可以考虑加入中间层和应用层的创业公司,投身赛道,参与其中才能获得切实的成长和收获。当然,也可以像我一样选择出来单干,但机会依旧有限,坑也就那么多,对大多数程序员来说,比较现实的是在当下,在自己的岗位上用好大模型的能力。我以自己的经历,总结下大概可以分为五个阶段:
学习提示词,了解 LLM 的能力,改善自己和朋友的日常生活体验。举一个例子,我做了一个用于口语化记账的 iOS 快捷指令,分享给身边人用,由于大模型有强大的意图识别能力,记账不再通过在 APP 中手动去记录,而是直接唤起 Siri,口语化表达,然后提炼为结构化的内容,存储在备忘录或者具备 API 接口的记录软件中。给自己做了一个游戏博客,将油管上的游戏类热门视频内容生成文章总结,然后支持 RSS 订阅主题,这样不用去刷,但是也不怕漏掉感兴趣的游戏视频。
像上面这种方式,自定义提示词做个简单应用,用于简历优化、文本校对、生成论文大纲等等,当下这些东西方案成熟,有开源参考,先把 AI 能力用起来。
借助 LLM 扩展个人能力边界:大模型时代,人人都是能实现 MVP 的产品经理。做一个自己的小产品门槛更低了。你说自己不会设计,trace 可以帮你生成 SwiftUI;你说自己不会前端,Screenshot to Code 借助 GPT-4 Vision 可将任何网站的屏幕截图/网址转换为代码 (HTML/Tailwind CSS、React、Vue 或 Bootstrap),实现精准的网站实时克隆。关键是看你是否有颠覆常规的创意,以及是否能够发掘细分市场的需求,AI 提供了更多根据自己的想法创造的时间和机会。
产品研发层面,在产品生命周期的各个阶段让 LLM 更多的介入进来帮助自己。程序员都有造轮子的爱好,为的就是提高效率,节省时间,那么个人的工作流程能不能优化下,让 AI 参与进来。设计技术文档,和技术沟通方案时,使用时序图和 UML 类图辅助说明十分常见,使用用户旅程图和产品经理交流,使用甘特图和项目经理同步进度,这些内容其实都可以借助大模型了,只要你将自己的想法理清楚表述出来,做图部分交给 AI 生成就可以。从系统设计到代码编写、测试和维护,已经将之前每个项目都要经历的标准产出物都交给 AI 生成了,自己只做不同项目实施时的具有特殊性的部分进行确认完善,当前 AI 已经分担了以往 30% 的日常工作量。
在团队中推广 LLM 知识和技术,提升工作效率,并探索其在组织中的应用:积极地将这些技术回馈到工作中,在可能获得额外回报的情况下帮助同事,改善团队流程,并寻求更多公司层面的机会。例如,可以尝试将团队积累的文档资产转化为知识库问答应用,或者开发一个产品 QA 机器人,先过滤 90% 的用户问题。这个过程会认识到,控制 token 成本的重要性,RAG 技术有一堆 dirty work 要做,还有提示词安全也需要考虑。做完这些你就是团队最懂 AI 的那个人,此外,还可以设计开发一个与团队技术栈相匹配的类 LangChain 内部框架,以支持基于 LLM 的应用规模化开发。


