没有人会记住第二个登上月球的人,除了他自己。这一格言在科技界同样适用,尤其是在人工智能领域。
谷歌的尴尬地位与 AI 浪潮
谷歌曾长期处于互联网搜索领域的绝对霸主地位。在 2022 年之前,凭借 Chrome 浏览器和 Google 搜索引擎,其全球市场份额高达 90% 之多,Firefox、Opera 等竞争对手难以匹敌。然而,随着 ChatGPT 的横空出世,这位搜索引擎巨头开始感受到前所未有的压力。
ChatGPT 的面世不亚于一场工业革命,为整个社会带来了方方面面的变革。就搜索领域而言,它让搜索的形态发生了根本性转变:从传统的匹配条目搜索,转换为了以词为单位的语义搜索。信息的获取不再需要费劲构造关键词,然后在琳琅满目的搜索结果中逐条查找答案。借助大语言模型,用户能够得到精确的答案,并且能够基于前一轮的问答继续追问。这种全新的信息搜集交互方式更智能、更高效、更深入,也更具粘性,这确实打了谷歌一个措手不及。
面对这股 AI 浪潮,谷歌显然不会坐以待毙。2023 年 12 月 7 日,谷歌正式发布了其新一代多模态大模型 Gemini,试图重夺 AI 领域的领军地位。
Gemini 演示背后的争议
在发布会初期,一系列测试显示 Gemini 表现遥遥领先。官方还发布了一段长达 6 分半钟的演示视频,展示了 Gemini 超强的多模态能力,包括理解复杂图表、编写代码以及跨设备协作等场景。视频发布后,评论区一片惊叹之声。
然而,随后视频很快被打脸。有技术博主通过实验发现,部分演示内容存在疑点。例如在猜拳环节,是通过发送静态图片和提示语,引导 Gemini 输出特定答案,这与 GPT-4 进行图片交互的逻辑并无二致,却表现得像是实时视频流处理。面对不绝于耳的造假质疑,谷歌随后澄清称,内容全部都是真实的,只不过为了'简洁',将问题视频化加回答录音,然后剪辑而成。
回看 Gemini 的三款产品定位:
- Gemini Nano:运行在手机等移动设备上,目前已在 Google Pixel 8 Pro 上可用。
- Gemini Pro:版本可用,但能力约等于 ChatGPT-3.5。
- Gemini Ultra:最强版本,但在发布初期没有任何可用的地方,演示视频和跑分数据全都是用的这个版本。
这意味着,谷歌左手拿着一个尚未完全落地的 PPT 产品,右手拿着经过剪辑的演示视频,号称吊打 GPT-4。这种营销手段引发了业界对科技公司过度承诺的担忧。
一切都有迹可循:从 Bard 到 Gemini
回顾历史,今年 3 月份谷歌匆匆发布 Bard,号称能够对抗 ChatGPT,但一经发布便漏洞百出、事实错误频发,导致谷歌市值一度蒸发超过 1000 亿美元。如今的 Gemini 发布,又是谷歌着急的表现。它太在意自己在人工智能领域的领军地位,太在意市场份额,似乎过于在意谷歌的利益而不是用户的利益。
一位为谷歌工作 18 年的员工选择离开公司。他享受并热爱早期的谷歌文化,但对如今的谷歌文化深恶痛绝。他指出:'今天谷歌的许多问题都源于桑达尔・皮查伊缺乏远见卓识的领导力,还源于他不愿维护早期的谷歌文化规范。这导致无能的中层管理人员越来越多。'尽管这位离职员工仍留下希望,认为留给谷歌变革的时间不多了,因为谷歌文化的恶化最终将不可逆转。
雅虎的历史教训
最后,回顾一下曾经如日中天的雅虎的一段发展历程,或许能给谷歌敲响警钟:
- 1998 年,雅虎拒绝花 100 万美元收购谷歌。
- 2002 年,雅虎意识到错误并尝试花 30 亿美元收购谷歌,而谷歌开价 50 亿,雅虎再一次拒绝。
- 2008 年,雅虎拒绝以 40 亿美元卖给微软。
- 2016 年,雅虎以 4.6 亿美元卖给了 Verizon,Verizon 相当于中国的移动电信。
罗马不是一日建成的,但也不是一天内倒塌的。科技巨头的衰落往往始于对新技术趋势的误判和对内部创新的压制。
技术细节与行业影响
从技术角度看,Gemini 的架构设计旨在实现真正的原生多模态处理。与早期将文本、图像、音频分别编码再拼接的模型不同,Gemini 试图从一开始就在统一架构下处理多种数据类型。理论上,这能带来更好的上下文理解和逻辑推理能力。然而,如果底层训练数据或评估标准存在问题,再先进的架构也难以掩盖性能上的短板。
此次事件对行业的影响是深远的。首先,它加剧了用户对 AI 生成内容的信任危机。当演示视频可以被剪辑,当跑分数据无法复现,开发者如何判断模型的真实能力?其次,这迫使监管机构加强对 AI 营销的审查。虚假宣传不仅损害消费者权益,也可能阻碍整个行业的健康发展。
此外,这也反映了大模型竞赛中的内卷现象。为了抢占市场先机,企业可能被迫夸大宣传,牺牲透明度换取关注度。长期来看,建立可解释、可验证、负责任的 AI 系统才是竞争的关键。Google 需要证明其技术实力不仅仅停留在演示层面,而是能够真正落地解决实际问题。
未来展望
对于普通用户而言,关注 AI 发展不应仅停留在新闻标题上,更要关注实际应用场景的落地情况。对于从业者来说,掌握大模型的核心原理比追逐热点更为重要。无论平台如何变化,技术本身的演进规律不会改变。


