脉脉独家【AI创作者xAMA】｜当豆包手机遭遇“全网封杀”：AI学会操作手机，我们的饭碗还保得住吗？

优质文章学习记录

06 Apr 2026 — 10 min read

🔥草莓熊Lotso：个人主页
❄️个人专栏: 《C++知识分享》《Linux 入门到实践：零基础也能懂》
✨生活是默默的坚持，毅力是永久的享受！

🎬 博主简介：

【AI创作者xAMA】 在脉脉的匿名职言区，一条关于“字节跳动豆包手机功能被国产手机厂商集体封杀”的爆料，引发了技术圈和职场人的双重焦虑——AI已经开始学会“使用”手机了，这是否意味着一些岗位即将消失？

脉脉热榜上，一条关于“字节跳动豆包手机功能被华为、小米、OPPO、vivo等国产手机厂商在系统层面集体屏蔽”的讨论，在技术圈和职场人中炸开了锅。在#AI取代人类工作#的话题下，已经有超过500条跟帖讨论。

这条消息最早由一位认证为“某手机大厂高级工程师”的用户爆出，随后迅速得到多个信源的交叉证实。而最让职场人感到不安的，不是商业竞争本身，而是这项技术背后的意义——AI已经进化到能够直接操作图形界面完成复杂任务了。

01 职场危机，脉脉上技术人的真实焦虑

“刚看到这个消息，我整个人都不好了。”一位认证为“前端开发工程师”的脉脉用户在话题下写道，“我之前以为AI最多是辅助写代码，没想到现在已经能直接操作界面了。我们做的UI，在AI眼里可能只是一堆可点击的坐标。”

在这条评论下，有超过200个赞和43条回复。另一位用户悲观地补充道：“如果AI能通过图形界面完成所有操作，那需要人机交互设计师还有什么用？我们的工作不就是设计人类看得懂、会操作的界面吗？”

在脉脉的“职言”板块，关于AI取代工作岗位的讨论自去年ChatGPT发布后就从未停止，但这次GUI Agent技术的曝光，让许多过去认为“安全”的岗位也开始感到威胁。特别是那些与图形界面直接相关的职位：UI设计师、测试工程师、运营人员，甚至是一些基础的数据录入岗位。

一位互联网大厂的产品经理在匿名区坦言：“我们团队已经在内部测试类似的工具，一个AI可以模拟完成用户在我们App上的完整操作流程，从注册、浏览到下单。这意味着，未来可能不再需要那么多真人来做用户行为测试了。”

02 技术解读，脉脉大V如何分析这场博弈

针对这一技术趋势，脉脉上多位认证为“AI算法专家”、“计算机视觉研究员”的行业大V给出了专业解读。

“这其实标志着AI从‘对话智能’向‘操作智能’的进化。”一位在头部AI公司工作的技术专家写道，“过去的大语言模型只能理解和生成文本，而GUI Agent要解决的是更复杂的问题——如何将视觉信息转化为动作序列。”

另一位大V补充道：“训练一个GUI Agent最大的难点在于获取高质量的人机交互数据。字节跳动在这方面可能有天然优势，通过旗下各种App可以收集到海量的用户真实操作数据。这可能也是手机厂商感到紧张的原因之一——它们可能担心字节通过这些数据训练出的Agent会过于强大。”

在技术讨论中，多位专家都提到了一个关键概念：“强化学习”。GUI Agent需要通过不断试错来学习如何更好地完成任务，就像人类学习使用新软件一样。而一旦某个Agent在特定领域（比如电商购物或内容发布）达到足够高的效率，就可能对相关行业的就业结构产生冲击。

03 竞争真相，为什么是“集体封杀”？

脉脉上，关于各大手机厂商为何采取一致行动的讨论也异常激烈。一位自称“了解内情”的认证用户透露：“这不是简单的商业竞争问题，而是涉及到底层系统安全和数据隐私的考量。”

该用户进一步解释：“GUI Agent需要极高的系统权限——它要能‘看到’屏幕上的所有内容，并且能‘模拟’用户的点击和输入。这意味着，如果这个功能被滥用，可能会导致严重的隐私泄露甚至安全问题。”

另一个高赞评论从商业角度分析：“手机厂商的应用商店和系统服务都有成熟的商业模式。如果AI能绕过这些直接完成任务，就等于动了它们的蛋糕。比如，如果豆包的AI能直接在淘宝上完成购物，那手机厂商的应用商店分成、广告收入都可能受到影响。”

一位认证为“手机厂商战略分析师”的用户则从生态控制的角度提出了看法：“操作系统厂商最看重的是对生态的控制力。GUI Agent技术本质上是创造了一个‘元应用’，可以跨越不同App进行操作。这相当于在操作系统和应用层之间插入了一个新的层级，自然会引发平台方的警惕。”

04 职场未来，哪些岗位最危险？哪些相对安全？

在脉脉的众多讨论中，最受关注的话题莫过于：“我的工作会被取代吗？”

一位AI行业研究员在长文中分析：“从技术角度看，GUI Agent最先可能冲击的是那些流程化、重复性高的操作岗位。比如数据录入员、基础测试工程师、内容审核员、客服操作员等。这些工作的共同特点是操作界面相对固定，任务模式可预测。”

然而，同样有脉脉用户提出了不同观点：“AI能取代的是‘操作’，而不是‘决策’和‘创造’。比如，一个优秀的UI设计师，价值不在于他能熟练操作设计软件，而在于他的审美能力、用户心理把握和创新能力。这些是目前AI难以完全复制的。”

脉脉上多位人力资源专家也参与了讨论。一位认证为“互联网大厂HRD”的用户建议职场人：“面对AI技术的快速发展，最好的策略不是恐慌，而是了解、学习和适应。可以思考两个问题：第一，我的工作中哪些部分最可能被自动化；第二，如何提升那些AI难以替代的能力，比如复杂沟通、创造性思维和战略规划。”

05 脉脉观察，中国互联网人的集体心态变化

从ChatGPT到Midjourney，再到现在的GUI Agent，脉脉作为中国互联网从业者的聚集地，敏锐地记录了这波AI浪潮对职场人心态的影响。

与最初对AI技术的纯粹好奇和兴奋不同，最近几个月的讨论明显增加了更多焦虑和危机感。一位脉脉用户在话题下的评论获得了高共鸣：“以前觉得AI离替代我的工作还很远，现在突然觉得，可能就这三五年的事了。”

另一个值得注意的现象是，越来越多不同领域的职场人开始主动学习AI相关知识。脉脉上“AI技能”、“提示工程”、“机器学习入门”等相关话题的关注度和讨论量在过去半年增长了300%以上。

一位认证为“职业规划师”的脉脉大V总结道：“每次重大技术变革都会带来职业结构的调整，但同时也会创造新的机会。GUI Agent技术虽然可能替代一些现有岗位，但也会产生新的职业需求，比如AI训练师、人机协作设计师、自动化流程专家等。关键在于我们能否快速适应这种变化。”

🍓 我是草莓熊 Lotso！若这篇技术干货帮你打通了学习中的卡点： 👀 【关注】跟我一起深耕技术领域，从基础到进阶，见证每一次成长 ❤️ 【点赞】让优质内容被更多人看见，让知识传递更有力量 ⭐ 【收藏】把核心知识点、实战技巧存好，需要时直接查、随时用 💬 【评论】分享你的经验或疑问（比如曾踩过的技术坑？），一起交流避坑 🗳️ 【投票】用你的选择助力社区内容方向，告诉大家哪个技术点最该重点拆解 技术之路难免有困惑，但同行的人会让前进更有方向～愿我们都能在自己专注的领域里，一步步靠近心中的技术目标！

结语：在脉脉的另一条高赞帖子中，一位用户提出了耐人寻味的问题：“如果AI连图形界面都能操作了，那下一步是不是就能直接控制物理世界了？”这个问题暂时无人能回答，但在各大公司的实验室里，具身智能（Embodied AI）的研究已经在进行中。

✨把这些内容吃透超牛的！放松下吧✨ʕ˘ᴥ˘ʔづきらど

VSCode 中精准禁用 Copilot 代码补全：按语言与场景灵活配置

1. 为什么需要精准控制 Copilot 代码补全作为一个用了 VSCode 和 Copilot 好几年的开发者，我深刻体会到 AI 代码补全的双刃剑效应。刚开始用 Copilot 的时候，那种"它怎么知道我要写什么"的惊喜感真的很棒，但后来我发现，在某些场景下，这种自动补全反而会成为负担。比如我在刷算法题的时候，刚写了个函数名，Copilot 就直接把整个实现都给我补全了。这还训练什么？完全达不到练习的目的。还有时候在写一些特定语言的代码，Copilot 的补全风格和团队规范不一致，每次都要手动调整，反而增加了工作量。更让我头疼的是在不同项目间切换的时候。有些项目我希望充分利用 Copilot 提高效率，有些项目则需要完全自己动手写代码。如果每次都去全局开关 Copilot，那也太麻烦了。其实 Copilot 的设计团队早就想到了这些场景，他们在 VSCode 中提供了非常精细的控制方式。不只是简单的开和关，你可以按编程语言禁用，

Whisper语音识别快速入门：从安装到使用的完整指南

Whisper语音识别快速入门：从安装到使用的完整指南 1. 引言：为什么你需要一个开箱即用的语音识别工具？想象一下，你刚参加完一场国际线上会议，里面有中文、英文、日语的发言。你想快速整理会议纪要，但手动听写不仅耗时，还可能因为语言障碍遗漏关键信息。或者，你是一个内容创作者，需要为一段外语采访视频快速生成字幕。这些场景，正是语音识别技术大显身手的地方。传统上，搭建一个能用的语音识别系统门槛不低：你需要懂深度学习框架、会处理音频、还得搞定模型部署。光是处理各种依赖和版本冲突，就足以劝退很多人。但现在，情况不同了。基于OpenAI Whisper large-v3模型的预置镜像，让这一切变得异常简单。这个镜像已经把模型、Web界面、音频处理工具全部打包好，你只需要几条命令，就能在浏览器里拥有一个支持99种语言的语音转文字服务。它不仅能识别，还能自动检测你说的是哪种语言，甚至可以把内容翻译成英文。这篇文章，就是带你一步步把这个强大的工具跑起来，并告诉你如何用好它。 2. 环境准备：你的电脑需要什么？在开始之前，我们先看看运行这个服务需要什么样的“硬件底子”。这就像

AIGC（生成式AI）试用 47 -- AI与软件开发过程2

一切从 AIGC（生成式AI）试用 46 -- AI与软件开发过程1 开始，修正偏差。个人理解： - 从框架到细节，还是从细节到框架？ -- 先有框架再有细节的好，LLM能适应框架下的细节补充 - 更细节的Agent，更有针对性的Agent，解决更细节问题的Agent -- LLM提供了另一种形式的开发工具 - 想要，架构，细节，实现。。。。。。往复迭代，更多的接口，更多小而美的功能软件 - 回复有错吗？当然，错误和偏差大量存在。如何纠偏、调优？这些专业知识和经验，还需要创造 * 先解决3问题 1. 确认软件开发过程各阶段所需完成的任务活动，以选择不同LLM 问题定义与可行性研究 → 需求分析 → 软件设计 → 编码与实现 → 测试 → 部署与交付

Code Llama代码生成模型：5分钟快速上手与7个实用技巧

Code Llama代码生成模型：5分钟快速上手与7个实用技巧【免费下载链接】CodeLlama-7b-hf 项目地址: https://ai.gitcode.com/hf_mirrors/ai-gitcode/CodeLlama-7b-hf Code Llama代码生成模型是Meta开发的一款强大的AI编程助手，能够在代码合成和理解方面提供卓越表现。本指南将带你快速掌握这款模型的核心使用方法，从基础安装到实战应用，让你在短时间内成为Code Llama的使用高手。 🚀 快速入门指南：一键配置方法环境准备与依赖安装在开始使用Code Llama之前，需要确保系统满足基本要求。建议使用Linux系统，配备至少16GB内存和10GB可用存储空间。通过简单的命令行操作即可完成环境搭建：首先安装必要的Python包管理工具，然后使用pip安装transformers和accelerate库，这两个库是运行Code Llama模型的基础依赖。模型加载三步法加载Code Llama模型的过程可以简化为三个关键步骤： 1. 导入核心模块：引入AutoTokeniz