脉脉独家【AI创作者xAMA】|当豆包手机遭遇“全网封杀”:AI学会操作手机,我们的饭碗还保得住吗?

脉脉独家【AI创作者xAMA】|当豆包手机遭遇“全网封杀”:AI学会操作手机,我们的饭碗还保得住吗?
在这里插入图片描述

🔥草莓熊Lotso:个人主页
❄️个人专栏: 《C++知识分享》《Linux 入门到实践:零基础也能懂》
✨生活是默默的坚持,毅力是永久的享受!


🎬 博主简介:

在这里插入图片描述

在这里插入图片描述
【AI创作者xAMA】 在脉脉的匿名职言区,一条关于“字节跳动豆包手机功能被国产手机厂商集体封杀”的爆料,引发了技术圈和职场人的双重焦虑——AI已经开始学会“使用”手机了,这是否意味着一些岗位即将消失?

脉脉热榜上,一条关于“字节跳动豆包手机功能被华为、小米、OPPO、vivo等国产手机厂商在系统层面集体屏蔽”的讨论,在技术圈和职场人中炸开了锅。在#AI取代人类工作#的话题下,已经有超过500条跟帖讨论。

这条消息最早由一位认证为“某手机大厂高级工程师”的用户爆出,随后迅速得到多个信源的交叉证实。而最让职场人感到不安的,不是商业竞争本身,而是这项技术背后的意义——AI已经进化到能够直接操作图形界面完成复杂任务了。


01 职场危机,脉脉上技术人的真实焦虑

“刚看到这个消息,我整个人都不好了。”一位认证为“前端开发工程师”的脉脉用户在话题下写道,“我之前以为AI最多是辅助写代码,没想到现在已经能直接操作界面了。我们做的UI,在AI眼里可能只是一堆可点击的坐标。”

在这条评论下,有超过200个赞和43条回复。另一位用户悲观地补充道:“如果AI能通过图形界面完成所有操作,那需要人机交互设计师还有什么用?我们的工作不就是设计人类看得懂、会操作的界面吗?”

在脉脉的“职言”板块,关于AI取代工作岗位的讨论自去年ChatGPT发布后就从未停止,但这次GUI Agent技术的曝光,让许多过去认为“安全”的岗位也开始感到威胁。特别是那些与图形界面直接相关的职位:UI设计师、测试工程师、运营人员,甚至是一些基础的数据录入岗位。

一位互联网大厂的产品经理在匿名区坦言:“我们团队已经在内部测试类似的工具,一个AI可以模拟完成用户在我们App上的完整操作流程,从注册、浏览到下单。这意味着,未来可能不再需要那么多真人来做用户行为测试了。”

02 技术解读,脉脉大V如何分析这场博弈

针对这一技术趋势,脉脉上多位认证为“AI算法专家”、“计算机视觉研究员”的行业大V给出了专业解读。

“这其实标志着AI从‘对话智能’向‘操作智能’的进化。”一位在头部AI公司工作的技术专家写道,“过去的大语言模型只能理解和生成文本,而GUI Agent要解决的是更复杂的问题——如何将视觉信息转化为动作序列。”

另一位大V补充道:“训练一个GUI Agent最大的难点在于获取高质量的人机交互数据。字节跳动在这方面可能有天然优势,通过旗下各种App可以收集到海量的用户真实操作数据。这可能也是手机厂商感到紧张的原因之一——它们可能担心字节通过这些数据训练出的Agent会过于强大。”

在技术讨论中,多位专家都提到了一个关键概念:“强化学习”。GUI Agent需要通过不断试错来学习如何更好地完成任务,就像人类学习使用新软件一样。而一旦某个Agent在特定领域(比如电商购物或内容发布)达到足够高的效率,就可能对相关行业的就业结构产生冲击。

03 竞争真相,为什么是“集体封杀”?

脉脉上,关于各大手机厂商为何采取一致行动的讨论也异常激烈。一位自称“了解内情”的认证用户透露:“这不是简单的商业竞争问题,而是涉及到底层系统安全和数据隐私的考量。”

该用户进一步解释:“GUI Agent需要极高的系统权限——它要能‘看到’屏幕上的所有内容,并且能‘模拟’用户的点击和输入。这意味着,如果这个功能被滥用,可能会导致严重的隐私泄露甚至安全问题。”

另一个高赞评论从商业角度分析:“手机厂商的应用商店和系统服务都有成熟的商业模式。如果AI能绕过这些直接完成任务,就等于动了它们的蛋糕。比如,如果豆包的AI能直接在淘宝上完成购物,那手机厂商的应用商店分成、广告收入都可能受到影响。”

一位认证为“手机厂商战略分析师”的用户则从生态控制的角度提出了看法:“操作系统厂商最看重的是对生态的控制力。GUI Agent技术本质上是创造了一个‘元应用’,可以跨越不同App进行操作。这相当于在操作系统和应用层之间插入了一个新的层级,自然会引发平台方的警惕。”

04 职场未来,哪些岗位最危险?哪些相对安全?

在脉脉的众多讨论中,最受关注的话题莫过于:“我的工作会被取代吗?”

一位AI行业研究员在长文中分析:“从技术角度看,GUI Agent最先可能冲击的是那些流程化、重复性高的操作岗位。比如数据录入员、基础测试工程师、内容审核员、客服操作员等。这些工作的共同特点是操作界面相对固定,任务模式可预测。”

然而,同样有脉脉用户提出了不同观点:“AI能取代的是‘操作’,而不是‘决策’和‘创造’。比如,一个优秀的UI设计师,价值不在于他能熟练操作设计软件,而在于他的审美能力、用户心理把握和创新能力。这些是目前AI难以完全复制的。”

脉脉上多位人力资源专家也参与了讨论。一位认证为“互联网大厂HRD”的用户建议职场人:“面对AI技术的快速发展,最好的策略不是恐慌,而是了解、学习和适应。可以思考两个问题:第一,我的工作中哪些部分最可能被自动化;第二,如何提升那些AI难以替代的能力,比如复杂沟通、创造性思维和战略规划。”

05 脉脉观察,中国互联网人的集体心态变化

从ChatGPT到Midjourney,再到现在的GUI Agent,脉脉作为中国互联网从业者的聚集地,敏锐地记录了这波AI浪潮对职场人心态的影响。

与最初对AI技术的纯粹好奇和兴奋不同,最近几个月的讨论明显增加了更多焦虑和危机感。一位脉脉用户在话题下的评论获得了高共鸣:“以前觉得AI离替代我的工作还很远,现在突然觉得,可能就这三五年的事了。”

另一个值得注意的现象是,越来越多不同领域的职场人开始主动学习AI相关知识。脉脉上“AI技能”、“提示工程”、“机器学习入门”等相关话题的关注度和讨论量在过去半年增长了300%以上。

一位认证为“职业规划师”的脉脉大V总结道:“每次重大技术变革都会带来职业结构的调整,但同时也会创造新的机会。GUI Agent技术虽然可能替代一些现有岗位,但也会产生新的职业需求,比如AI训练师、人机协作设计师、自动化流程专家等。关键在于我们能否快速适应这种变化。”


🍓 我是草莓熊 Lotso!若这篇技术干货帮你打通了学习中的卡点: 👀 【关注】跟我一起深耕技术领域,从基础到进阶,见证每一次成长 ❤️ 【点赞】让优质内容被更多人看见,让知识传递更有力量 ⭐ 【收藏】把核心知识点、实战技巧存好,需要时直接查、随时用 💬 【评论】分享你的经验或疑问(比如曾踩过的技术坑?),一起交流避坑 🗳️ 【投票】用你的选择助力社区内容方向,告诉大家哪个技术点最该重点拆解 技术之路难免有困惑,但同行的人会让前进更有方向~愿我们都能在自己专注的领域里,一步步靠近心中的技术目标! 

结语:在脉脉的另一条高赞帖子中,一位用户提出了耐人寻味的问题:“如果AI连图形界面都能操作了,那下一步是不是就能直接控制物理世界了?”这个问题暂时无人能回答,但在各大公司的实验室里,具身智能(Embodied AI)的研究已经在进行中。

✨把这些内容吃透超牛的!放松下吧✨ʕ˘ᴥ˘ʔづきらど

Read more

VSCode 中精准禁用 Copilot 代码补全:按语言与场景灵活配置

1. 为什么需要精准控制 Copilot 代码补全 作为一个用了 VSCode 和 Copilot 好几年的开发者,我深刻体会到 AI 代码补全的双刃剑效应。刚开始用 Copilot 的时候,那种"它怎么知道我要写什么"的惊喜感真的很棒,但后来我发现,在某些场景下,这种自动补全反而会成为负担。 比如我在刷算法题的时候,刚写了个函数名,Copilot 就直接把整个实现都给我补全了。这还训练什么?完全达不到练习的目的。还有时候在写一些特定语言的代码,Copilot 的补全风格和团队规范不一致,每次都要手动调整,反而增加了工作量。 更让我头疼的是在不同项目间切换的时候。有些项目我希望充分利用 Copilot 提高效率,有些项目则需要完全自己动手写代码。如果每次都去全局开关 Copilot,那也太麻烦了。 其实 Copilot 的设计团队早就想到了这些场景,他们在 VSCode 中提供了非常精细的控制方式。不只是简单的开和关,你可以按编程语言禁用,

Whisper语音识别快速入门:从安装到使用的完整指南

Whisper语音识别快速入门:从安装到使用的完整指南 1. 引言:为什么你需要一个开箱即用的语音识别工具? 想象一下,你刚参加完一场国际线上会议,里面有中文、英文、日语的发言。你想快速整理会议纪要,但手动听写不仅耗时,还可能因为语言障碍遗漏关键信息。或者,你是一个内容创作者,需要为一段外语采访视频快速生成字幕。这些场景,正是语音识别技术大显身手的地方。 传统上,搭建一个能用的语音识别系统门槛不低:你需要懂深度学习框架、会处理音频、还得搞定模型部署。光是处理各种依赖和版本冲突,就足以劝退很多人。 但现在,情况不同了。基于OpenAI Whisper large-v3模型的预置镜像,让这一切变得异常简单。这个镜像已经把模型、Web界面、音频处理工具全部打包好,你只需要几条命令,就能在浏览器里拥有一个支持99种语言的语音转文字服务。它不仅能识别,还能自动检测你说的是哪种语言,甚至可以把内容翻译成英文。 这篇文章,就是带你一步步把这个强大的工具跑起来,并告诉你如何用好它。 2. 环境准备:你的电脑需要什么? 在开始之前,我们先看看运行这个服务需要什么样的“硬件底子”。这就像

AIGC(生成式AI)试用 47 -- AI与软件开发过程2

一切从 AIGC(生成式AI)试用 46 -- AI与软件开发过程1 开始,修正偏差。 个人理解: - 从框架到细节,还是从细节到框架? -- 先有框架再有细节的好,LLM能适应框架下的细节补充 - 更细节的Agent,更有针对性的Agent,解决更细节问题的Agent -- LLM提供了另一种形式的开发工具 - 想要,架构,细节,实现。。。。。。往复迭代,更多的接口,更多小而美的功能软件 - 回复有错吗?当然,错误和偏差大量存在。   如何纠偏、调优?这些专业知识 和 经验,还需要创造 * 先解决3问题 1. 确认软件开发过程各阶段所需完成的任务活动,以选择不同LLM 问题定义与可行性研究 → 需求分析 → 软件设计 → 编码与实现 → 测试 → 部署与交付

Code Llama代码生成模型:5分钟快速上手与7个实用技巧

Code Llama代码生成模型:5分钟快速上手与7个实用技巧 【免费下载链接】CodeLlama-7b-hf 项目地址: https://ai.gitcode.com/hf_mirrors/ai-gitcode/CodeLlama-7b-hf Code Llama代码生成模型是Meta开发的一款强大的AI编程助手,能够在代码合成和理解方面提供卓越表现。本指南将带你快速掌握这款模型的核心使用方法,从基础安装到实战应用,让你在短时间内成为Code Llama的使用高手。 🚀 快速入门指南:一键配置方法 环境准备与依赖安装 在开始使用Code Llama之前,需要确保系统满足基本要求。建议使用Linux系统,配备至少16GB内存和10GB可用存储空间。通过简单的命令行操作即可完成环境搭建: 首先安装必要的Python包管理工具,然后使用pip安装transformers和accelerate库,这两个库是运行Code Llama模型的基础依赖。 模型加载三步法 加载Code Llama模型的过程可以简化为三个关键步骤: 1. 导入核心模块:引入AutoTokeniz