跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

大模型落地应用的关键基础设施与行业实践

综述由AI生成大模型技术正从概念炒作转向实际价值落地,产业应用成为新阶段关键词。通过分析三星手机、蔚来汽车、长安汽车、南方电网及生数科技等案例,探讨了大模型在终端设备、智能座舱、自动驾驶、电力调度及视频生成等领域的实践路径。文章重点阐述了云计算平台作为基础设施(如百舸平台、千帆平台)在提供算力调度、模型开发工具链及应用开发支持方面的关键作用,强调了从单点突破向系统性智能化升级的转变。通过降低技术门槛和优化资源配置,AI 技术正加速渗透至传统行业,推动企业数字化转型与商业模式创新。

赛博行者发布于 2025/2/6更新于 2026/6/321 浏览
大模型落地应用的关键基础设施与行业实践

大模型落地应用的关键基础设施与行业实践

自 ChatGPT 横空出世以来,大模型技术如同一股旋风席卷全球科技界。我们亲眼见证了这场革命性变革的演进,从 2023 年上半年开始,企业和开发者们争相囤积算力、训练模型,掀起了一股'大模型军备竞赛'。而随着时间推移,市场逐渐冷静,进入了更为理性的探索阶段。2023 年下半年开始,从'千模大战'到大模型价格战,一定程度上也促进了大模型的落地,更多的企业开始将目光投向实际应用,试图将大模型技术与自身业务相结合。

反映到云市场上,百度智能云事业群总裁沈抖在近期提供了一个观察:'今天跟大家聊的时候是大家出钱要把它用起来,而不只是看热闹、凑热闹。'一个体现是今年大模型招标的规模比去年大了很多。沈抖的判断是但凡人能参与的地方,大模型都会在将来深入地去应用。'企业真正把大模型用起来的决心和可能比以前是变大了。'

从这种由 FOMO(错失恐惧)引发的跟风热炒,到关注真实价值、深耕应用之间的转变,预示着 AI 大模型正在进入一个新的发展阶段,产业落地成为新的关键词。大模型落地,首先要思考的一个问题是什么样的场景才能创造价值。智能手机作为个人计算设备,具备广泛的用户基数,是 AI 和大模型技术理想的落地平台之一。同时,智能手机也是消费者日常生活中最常用的设备,使得 AI 技术能够无缝融入用户体验中,推动其快速普及。

终端设备厂商已经意识到,AI 在提升用户体验上蕴藏着巨大的潜力。然而,开发和维护一个高质量的大模型,就像是从地基开始修建一座复杂的智能大厦,既需要巨大的资源投入,又需要高度专业化的技术储备。对于大多数终端企业来说,从零开始构建自己的 AI 系统无异于'重新发明轮子',因此,选择那些在 AI 领域已经积累深厚的技术伙伴进行合作,无疑是更明智的策略。这不仅能够节省时间和成本,还能让终端企业专注于自己的硬件优势和用户需求,正如拼图中的两块互补的部分,协同合作才能共同打造出更完美的全景图。

把大模型装进手机

在百度云智大会上,三星电子大中华区总裁崔胜植分享了三星如何与百度智能云共同探索大模型在智能终端上的深度应用。他表示,2024 年初,三星在全球市场推出 Galaxy AI,并与百度智能云达成战略合作,基于千帆平台、百度识图为中国用户带来创新的 Galaxy AI 本地化功能,包括即圈即搜、笔记助手、转录助手、聊天助手、浏览助手等移动 AI 体验。

这次合作也反映了百度智能云在 AI 生态构建方面的战略布局。百度智能云通过与三星等全球领先的智能终端企业合作,让 AI 技术触达消费者日常生活的最前沿,这种合作模式就像是行业的'英特尔 inside'战略,让 AI 能力成为智能终端的'大脑'。将大模型部署在端侧或云端协同,关键在于平衡隐私保护与计算能力。端侧大模型虽然响应更快且数据不出设备,但对硬件算力要求极高;而云端大模型则依赖强大的网络传输和服务器集群。通过混合架构,企业可以在保证用户体验流畅度的同时,利用云端强大的推理能力处理复杂任务。

不只是语音助手,更是 AI 伙伴

作为智能电动汽车领域的领军企业,蔚来汽车座舱人工智能研发负责人高杰在百度云智大会上分享了在智能座舱领域的最新进展,特别是在大模型应用方面的创新。智能座舱不仅是一个技术平台,更是'移动的生活空间',关于智能座舱与大模型技术的结合,他指出其核心价值在于'交互效率、使用价值和情感价值'。

蔚来携手千帆平台,接入千帆 API,调用文心大模型共同研发 NOMI GPT 的问答功能,打造了端云多模态大模型,让 NOMI 能够更加自然地与用户互动,成为一个更懂用户、更聪明的座舱 AI 伙伴。关于蔚来的人工智能助手 NOMI,高杰解释道:我们没有把它当语音助手,而是人工智能的伙伴。

高杰分享了 NOMI 的发展历程,从最初的上车打招呼、自定义唤醒词,到后来的灵动音色、儿童专属体验等。随着大模型技术的出现,NOMI 的能力得到了进一步提升。他给出了 NOMI 新一代的人工智能技术框架,包括原生多模态感知、以大模型为主体的决策引擎,以及执行部分。他认为在汽车里,一个无处不在、24 小时可用、不需要被唤醒的原生多模态大模型,能够服务于所有人的有情感的人机交互框架,一定是下一步。

在具体的大模型应用方面,蔚来推出了多个创新功能:一句话多指令,利用大模型提升指令理解能力;生成式交互框架,支持文本、声音、图片和视频的动态生成;多智能体框架,支持多个智能体之间的相互通信和协作;知识类智能体,与百度合作搭建问答系统,支持车辆相关和开放域问题;生成类智能体,可以生成表情、氛围灯效果等;任务型智能体,如'守卫 Agent',可以监控车辆周围环境。高杰还特别强调了情感部分的重要性,最重要的就是 NOMI 懂你。情境的感知,对你的人、车、环境,你的世界知识,拿到这些知识以后再进行一些总结和计算,生成一个具体的场景。

通过这些创新,NOMI 的用户满意度显著提升。NOMI 成功的成为公司购车最重要的因素。如果进行调研的话,今天大家会觉得最重要的就是车的造型,舒适度,彩电、冰箱和大沙发等等,智驾是核心的因素。有了大模型加持,它已经飞速挤到购车因素最重要的点。这些进展表明,随着大模型技术的应用,智能座舱正在成为汽车行业的新焦点,为用户带来更加个性化、智能化的驾驶体验。在相关方案中,与百度智能云与蔚来的合作也成为关键:借助百度文心大模型提升开放域问答交互体验;通过端云多模态大模型实现座舱场景创新;持续进行联合技术研讨,扩大合作范围,共创更多场景和应用。

智驾背后的大算力支撑

作为国内汽车行业的领军企业之一,长安汽车在智能化转型道路上取得了显著进展,特别是在自动驾驶研发方面。长安的智能驾驶系统基于视觉、激光和融合感知算法,辅以 AI 预测和控制算法,希望为用户带来更安全、更人性化的驾驶体验。而智驾的研发,自然离不开算力基础设施建设。具体来看,百舸平台为长安提供了 AI 容器、并行文件存储、AI 训练加速套件等整套自动驾驶训练最佳实践方案,实现 GPU 资源的精细化管理与调度。

双方还在数据加载、计算效率、通信方式等维度进行优化,使得算力总体平均使用率提升到了 90% 以上,综合资源利用率提升了 50%,相同资源条件下,单个模型的训练效率最多提效达到了 30%。云智大会上重庆长安汽车股份有限公司执行副总裁张晓宇表示:'我们将与以百度为代表的行业领军 AI 企业通力合作,积极拥抱大模型对汽车产品智能体验和企业生产力效率提升的历史机遇,用大数据 + 大模型 + 大算力的 AI 技术促进公司向智能低碳出行科技公司转型,最终实现引领汽车文明,造福人类生活的使命愿景。'

在大模型训练过程中,算力基础设施的稳定性至关重要。传统的单机训练容易受到硬件故障的影响,导致长时间中断。而通过异构计算平台和分布式训练框架,可以将任务分发到多个节点,一旦某个节点异常,系统能够迅速迁移任务,确保训练不中断。此外,并行文件存储解决了海量小文件读写瓶颈,这对于自动驾驶场景中频繁读取传感器数据的情况尤为关键。

电力央企如何把大模型用起来?

随着今年年初国家首次将'开展'人工智能+'行动'写入政府工作报告,加快布局人工智能等战略成为国资央企的重点工作。作为电力领域的创新者,南方电网数字电网研究院股份有限公司党委委员、副总经理胡荣在云智大会上介绍了行业面临的机遇和挑战,以及南方电网的一系列战略举措。

胡荣表示,去年九月,南方电网发布了行业垂直领域首个自主可控的大模型'大瓦特'。'大瓦特'模型体系由大模型、小模型及智能体三大核心组件构成,划分为基础级(L0)、业务领域级(L1)和场景级(L2)三个层次,覆盖了语言、视觉、预测、多模态和科学计算等五大基础能力,广泛应用于输配电、调度、安监、供应链、营销等专业领域,实现对电网运行、客户服务、企业经营管理和产业创新发展的全息感知、态势判断、趋势预测和智能优化。

'大瓦特'既是大模型、小模型及智能体构成的模型体系,也是开放共享的平台与生态体系。平台上,南方电网基于百度智能云千帆平台构建了电力调度值班助手。在应对突发事件时,电力调度值班助手可以秒级生成处置方案,极大地增强了调度员的应急响应能力。在垂直行业应用中,数据安全与合规性是首要考虑因素。私有化部署的大模型能够确保敏感数据不出内网,同时通过微调技术,使通用大模型适应特定行业的专业术语和业务逻辑,从而在保证安全的前提下释放 AI 价值。

视频大模型也要摆上'货架'

作为 AI 视频生成领域的创新者,生数科技联合创始人兼 CEO 唐家渝在百度智能云大会上阐述了视频大模型的最新进展。如何高效、大规模地生产高质量视频内容一直是个难题,生数科技的 Vidu 是全球首个突破长时长、高一致性、高动态性的视频大模型,采用自主研发的 U-VIT 架构。

据他介绍,实际情况中,训练如此复杂的视频大模型需要投入巨大的算力资源和技术支持。与此同时,高度个性化、自动化的视频内容创作能力已成为企业和创造者越来越渴求的能力。生数科技面临着这样一个问题:传统方法难以满足需求,亟需创新的技术支持,如何构建稳定的超大算力集群,确保模型训练和推理的高效进行?突破口是:生数选择了与百度百舸 AI 异构计算平台深度合作。

据唐家渝介绍,生数科技选择与百度智能云展开战略合作,取得了显著成效:百舸强大的平台调度和机器管理的能力,包括高性能算力集群的任务分发、队列调度和训练加速的功能,显著提升了 Vidu 的训练效率,并且在少数的异常事件发生的时候,能够做迅速的响应和恢复,大大缩短了整个模型的研发的周期。此外,Vidu 还成为百度智能云千帆大模型平台接入的首个视频大模型。企业用户可直接在千帆平台通过 Vidu API 体验全球领先的视频生成能力,在多个行业场景中开始落地应用。不仅获得了算力和技术支持,还能借助百度智能云的平台优势进一步探索商业化。

Vidu 上线以来已经收到了海内外数万家企业用户的接入申请,因此,开放 API 也是 Vidu 进一步商业化布局的重要一环。唐家渝也表示,未来生数科技将与百度智能云紧密合作,在泛娱乐、广告、影视、动漫、游戏等多个行业场景中加速落地,共同探索视频大模型的边界。视频生成模型的计算复杂度远高于文本模型,涉及大量的显存占用和计算迭代。通过云平台的弹性伸缩能力,企业可以根据业务高峰灵活调整资源,避免自建机房带来的高昂固定成本。

'卷'出新的可能性,我们需要更多的'梯子'

吴晓波在百度云智大会上的分享中提到他多年来走访了上千家工厂,观察到中国在智能制造领域的领先地位。他特别指出中国拥有全球最多的制造产能和灯塔工厂,这印证了中国强大的制造业基础和在产业智能化方面的实践。中国是全球最激进的产业智能化实验场,这一点没有错。

通过对比了五六年前和现在企业对产业智能化的态度变化,企业对人工智能的接受度和应用速度也远超预期,这种变化反映了企业主动性的增强。人工智能在传统制造业和传统服务业的渗透速度,会远远大于过去十年产业智能化在制造业和服务业的渗透的速度。这背后离不开云计算平台提供的基础设施,充当弥合 AI 技术与真实价值之间距离的'梯子'。

向下渗透层面,这样的'梯子'让 AI 不再是科技巨头的专利。从科技行业到传统行业,从中小企业到央国企,云计算平台促进了 AI 技术的普惠,这种普及化趋势,正在为整个经济生态注入新的活力;向上升级层面,这样的'梯子'让 AI 应用正从单点突破走向系统性应用。领先企业不再满足于在个别环节应用 AI,而是追求全流程的智能化升级,涵盖从产品设计到客户服务的各个方面。通过提供全方位的 AI 赋能,最终提升企业核心竞争力,推动商业模式创新:让我们很多非常卷的行业,已经不是红海,可能是血海的行业,能够卷出一个新的可能性。

在这次大会上,百度智能云也进一步对包括底层基础设施到上层应用的全栈式解决方案进行了升级。百舸 4.0 用一云多芯解决算力卡脖子的问题,已经具备了成熟的十万卡集群部署和管理能力。千帆 3.0 则升级了三大服务,覆盖企业客户模型调用、模型开发和应用开发全流程:

  1. 模型调用:企业和个人开发者可通过 API 直接调用文心大模型,还支持近百个国内外大模型、语音、视觉等各种传统小模型。
  2. 模型开发:千帆大模型平台,提供最完善的大模型工具链,支持 CV、NLP、语音等传统模型的开发,支持将应用中产生的数据反馈给模型,持续优化模型效果,实现企业的数据飞轮。
  3. 应用开发:全新推出了企业级 RAG 方案,从检索效果、性能、扩展性、灵活性四方面全面升级;企业级 Agent 开发支持,提供业务自主编排、人工编排、知识注入、记忆能力等 80 多个官方组件;AI 速搭平台。通过自然语言对话就能进行企业级应用开发,一句话即可生成应用。

根据官方的数据,百度智能云千帆平台上文心大模型日均调用量已超过 7 亿次,累计帮助用户精调了 3 万个大模型,开发出 70 多万个企业级应用。在百度云智大会的主论坛以及分论坛的企业分享中,我们也看到其中很多企业在 AI 转型升级都借助了千帆平台这把'梯子'。

其实无论是终端厂商还是央国企,这些企业对大模型每一次尝试和验证背后都是一个故事,但整个故事还远没有讲到结尾的时候,AI 大模型正在润物细无声的向更多行业进行更加深入的渗透。正如约瑟夫·克鲁奇所说,技术让庞大人口诞生成为可能,而庞大的人口则让技术变得不可或缺。我们有理由相信,当企业和个体都能驾驭新技术的力量时,人类社会将迎来一次前所未有的蜕变。

从这个意义上讲,我们需要更多千帆这样的'梯子',不仅仅是为企业和开发者,也是为每一个人。未来的 AI 基础设施将更加模块化、标准化,降低技术门槛,让不同规模的企业都能享受到 AI 带来的红利。同时,随着多模态能力的进一步增强,AI 将从单一的文字处理扩展到图像、视频、音频的全面理解与生成,彻底改变人机交互的方式。企业应当抓住这一窗口期,结合自身业务特点,选择合适的技术合作伙伴,构建属于自己的 AI 护城河。

目录

  1. 大模型落地应用的关键基础设施与行业实践
  2. 把大模型装进手机
  3. 不只是语音助手,更是 AI 伙伴
  4. 智驾背后的大算力支撑
  5. 电力央企如何把大模型用起来?
  6. 视频大模型也要摆上“货架”
  7. “卷”出新的可能性,我们需要更多的“梯子”
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 2026 年各大高校 AIGC 检测政策汇总
  • Claude Code 替代方案:OpenCode 搭配 GitHub Copilot
  • PHP 接口开发:XML 数据的生成与解析实战
  • RAG 结合内容推荐的实践方案与代码示例
  • Spring Bean 作用域、生命周期与自动装配源码解析
  • 偏好对齐技术:通用模型蒸馏、领域模型蒸馏与自我提升
  • STM32 上运行 AI 大模型的四种方案及案例
  • 使用 MCP-Server 插件将 Dify 工作流发布为第三方服务
  • 移动端部署 Stable Diffusion 开源方案与使用指南
  • HarmonyOS 应用升级:静默登录与端云一体实战
  • 基于 SpringBoot2+Vue3 的大学生科创项目在线管理系统
  • MaxKB4j 开源智能体搭建平台技术详解
  • Meta Llama 系列深度解析:开源大模型事实标准与架构演进
  • Stable Diffusion 报错修复:CheckpointLoaderSimple 模型加载失败处理
  • 数据结构:选择排序与堆排序原理及实现
  • JavaSE 核心知识点整理
  • OpenClaw v2026.3.1 版本更新与核心功能解析
  • CentOS 系统安装 Docker 完整指南
  • 前缀和算法实战:连续数组与矩阵区域和
  • 10 款主流 AI 降重工具深度测评与免费方案

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online