AI Infra 从底层逻辑到落地实战指南 | 极客日志

PythonAI算法

AI Infra 从底层逻辑到落地实战指南

综述由AI生成AI Infra 是支撑 AI 应用落地的基础设施，涵盖数据层、计算层、模型层和部署层。通过个人副业 AI 绘画、企业知识库搭建及端侧模型轻量化三个实战场景，展示了 Stable Diffusion、LangChain+RAG 及 TFLite 等技术的部署流程与核心代码。同时分析了 AI Infra 向轻量化、模块化及多模态智能体发展的趋势，并为新手提供了学习避坑指南，强调基础原理与实战结合的重要性。

灰度发布发布于 2026/4/9更新于 2026/5/2312 浏览

一、AI Infra 到底是什么？用 3 个生活例子秒懂

很多人一听到'Infra'（基础设施）就头大，觉得是高深莫测的底层技术。其实不然，咱们用生活场景类比一下，瞬间就能明白：

把 AI 应用比作'外卖服务'：AI Infra 就是'外卖平台 + 骑手系统 + 地图导航'——用户下单（发起 AI 请求）、商家出餐（模型计算）、骑手配送（结果返回），全靠这些基础设施支撑，没有它们，再好吃的饭也送不到你手上。
把 AI 应用比作'电影院'：AI Infra 就是'放映设备 + 音响系统 + 票务系统'——观众选片（输入需求）、影院播放（模型推理）、观众观影（获取结果），基础设施的好坏直接决定了'观影体验'（AI 应用的响应速度、准确率）。
把 AI 应用比作'工厂生产线'：AI Infra 就是'生产线设备 + 物料运输系统 + 质量检测系统'——原材料（数据）进去，经过加工（模型训练/推理），产出成品（AI 结果），基础设施决定了生产线的效率和产品质量。

说白了，AI Infra 就是支撑 AI 应用从开发、训练、部署到运行的所有底层技术和工具的总称，它不直接面向用户，但却是所有 AI 应用的'幕后英雄'。没有 AI Infra，ChatGPT、Stable Diffusion 这些热门应用都只能是实验室里的'玩具'，根本无法实现规模化商用。

二、AI Infra 的核心组件：4 大模块撑起整个 AI 生态

AI Infra 看似复杂，但拆解开来其实就 4 个核心模块，咱们用表格清晰展示，每个模块都配通俗解释和应用场景：

核心模块	通俗解释	核心技术/工具	典型应用场景
数据层	AI 的'食材仓库'，负责数据的存储、管理和预处理	数据库（MySQL、MongoDB）、数据湖（Hadoop、MinIO）、数据预处理工具（Pandas、Spark）	训练 AI 模型时的数据准备、AI 知识库的数据存储（如 LangChain 搭建的知识库）
计算层	AI 的'发动机'，提供模型训练和推理所需的算力	硬件（GPU、CPU、NPU）、算力调度平台（K8s、Volcano）、分布式训练框架（TensorFlow、PyTorch）	Stable Diffusion 生成图片、DeepSeek 模型微调、多智能体并行计算
模型层	AI 的'大脑核心'，负责模型的开发、优化和管理	开源模型（DeepSeek、Llama 3）、模型优化工具（TensorRT、ONNX）、模型仓库（Hugging Face、ModelScope）	模型轻量化适配端侧设备、企业级模型微调定制、多模型协同调用
部署层	AI 的'传送通道'，负责将模型落地到各类场景	部署框架（TFLite、PyTorch Mobile）、API 网关（FastAPI、Flask）、边缘计算平台（EdgeX Foundry）	手机端 AI 应用、IoT 设备端 AI 部署、Web 端 AI 工具在线服务

这 4 个模块环环相扣，缺一不可。比如你想做一个 AI 绘画副业（用 Stable Diffusion 生成图片赚钱），数据层负责存储参考图片和训练数据，计算层提供 GPU 算力支撑图片生成，模型层负责选择合适的 SD 模型并优化，部署层把模型包装成 Web 工具或 APP 供用户使用——整个流程都离不开 AI Infra 的支撑。

三、AI Infra 实战：3 个经典场景，代码直接抄

光说理论不够，咱们来 3 个接地气的实战案例，覆盖'个人副业''企业应用''端侧部署'，每个案例都有核心代码和步骤，小白也能跟着做！

场景 1：个人副业——搭建 AI 绘画平台，基于 Stable Diffusion+FastAPI 部署

核心需求

把 Stable Diffusion 模型部署成 Web 服务，用户通过浏览器输入提示词就能生成图片，支持订阅制变现。

技术选型

计算层：GPU（推荐 RTX 3090 及以上，算力不足可以用 Colab 免费 GPU）
模型层：Stable Diffusion v1.5（新手友好，生成效果稳定）
部署层：FastAPI（轻量级 API 框架，快速搭建 Web 服务）
数据层：MinIO（存储用户生成的图片和提示词历史）

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from fastapi import FastAPI, UploadFile, File
from diffusers import StableDiffusionPipeline
import torch
from minio import MinIO
import uuid

# 初始化 FastAPI 应用
app = FastAPI(title="AI 绘画平台 API")

# 加载 Stable Diffusion 模型（首次运行会自动下载）
pipe = StableDiffusionPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5", 
    torch_dtype=torch.float16
).to("cuda")

# 用 GPU 加速，没有 GPU 可以改成"cpu"（生成速度会很慢）

# 初始化 MinIO 客户端（存储图片）
minio_client = MinIO(
    "play.min.io",
    access_key="Q3AM3UQ867SPQQA43P2F",
    secret_key="zuf+tfteSlswRu7BJ86wekitnifILbZam1KYY3TG",
    secure=True
)
bucket_name = "ai-painting"
if not minio_client.bucket_exists(bucket_name):
    minio_client.make_bucket(bucket_name)

# 定义图片生成接口
@app.post("/generate-image")
async def generate_image(prompt: str, negative_prompt: str = ""):
    # 生成图片
    image = pipe(prompt=prompt, negative_prompt=negative_prompt).images[0]
    # 保存图片到 MinIO
    image_name = f"{uuid.uuid4()}.png"
    image_bytes = image.tobytes()
    minio_client.put_object(
        bucket_name, image_name, data=image_bytes, length=len(image_bytes), content_type="image/png"
    )
    # 返回图片 URL
    image_url = minio_client.presigned_get_object(bucket_name, image_name)
    return {"image_url": image_url, "prompt": prompt}

# 运行服务：uvicorn main:app --reload --host 0.0.0.0 --port 8000

from fastapi import FastAPI, Query
from langchain.document_loaders import TextLoader
from langchain.text_splitter import CharacterTextSplitter
from langchain.embeddings import DashScopeEmbeddings
from langchain.vectorstores import Chroma
from langchain.chains import RetrievalQA
from langchain.llms import Tongyi

# 初始化 FastAPI 应用
app = FastAPI(title="企业 AI 知识库")

# 配置模型和密钥（替换为自己的通义千问 API 密钥）
DASHSCOPE_API_KEY = "your-dashscope-api-key"
llm = Tongyi(dashscope_api_key=DASHSCOPE_API_KEY, model_name="qwen-turbo")
embeddings = DashScopeEmbeddings(dashscope_api_key=DASHSCOPE_API_KEY)

# 加载并处理文档（企业可以替换为自己的产品手册、培训资料等）
loader = TextLoader("company_docs.txt", encoding="utf-8")
documents = loader.load()
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
texts = text_splitter.split_documents(documents)

# 构建向量数据库
db = Chroma.from_documents(texts, embeddings, persist_directory="./chroma_db")
db.persist()
retriever = db.as_retriever(search_kwargs={"k": 3})

# 构建 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True
)

# 定义查询接口
@app.get("/query-docs")
async def query_docs(question: str = Query(...)):
    result = qa_chain({"query": question})
    return {
        "answer": result["result"],
        "source_documents": [doc.page_content for doc in result["source_documents"]]
    }

# 运行服务：uvicorn knowledge_base:app --reload --host 0.0.0.0 --port 8001

import tensorflow as tf
from tensorflow.keras.applications import MobileNetV2

# 加载预训练模型
model = MobileNetV2(weights="imagenet", include_top=True)

# 转换为 TFLite 格式（量化优化）
converter = tf.lite.TFLiteConverter.from_keras_model(model)
converter.optimizations = [tf.lite.Optimize.DEFAULT]
# 开启默认量化
tflite_model = converter.convert()

# 保存优化后的模型
with open("mobilenetv2_quant.tflite", "wb") as f:
    f.write(tflite_model)
print("模型优化完成，体积：", len(tflite_model)/1024/1024, "MB")

// 加载 TFLite 模型
private MappedByteBuffer loadModelFile(Context context) throws IOException {
    AssetFileDescriptor fileDescriptor = context.getAssets().openFd("mobilenetv2_quant.tflite");
    FileInputStream inputStream = new FileInputStream(fileDescriptor.getFileDescriptor());
    FileChannel fileChannel = inputStream.getChannel();
    long startOffset = fileDescriptor.getStartOffset();
    long declaredLength = fileDescriptor.getDeclaredLength();
    return fileChannel.map(FileChannel.MapMode.READ_ONLY, startOffset, declaredLength);
}

// 图像识别核心代码
private String classifyImage(Bitmap bitmap) {
    // 预处理图像（缩放、归一化）
    Bitmap resizedBitmap = Bitmap.createScaledBitmap(bitmap, 224, 224, true);
    ByteBuffer inputBuffer = ByteBuffer.allocateDirect(224 * 224 * 3 * 4);
    inputBuffer.order(ByteOrder.nativeOrder());
    
    // 填充图像数据
    int[] intValues = new int[224 * 224];
    resizedBitmap.getPixels(intValues, 0, 224, 0, 0, 224, 224);
    int pixel = 0;
    for (int i = 0; i < 224; ++i) {
        for (int j = 0; j < 224; ++j) {
            int value = intValues[pixel++];
            inputBuffer.putFloat(((value >> 16) & 0xFF) / 255.0f);
            inputBuffer.putFloat(((value >> 8) & 0xFF) / 255.0f);
            inputBuffer.putFloat((value & 0xFF) / 255.0f);
        }
    }
    
    // 运行模型推理
    float[][] output = new float[1][1000];
    interpreter.run(inputBuffer, output);
    
    // 解析结果（获取概率最高的类别）
    int maxIndex = 0;
    float maxProb = 0;
    for (int i = 0; i < 1000; ++i) {
        if (output[0][i] > maxProb) {
            maxProb = output[0][i];
            maxIndex = i;
        }
    }
    return labelList.get(maxIndex); // labelList 是 ImageNet 的类别名称列表
}

AI Infra 从底层逻辑到落地实战指南

一、AI Infra 到底是什么？用 3 个生活例子秒懂

二、AI Infra 的核心组件：4 大模块撑起整个 AI 生态

三、AI Infra 实战：3 个经典场景，代码直接抄

场景 1：个人副业——搭建 AI 绘画平台，基于 Stable Diffusion+FastAPI 部署

核心需求

技术选型

更多推荐文章

相关免费在线工具

核心代码（简化版，可直接运行）

部署步骤

场景 2：企业应用——用 LangChain+RAG 搭建 AI 知识库，3 小时落地

核心需求

技术选型

核心代码（简化版）

部署步骤

场景 3：端侧部署——将 AI 模型轻量化，适配手机/IoT 设备

核心需求

技术选型

核心步骤（含代码片段）

四、AI Infra 的发展趋势：2026 年必看的 3 个方向

1. 轻量化 + 端侧化：AI 从'云端'走向'身边'

2. 模块化 + 低代码：人人都能做 AI 开发

3. 多模态 + 智能体：AI Infra 需要更强的协同能力

五、学习 AI Infra 的避坑指南：新手必看

总结

更多推荐文章

相关免费在线工具

AI Infra 从底层逻辑到落地实战指南

一、AI Infra 到底是什么？用 3 个生活例子秒懂

二、AI Infra 的核心组件：4 大模块撑起整个 AI 生态

三、AI Infra 实战：3 个经典场景，代码直接抄

场景 1：个人副业——搭建 AI 绘画平台，基于 Stable Diffusion+FastAPI 部署

核心需求

技术选型

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

核心代码（简化版，可直接运行）

部署步骤

场景 2：企业应用——用 LangChain+RAG 搭建 AI 知识库，3 小时落地

核心需求

技术选型

核心代码（简化版）

部署步骤

场景 3：端侧部署——将 AI 模型轻量化，适配手机/IoT 设备

核心需求

技术选型

核心步骤（含代码片段）

四、AI Infra 的发展趋势：2026 年必看的 3 个方向

1. 轻量化 + 端侧化：AI 从'云端'走向'身边'

2. 模块化 + 低代码：人人都能做 AI 开发

3. 多模态 + 智能体：AI Infra 需要更强的协同能力

五、学习 AI Infra 的避坑指南：新手必看

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具