
LLM 核心架构:程序员大语言模型技术指南
面向程序员提供大语言模型(LLM)技术指南,涵盖基础能力运用、应用架构设计及特定场景高级应用。内容涉及 Prompt 编写与管理、LLM 友好型流程设计、插件化与智能体架构、矢量数据库及本地小模型部署。文章探讨了直接 Prompt、知识外挂与微调三种模式,并强调上下文工程在提升模型输出准确性中的核心作用,旨在帮助开发者构建私有化 LLM 应用及实现 AI 原…
博客作者
非主流
339
已发布文章
12K
博客获赞
797K
博客浏览
第 17 页

面向程序员提供大语言模型(LLM)技术指南,涵盖基础能力运用、应用架构设计及特定场景高级应用。内容涉及 Prompt 编写与管理、LLM 友好型流程设计、插件化与智能体架构、矢量数据库及本地小模型部署。文章探讨了直接 Prompt、知识外挂与微调三种模式,并强调上下文工程在提升模型输出准确性中的核心作用,旨在帮助开发者构建私有化 LLM 应用及实现 AI 原…

护网行动是由公安部牵头组织的网络安全攻防演练活动,旨在评估企事业单位的安全防御能力。活动分为国家级、省级及行业级,通常持续数周。红队模拟真实攻击者进行渗透测试,蓝队负责防守与应急响应。双方通过漏洞利用、横向移动与威胁检测进行对抗,得分情况直接影响单位评优及领导责任。该行动推动了网络安全从被动构建向业务保障刚需的转变,促进了安全体系的完善。

面向安全初学者,系统讲解电商网站漏洞挖掘方法。内容覆盖用户注册登录环节的短信轰炸、验证码绕过、任意密码重置及 URL 跳转风险;深入分析搜索框反射型 XSS、个人资料存储型 XSS 及 CSRF 攻击原理。文章补充了越权访问、SQL 注入等常见业务逻辑漏洞的识别技巧,并提供资产收集策略与合规测试建议,旨在帮助读者建立完整的漏洞挖掘思维体系,提升实战能力。

详细分析了垂直行业大模型的几种主要训练策略,包括从头重新训练、二次预训练、基础大模型微调、通用大模型结合向量知识库以及 In-Context Learning。文章深入探讨了各策略的优缺点及适用场景,特别强调了数据配比的重要性,指出二次预训练中领域数据比例应控制在 15% 以下以避免通用能力退化。此外,还分析了大模型训练面临的硬件资源成本、模型训练技巧(如精…

人工智能大模型企业综合竞争力评价涵盖市场营收、技术创新、合作生态和行业影响力四个维度。报告深入分析了大模型在工业、金融、交通、医疗和教育等领域的实际应用案例,展示了技术落地价值。同时预测了多模态大模型、知识图谱与大模型融合、强化学习与大模型融合等未来发展趋势,为政府和企业提供加强顶层设计、匹配潜力要素、健全规范保障、重视产业布局战略、构建产业生态和人才培养等…

深入探讨了大语言模型(LLM)的应用安全。首先介绍了 LLM 的基本原理,包括词嵌入、Transformer 架构及预训练与微调过程。接着分析了 LLM 的已知缺陷,如模型幻觉、逆转诅咒和遗忘中间现象。重点阐述了两大核心安全风险:提示词注入与越狱攻击,并详细解析了其构造思路。在此基础上,补充了具体的防御策略,涵盖输入验证、系统提示词加固、RAG 技术应用及对…

Kali Linux 是安全人员专用的操作系统,预装数百种工具。涵盖安装配置、基础命令、信息收集、漏洞扫描、渗透利用及无线测试等核心流程,帮助初学者掌握网络安全入门与进阶技能。

探讨基于大模型的 AI 产品架构,涵盖用户层、应用层、模型层及生成回答过程。重点分析 RAG 检索增强生成技术、提示词工程优化及垂直模型微调策略。通过人才成长阶梯比喻,阐述从算法算力到最终用户体验的转化路径,帮助开发者与产品经理理解如何在 2024 年 AI 浪潮中找到定位并构建高效 AI 应用系统。

AI 大模型是人工智能领域的核心突破,通过海量数据预训练实现通用能力。梳理了从 AI 到 AGI、AIGC 的概念区别,解析了 Transformer 架构及预训练微调流程,并分析了中美大模型竞争格局与产业化挑战。内容涵盖技术原理、行业图谱及未来发展趋势,帮助读者建立对大模型的完整认知框架。

Ollama 是一款支持在 Windows、Linux 和 MacOS 上本地运行大语言模型的工具,提供跨平台支持和丰富的模型库。 Ollama 的主要特点,包括支持自定义模型参数、多 GPU 并行推理及上传私有模型等功能。内容涵盖 Windows、Mac 和 Linux 系统的详细安装步骤,包括脚本安装、二进制安装及服务配置。此外,还列出了常用的命令行指令…

在本地环境中部署 Ollama 服务、下载 Llama3.1 模型以及通过 Open WebUI 构建图形化界面的完整流程。内容涵盖软件安装、依赖配置、模型拉取及界面访问,解决了 Windows 家庭版无法使用 Docker 时的替代方案,帮助用户快速实现私有化大模型运行。

叶梓老师分享了 DeepSeek 多模态大模型 Janus 的部署与效果验证,重点展示其图生文、文生图和跨模态理解能力,并介绍了 Janus-Pro 的核心特点、架构思路以及 1B/7B 两种版本的适用场景。
Oracle 数据库使用 CONNECT BY PRIOR 子句实现层级数据查询。语法包含 START WITH 定义根节点、CONNECT BY 定义父子关系连接条件、WHERE 过滤结果。通过组织 ID 与父 ID 关联存储树形结构,可检索整棵树或特定分支。支持层号标记及 ORDER BY 排序。该机制基于深度优先搜索逻辑遍历节点,适用于组织架构等层级数…
针对 PHP 原生数据库查询中的 SQL 注入风险和 N+1 查询性能瓶颈进行优化。通过引入预处理语句防止注入攻击,利用批量查询替代循环内单条查询,减少数据库交互次数。重构后的代码在保障业务逻辑不变的前提下,显著提升了系统的安全性和响应速度。

针对多账号朋友圈运营痛点,介绍了一套支持批量发送图文视频及定时任务的解决方案。核心功能包括主号到子号的自动跟圈同步、延时评论互动以及任务列表管理。通过自动化流程替代手动操作,有效降低时间成本与设备存储压力,实现高效的内容分发与粉丝维护。

VMware vSAN 7.0 在 vSphere 环境中的设计与部署涉及系统要求确认、容量规划及最佳实践应用。内容面向熟悉 ESXi 和 vCenter 的管理员,提供从硬件选型到集群配置的关键步骤指引。

kubectl 创建优先级类涉及 cobra 命令注册、参数解析及执行逻辑。核心结构体 PriorityClassOpts 封装配置选项,通过 NewCmdCreatePriorityClass 初始化命令。执行时先调用 Complete 方法完成参数校验与生成器选择,再进入 Run 方法提交请求。代码展示了从命令行参数到 API 对象转换的关键路径,遵循标…

Flutter 混合开发主要探讨在已有原生 App 中嵌入 Flutter 页面的两种方案:统一管理模式和三端分离模式。早期团队多采用统一管理,但随着业务迭代,该模式因代码耦合严重、工具链耗时增长导致效率降低。后续团队倾向于使用三端代码分离模式进行依赖治理,以实现更好的工程化效果。
TSDK 是一款针对淘宝开放平台及登录场景的爬虫 SDK。当前版本为第二版,重点优化了通用类、开放平台类及 H5API 类的实现方式。通过移除繁杂的配置文件,改为直接请求 URL 或动态传递参数构建,解决了原有臃肿问题并提升灵活性。文中提供了基于 Python 的调用示例,展示获取 Umid Token 及扫码登录流程。目前日志功能和请求重放等功能尚未完成。