zhang 的博客文章 | 极客日志

SQLAI算法

LLM Agent 数据库应用设计：Text-to-SQL 主流方案解析

深入分析了 LLM Agent 在数据库应用中的核心任务 Text-to-SQL。介绍了 C3 的 Zero-shot 方案及其 Clear Prompting 策略，探讨了 SQL-Palm 的微调优势，并重点阐述了 BIRD 数据集揭示的现实挑战，如领域知识与表结构描述的重要性。文章最后总结了指令微调中数据质量的关键作用，为构建高质量 NL2SQL 系统…

发布于 2025/2/738 浏览0 点赞

编程语言AI算法

PythonAI算法

大语言模型（LLM）初学者入门教程与学习路线指南

梳理了大语言模型（LLM）入门所需的基础知识体系，涵盖数学基础、开发框架及 Transformer 原理。详细介绍了提示工程、RAG、微调、从零训练及部署优化等核心技术栈。同时提供了系统的四阶段学习路径，从基础理解到 API 应用、架构实践及私有化部署，帮助开发者建立完整的 LLM 技术认知并规划进阶方向。

发布于 2025/2/741 浏览0 点赞

PythonAI算法

LLM 大模型应用落地与优化：评测体系构建指南

探讨了大模型应用落地中的评测体系构建。涵盖离线与在线评测流程、核心指标定义（回复效果、工具召回、耗时等）、自动化评测方案（规则验证、模型打分、神经网络）。同时提供测试集收集策略、抽样方法及 AB 测试建议，旨在通过持续评测优化提升业务效果，避免无限投入。

发布于 2025/2/741 浏览0 点赞

RustAI算法

LLM 推理加速框架 Text Generation Inference (TGI) 使用指南

Text Generation Inference (TGI) 是 Hugging Face 推出的用于部署和服务大型语言模型的开源工具。它支持张量并行、连续批处理、多种量化方案及 Flash Attention 优化。 TGI 的核心功能、本地编译安装步骤（基于 Rust）、Docker 部署方式、模型运行参数配置以及性能基准测试方法。通过 TGI，开发者…

发布于 2025/2/742 浏览0 点赞

编程语言AI算法

大型语言模型（LLMs）的训练原理与网络架构解析

生成式人工智能和大型语言模型的基本概念及应用场景，详细阐述了 LLM 的训练流程，包括数据收集、标记化及监督微调。重点分析了模型计算所需的硬件资源，并深入探讨了数据并行、模型并行、流水线并行和张量并行四种训练策略及其对网络通信的影响。最后结合网络工程师视角，解析了 LLM 训练对网络带宽、延迟及拓扑结构的具体要求，为构建高效智算网络提供技术参考。

发布于 2025/2/733 浏览0 点赞

编程语言AI算法

Meta Llama3 模型技术解析与在线体验指南

Meta 发布了开源大语言模型 Llama3，包含 8B 和 70B 参数版本。模型基于 Transformer 架构，经过指令调优，在基准测试中表现优异，部分场景超越 GPT-4。 Llama3 的技术特点、三种在线体验方式（英伟达开发者网站、HuggingFace、官方演示）以及中文能力现状。同时分析了上下文窗口限制，并提供了本地部署的基本思路及代码示例…

发布于 2025/2/745 浏览0 点赞

PythonAI算法

大模型基础知识：分词与提示工程详解

大模型的基础知识，重点讲解了分词技术（包括基于空格的分词、Byte Pair Encoding 及 Unigram 模型）及其在 Unicode 环境下的处理策略。内容涵盖上下文学习（In-Context Learning）的原理，以及提示工程（Prompt Engineering）的核心设计原则、常用手段（零样本、少样本、思维链、检索增强）和进阶技巧（角色…

发布于 2025/2/637 浏览0 点赞

PythonAI算法

国内大模型公司面试经历与技术复盘

详细记录了 2023 年期间国内多家大模型公司的面试经历，涵盖智元机器人、面壁科技、Minimax、阿里、百度、月之暗面等 24 家企业。文章总结了各公司的面试轮次、考察重点及最终结果，并梳理了高频技术考点，包括多头注意力机制、Transformer 架构细节、大模型训练技巧、数据预处理及评估方法。此外，还补充了关于底层知识、RLHF 方向及通用面试准备的建…

发布于 2025/2/640 浏览0 点赞

PythonAI算法

大模型 LLM 学习路线图全面解析与核心技能指南

深入解析了大模型（LLM）的技术体系与学习路径。内容涵盖大模型的定义与分类，包括自然语言处理、计算机视觉及多模态模型。重点梳理了从系统设计、提示词工程到平台开发、知识库构建、微调训练及行业应用的全栈学习路线。旨在帮助开发者掌握核心技能，理解底层原理，适应 AI 重构软件行业的趋势。文章详细阐述了七阶段学习法，针对不同背景人群提供差异化建议，并总结了全栈工程实…

发布于 2025/2/643 浏览0 点赞

编程语言AI算法

DeepSeek 常见误读与行业影响分析

对 DeepSeek 引发的舆论热潮，剖析了五大核心误读。首先澄清其能力并未全面超越头部竞品，其次反驳无脑贬低蒸馏论调，指出成本优势源于工程优化而非单纯低价。接着区分 App 与开源生态的合规差异，最后强调其对行业迭代效率的加速作用及潜在的黑灰产风险。文章旨在提供客观理性的认知视角，避免盲目跟风，并展望了开源模式对全球 AI 格局的影响。

发布于 2025/2/640 浏览0 点赞

编程语言WeChatPay大前端java

程序员副业赚钱的九种途径与实战建议

详细分析了程序员实现副业收入的九种主要途径，包括接私活、卖资料、写文章、写书、联盟计划、培训班、写插件页面、运营微信公众号以及投资自己。文章针对每种途径提供了具体的操作建议、所需技能、潜在风险及注意事项，强调了时间规划、降低边际成本、版权意识及流量积累的重要性。核心观点指出，无论选择何种路径，提升自身技术实力和经营能力才是根本，新手应先沉淀积累，避免本末倒置…

发布于 2025/2/641 浏览0 点赞

PythonAI算法

LLM 大模型基础篇（一）：大模型核心概念与原理介绍

大模型指拥有庞大参数数量的深度学习模型，通过海量数据训练获得强大的学习与生成能力。文章介绍了 ChatGPT 与底层模型的区别，阐述了大模型的参数规模与数据需求，解析了从文本编码、向量化到预测下一个词的生成机制。重点讲解了预训练、有监督与无监督学习的概念，以及 Transformer 架构中的自注意力机制。此外，还探讨了监督微调（SFT）与基于人类反馈的强化…

发布于 2025/2/643 浏览0 点赞

PythonAI算法

Python 爬虫技术快速入门

Python 爬虫技术的快速入门指南。内容涵盖 Python 基础语法、requests 网络请求库的使用、BeautifulSoup 数据解析方法、正则表达式匹配技巧以及 Selenium 浏览器自动化操作。文章通过具体代码示例讲解了 GET/POST 请求、标签查找、CSS 选择器、元素定位及模拟鼠标操作等核心技能，并补充了遵守 robots.txt 协…

发布于 2025/2/639 浏览0 点赞

PythonAI算法

2024 LLM 领域核心术语盘点：从 MoE 架构到 o1 推理范式

盘点了 2024 年大语言模型领域的关键技术术语，涵盖 MoE 混合专家架构、Agent 智能体应用、Sora 视频生成、GraphRAG 检索增强生成以及 GPT-4o 多模态模型。重点分析了 o1 推理模型带来的训练时与测试时计算量变化，详细解释了 ORM、PRM、PPO、DPO、GRPO 等强化学习与偏好优化算法的原理与应用场景。文章梳理了 Self-…

发布于 2025/2/637 浏览0 点赞

编程语言AI算法

大模型基本概念详解：定义、分类与发展历程

大模型是具有大规模参数和复杂计算结构的机器学习模型，通常由深度神经网络构建。文章解析了大模型与小模型的区别，重点阐述了涌现能力这一核心特征。内容涵盖大模型发展历程，从 CNN 到 Transformer 架构的演变，以及当前预训练阶段的特点。同时介绍了语言、视觉及多模态大模型的分类方式，并区分了通用、行业与垂直大模型层级。最后详细说明了模型泛化能力与微调技术…

发布于 2025/2/645 浏览0 点赞

Python算法

Python 安全密码处理：生成、哈希与存储最佳实践

Python 安全密码处理涉及输入获取、随机生成、加密哈希存储及密钥管理。 getpass 安全输入、secrets 强密码生成、bcrypt/argon2 哈希方案、salt 盐值作用、dotenv 环境变量及系统密钥环存储方法。同时补充传输层安全、JWT 令牌处理、防时序攻击及审计日志规范，提供完整的凭据安全最佳实践指南，帮助开发者构建安全的身份验证系统…

发布于 2025/2/637 浏览0 点赞

Pythonjava算法

网络安全系统学习路线：从基础到实战的完整指南

提供从零开始的网络安全学习路径，涵盖法律法规、Linux 与网络基础、Web 开发技术、数据库操作及 Python 自动化。重点讲解渗透测试核心内容，包括 SQL 注入、XSS、CSRF 等常见漏洞原理与防御，以及系统加固、应急响应和等级保护流程。适合希望进入网安行业的初学者构建知识体系。

发布于 2025/2/640 浏览0 点赞

编程语言

护网行动与红蓝对抗技术详解

护网行动是由公安部牵头的网络安全评估活动，旨在通过红蓝对抗演练提升企事业单位的安全防御能力。文章详细介绍了护网的分类、时间周期、评分规则及影响，并深入解析了红队攻击模拟与蓝队防守策略的核心技术流程，包括信息收集、漏洞利用、横向移动以及日志分析、威胁检测等关键防御手段。

发布于 2025/2/636 浏览0 点赞

PythonAI算法

2024 中国“大模型 + 数据分析”最佳实践案例 TOP10 发布

发布了 2024 年中国'大模型 + 数据分析'十大最佳实践案例，涵盖零售、制造、金融、政务、通信、能源等多个行业。文章分析了大模型如何通过自然语言交互、代码生成和自动化分析改变数据消费方式，重点介绍了 ChatBI 架构及数据治理的重要性。入选案例包括波司登、长安汽车、京东零售等企业的实际应用，展示了从生成类到决策类应用的落地路径。评选基于价值性、实用性、…

发布于 2025/2/641 浏览0 点赞

zhang

发布的文章