
Python 数据可视化的 3 个核心步骤
Python 数据可视化包含确定问题选择图形、转换数据应用函数、参数设置三个核心步骤。常用库有 Matplotlib、Seaborn、Bokeh 等。Matplotlib 提供底层绘图能力,需配置 Figure、Subplot 及样式参数。Pandas 封装了基于 Matplotlib 的高级接口,简化 Series 和 DataFrame 的绘图流程。数据…
博客作者
日系少女
334
已发布文章
13K
博客获赞
661K
博客浏览
第 16 页

Python 数据可视化包含确定问题选择图形、转换数据应用函数、参数设置三个核心步骤。常用库有 Matplotlib、Seaborn、Bokeh 等。Matplotlib 提供底层绘图能力,需配置 Figure、Subplot 及样式参数。Pandas 封装了基于 Matplotlib 的高级接口,简化 Series 和 DataFrame 的绘图流程。数据…

WPScan 漏洞扫描工具的安装配置、API Token 获取、常用命令选项及实战技巧。内容涵盖 WordPress 安全背景、工具原理、枚举策略、暴力破解方法及进阶配置。文章提供了具体的命令行示例,包括用户枚举、插件检测、主题扫描及输出格式设置。同时补充了常见问题排查、WAF 绕过策略及法律合规声明,旨在为安全研究人员提供全面的技术参考。

国外主流的网络安全与黑客技术论坛及新闻资源。涵盖 GreySec、Hack Forums、0x00sec 等讨论社区,以及 Threatpost、The Hacker News 等资讯平台。内容涉及漏洞分析、恶意软件研究、逆向工程及行业情报。旨在为安全研究人员提供信息获取渠道,同时强调合法合规使用的重要性。

探讨了 AI 技术对劳动力市场的影响,分析了 1639 种职业的替代风险,指出年龄与替代率的相关性。介绍了程序员开展副业的精益方法,包括核心资源识别、时间片管理及资产构建。阐述了一人企业方法论,帮助个体从螺丝钉成长为超级个体。讨论了 AI 产品经理的稀缺性及团队组建策略,分析了创新者窘境在 AIGC 领域的适用性。最后详细解读了大模型高效训练的 10 条黄金…

记录了从零预训练 1B 参数中文大语言模型 Steel-LLM 的全过程。涵盖数据收集清洗、训练框架优化、模型结构改进(Soft MoE、SENet)、分布式训练策略及微调评估。重点分享了工程实践中的显存优化、算子融合技巧、数据恢复机制及硬件受限下的解决方案。最终模型在 C-Eval 和 CMMLU 基准测试中取得了优于同类早期模型的成绩,为资源受限场景下的…

AI 大模型行业正处于快速发展期,涵盖基础设施、模型及应用三层产业链。行业现状、挑战及国内外公司布局,探讨了智能客服、代码辅助等应用场景。同时提供了从系统设计、提示词工程到微调开发的七阶段学习路径,涵盖 LangChain、RAG 技术及多模态应用,旨在帮助开发者掌握大模型全栈技能并应对实际项目需求。

使用 Text Generation WebUI 对大语言模型进行 LoRA 微调的完整流程。内容包括 LoRA 原理、环境搭建、Alpaca 格式数据集准备、训练参数配置及推理验证步骤。文章提供了具体的代码示例和常见故障排查方案,旨在帮助开发者以低成本实现大模型的垂直领域定制。

GPT-4o 是 OpenAI 发布的最新全能型 AI 模型,命名中的 o 代表 Omni。其核心突破在于实现了文本、音频和图像的统一处理,响应速度达到毫秒级,接近人类对话水平。文章详细解析了 GPT-4o 的技术架构、性能指标及在实时翻译、客户服务、教育辅导等领域的实际应用。同时探讨了免费开放策略对行业的影响,以及面临的算力成本和安全伦理挑战,为开发者提供…

大语言模型的基础原理、提示工程技术、应用开发方法及高级场景。涵盖 Transformer 架构、Tokenization、零样本与少样本提示、思维链推理、API 调用与 LangChain 框架、检索增强生成(RAG)、模型微调(LoRA)及自主 Agent 系统。文章还讨论了模型安全与伦理问题,并展望了多模态与 AIOS 生态的未来趋势,旨在帮助开发者掌握…

大模型(LLM)在企业中的应用涵盖九大核心场景,包括替代自建 ML 模型、整合分散数据、构建聊天界面、增强搜索体验、实现客户自助服务、定制化沟通、加速应用开发、生成代码整合后端系统。文章详细阐述了各场景的技术实现路径,如 RAG 架构、Agent 代理模式及函数调用机制,并指出了幻觉、数据安全、成本延迟等关键挑战,为企业提供了从评估到落地的实施建议。

详细阐述从零构建并训练 BERT 架构大模型的完整流程。内容涵盖使用 Hugging Face tokenizers 库定制 WordPiece 分词器,配置 BertLMHeadModel 模型结构,利用文本语料进行预训练,以及完成后的推理测试。通过完整代码示例展示从环境准备、分词器保存、模型加载到训练参数设置的全过程,深入解析分词步骤、模型配置及训练策略…

Prompt 提示工程的基础原理与实践方法。首先阐述了 Prompt 工程的概念,即通过精细调整 AI 输入以获得符合需求的输出。接着分析了 Prompt 的主要类型,包括问题式、陈述式、指令式及情感传入式,并探讨了 Prompt 工程师的职责与所需技能。文章重点讲解了零样本、少样本、思维链、模板式等核心提示技术,并提供了具体示例。此外,还总结了进阶技巧如明…

LangChain 中 OutputParser 的使用方法和基于 LCEL 构建链的技术。内容涵盖为何需要输出解析器、CommaSeparatedList 和 Pydantic 解析器的代码实践、JSON 及正则解析器的应用场景。重点阐述了 LCEL 表达式语言如何通过管道符组合组件,对比了传统 invoke 调用与 LCEL 链的差异,并补充了流式输出、…

大模型时代 Java 开发者面临生态工具匮乏挑战,LangChain4j 提供了统一的 API 接口与丰富的工具集,简化了大模型集成流程。文章详细阐述了 LangChain4j 的核心架构,包括模型适配、向量存储支持及内存管理。通过实战代码演示了基础对话、结构化信息提取、检索增强生成(RAG)系统及智能体(Agent)的开发步骤。同时涵盖了 Spring B…

基于 LangChain 框架构建 Agent 的方法。内容涵盖自定义 Tool 的两种实现方式(继承 BaseTool 类和装饰器),以及构建数学计算 Agent 的完整流程。包括工具定义、Toolkit 管理、LLM 初始化、Prompt 模板设计、Agent 创建与执行。文章还提供了边界测试案例及最佳实践建议,如工具描述准确性、参数类型约束和错误处理,…

详细阐述了 AI 大模型开发的转行路径与核心技术栈。内容涵盖机器学习与深度学习理论基础、Python 高级编程、数据处理与可视化、PyTorch 与 TensorFlow 框架实战、Transformer 架构与微调技术、模型部署优化方案以及职业发展建议。文章提供了具体的代码示例与工程实践指导,帮助开发者系统掌握从模型训练到服务上线的全流程技能,为求职与项目…

提出了一种名为 ENGINE 的高效微调方法,旨在解决大型语言模型在文本图数据处理中的效率挑战。该方法通过在 LLM 每一层旁引入轻量级 GNN 侧结构(G-Ladder),实现了文本语义与图结构的深度融合,同时冻结 LLM 参数以减少计算开销。实验表明,ENGINE 在 Cora、WikiCS 等多个数据集上性能优于现有 SOTA 方法,训练速度提升 12…

基于 LoRA 技术对 Stable Diffusion 多模态大模型进行微调的完整流程。内容包括数据收集与爬虫实现、训练环境配置、模型训练脚本参数详解、推理阶段 LoRA 权重的加载与动态调整,以及多 LoRA 模型融合的方法。通过具体代码示例展示了如何从原始模型出发,利用少量样本训练出特定风格的生成模型,并提供了常见问题排查与最佳实践建议,旨在帮助开发者…

AI 产品经理需兼具技术理解与产品思维。梳理了从机器学习基础、数据管理到编程技能的必备知识体系,并强调沟通协作、用户体验设计及伦理合规的重要性。通过掌握监督学习、无监督学习等核心概念,结合 Python 实践与敏捷开发方法,从业者可有效提升产品落地能力。文章提供了系统的成长路径建议,涵盖行业趋势分析与案例研究,旨在帮助技术人员或转型者构建完整的 AI 产品能…

AI 产品经理作为连接技术与市场的桥梁,需具备产品思维与技术理解力。梳理了从 Python 编程、机器学习、深度学习到项目管理的完整知识体系,涵盖竞品分析、PRD 撰写及模型验收等关键环节,旨在为从业者提供清晰的职业规划与技能提升指南。