XiaoPingzi 的博客文章

Python

Python 爬虫实战：使用 Requests 与 Parsel 下载图片

使用 Python 的 requests 和 parsel 库进行网页数据抓取的基本流程。通过浏览器开发者工具分析网络请求，获取接口参数，编写代码模拟请求并解析返回的 JSON 数据，最终将图片保存到本地。示例涵盖了环境配置、模块安装、请求发送、数据解析及文件保存等步骤，适用于学习网络爬虫基础技术。

发布于 2025/2/736 浏览0 点赞

PythonAI算法

零基础到精通 AI 大模型：详细学习路线与实践技巧

AI 大模型学习需要扎实的数学与编程基础。梳理了从线性代数、Python 编程到机器学习、深度学习框架的完整路径。涵盖数据处理、模型训练、微调及伦理规范，提供实践项目建议与社区参与方式，帮助初学者系统掌握大模型技术。

发布于 2025/2/740 浏览0 点赞

编程语言AI算法

AI 大模型入门指南：理解原理与高效提示词技巧

国内主流大模型的使用场景及工作原理，重点解析了基于概率预测的生成机制。通过身份设定、明确关键词、多轮迭代等核心技巧，帮助用户优化与大模型的交互效果。同时补充了少样本学习与思维链等进阶方法，旨在提升用户在大模型应用中的实际产出质量，避免常见误区。

发布于 2025/2/737 浏览0 点赞

编程语言AI算法

生成式 AI 对企业的影响、应用场景及实现路径解析

生成式 AI 通过学习大量原始内容生成新数据，为企业带来创新机会与自动化潜力。2023 年是中国大模型发展元年，通用大模型快速迭代推动市场发展。企业重点转向投资回报率用例，从低风险内部场景向核心业务场景部署。生成式 AI 将在内容消费、生成及技术创造领域产生颠覆模式。大模型趋势包括模型瘦身、开源挑战闭源、领域垂直化、商业化、监管加强、多模态拓展及 AI Ag…

发布于 2025/2/745 浏览0 点赞

PythonAI算法

从零构建大模型：核心原理与实战指南

从零构建大型语言模型（LLM）的核心流程与技术细节。内容涵盖 Transformer 架构解析、数据预处理与分词策略、预训练与微调方法、以及模型评估与部署。通过理论讲解与代码示例，帮助读者深入理解 LLM 的工作原理，掌握从设计到落地的关键技术步骤，适用于希望深入了解人工智能底层机制的开发者。

发布于 2025/2/737 浏览0 点赞

Kotlinjava

Kotlin 类、对象和接口：定义类继承结构

详细讲解了 Kotlin 中类继承结构的核心概念。内容包括接口的定义、多接口实现及默认方法冲突解决；open、final、abstract 等修饰符的使用机制及其与 Java 的区别；可见性修饰符 public、internal、protected、private 的作用范围及编译差异；嵌套类与内部类的区别及序列化注意事项；以及密封类 sealed 如何限制…

发布于 2025/2/745 浏览0 点赞

PythonAI算法

深入理解 Token：自然语言处理中的文本最小单元

Token 是自然语言处理中处理文本的最小单元，可以是单词、子词或字符。解析了 Token 的定义、拆分机制及 Token/s 性能指标，对比了不同模型对 Token 的处理差异，并介绍了常见的分词算法如 BPE 和 WordPiece，最后通过 Python 代码示例演示了如何计算文本的 Token 数量。

发布于 2025/2/742 浏览0 点赞

PythonAI算法

中科大等研究发现：大模型不看图也能回答视觉问题

中科大等团队发现现有大模型在视觉基准测试中表现优异可能源于数据泄露或题目本身无需看图。研究指出评估样本缺乏视觉依赖性及训练数据泄露是两大主因。为此团队提出 MMStar 新基准，包含 1500 个高视觉依赖性样本，并引入多模态增益与泄露指标。实测显示 GPT-4V 等新模型在精细感知、逻辑推理等维度仍未及格，揭示了当前多模态评估的不足及改进方向。

发布于 2025/2/740 浏览0 点赞

PythonAI算法

微软利用 GPT-4 进行指令微调，新任务零样本性能显著提升

微软研究院在论文《Instruction Tuning with GPT-4》中首次采用 GPT-4 作为教师模型进行指令微调。研究构建了包含 52k 中英文指令遵循数据及比较反馈数据的集合，基于 LLaMA 7B 训练了 LLaMA-GPT4 和 LLaMA-GPT4-CN 模型，并开发了奖励模型。实验通过人类评估、GPT-4 自动评估及非自然指令测试验证…

发布于 2025/2/739 浏览0 点赞

PythonAI算法

AI 大模型学习路线全面解析：从理论到实践

AI 大模型是人工智能领域的重大突破，基于海量数据预训练，具备强大的语言理解和生成能力。解析大模型的核心技术原理、应用场景及产业价值，并提供了从零开始的学习路径，涵盖数学基础、Transformer 架构、提示词工程、RAG 检索增强生成、微调技术及部署优化等内容，帮助读者系统掌握大模型开发技能，应对行业变革。

发布于 2025/2/735 浏览0 点赞

编程语言SaaSWeChatjava

20 道产品经理经典面试题深度解析与应对策略

20 道产品经理常见面试题，涵盖自我介绍、职业规划、核心能力、项目经验及竞品分析等维度。针对每道题提供回答思路与范例，帮助求职者梳理逻辑，展现用户思维、数据驱动及跨部门协作能力。内容包含从 0 到 1 的项目复盘、优势匹配及劣势应对策略，适用于电商、SaaS 等领域产品岗位的面试准备。文章还补充了需求变更处理、路线图制定、技术冲突解决等实战场景问题，旨在全面…

发布于 2025/2/655 浏览0 点赞

编程语言Node.jsAI算法

RAG 实践指南：利用 Ollama+AnythingLLM 搭建本地知识库

如何利用 Ollama 和 AnythingLLM 搭建本地 RAG 知识库。首先阐述了 RAG 技术的原理及其相对于传统 LLM 的优势，随后详细演示了 Ollama 环境的安装、Qwen2.5 模型的拉取与运行，以及 AnythingLLM 的部署与配置流程。文章涵盖了服务器模式启动、嵌入模型与向量数据库的选择、知识库文件的上传与管理，并补充了进阶优化建…

发布于 2025/2/643 浏览0 点赞

PythonAI算法

Python 基础入门：核心数据类型与特性详解

Python 编程语言的主要应用场景、核心特点及语言生态地位。重点详细讲解了 Python 的标量数据类型，包括 NoneType、字符串、数值类型和布尔值的特性与用法，并通过代码示例展示了类型转换和常见操作。文章还补充了学习建议和最佳实践，旨在帮助读者建立系统的 Python 基础知识框架，适用于初学者入门及进阶参考。

发布于 2025/2/648 浏览0 点赞

编程语言AI算法

角色扮演大模型的产品设计与训练经验分享

探讨了角色扮演大模型的产品设计核心与训练实战经验。产品设计需注重角色一致性与沉浸感，区分通用助手与拟人化角色的差异，针对年轻女性及二次元用户群体优化交互体验。训练方面强调数据质量优于数量，通过丰富人设卡、小说语料及导演式生成对话来构建数据集，警惕合成数据的偏见。微调阶段建议采用全参数微调以提升用词高级感，合理配比通用与专有数据，并建立人工评估集结合线上指标进…

发布于 2025/2/639 浏览0 点赞

PythonAI算法

国内主流大模型 API 调用指南与 Python 实战

国内主流大模型平台（包括 DeepSeek、智普 AI、Kimi、字节豆包、讯飞星火、通义千问）的 Python API 接入方法。内容涵盖环境配置、SDK 安装、代码实现示例（含流式与非流式调用）、参数调优建议及安全规范。文章还总结了 API 调用的通用模式，提供了错误处理策略，并规划了从基础认知到应用开发的学习路径，旨在帮助开发者快速上手大模型开发并进行…

发布于 2025/2/637 浏览0 点赞

PythonAI算法

2025 年人工智能发展趋势与学习路径指南

2025 年人工智能发展迅速，梳理了相关趋势并提供了详细的大模型学习路径。内容涵盖系统设计、提示词工程、平台应用、知识库开发（RAG/LangChain）、微调技术、多模态应用及行业落地七大阶段。旨在帮助开发者掌握全栈工程能力，利用大模型解决实际问题，包括数据处理、垂直训练及部署，最终提升编码与分析能力以适应行业需求。

发布于 2025/2/639 浏览0 点赞

Dart大前端

Flutter 跨平台开发学习指南：从 Dart 基础到实战项目

Flutter 跨平台开发框架的学习路径与核心技术点。内容涵盖 Flutter 的应用场景、Dart 语言基础（包括异步编程、Stream、FFI）、Flutter 核心组件（布局、容器、动画、自定义绘制）、状态管理策略、网络请求处理以及项目架构设计。文章旨在帮助开发者从零开始掌握 Flutter，通过实战案例理解 Widget 树、渲染管线及国际化等关键概…

发布于 2025/2/636 浏览0 点赞

PythonAI算法

Python 爬虫数据分析基础概念与常用库详解

Python 爬虫数据分析的核心概念、技术流程及常用工具库。内容涵盖爬虫工作原理、数据清洗与分析方法，以及 requests、BeautifulSoup、pandas 和 matplotlib 等库的实战代码示例。通过解析网页、提取数据、存储处理到可视化展示的全链路讲解，帮助读者掌握利用 Python 进行数据采集与分析的基础技能，适用于数据挖掘与商业智能场…

发布于 2025/2/647 浏览0 点赞

编程语言

信息系统安全等级保护定级流程、方法及注意事项

详细阐述了信息系统安全等级保护（等保）的定级概念、核心意义及实施流程。内容涵盖从确定定级对象到公安机关备案的五个关键步骤，对比了自上而下与自下而上的定级方法，并强调了客观性、适用性等原则。此外，文章补充了不同安全等级的具体技术要求与管理要求，指出了动态复核、协同建设及常见误区等注意事项，旨在帮助读者全面理解等保合规工作，构建完善的网络安全防护体系。

发布于 2025/2/633 浏览0 点赞

XiaoPingzi

发布的文章

Python 爬虫实战：使用 Requests 与 Parsel 下载图片

AI 产品经理核心技能体系与职业成长路径

零基础到精通 AI 大模型：详细学习路线与实践技巧

AI 大模型入门指南：理解原理与高效提示词技巧

生成式 AI 对企业的影响、应用场景及实现路径解析

从零构建大模型：核心原理与实战指南

Kotlin 类、对象和接口：定义类继承结构

深入理解 Token：自然语言处理中的文本最小单元

中科大等研究发现：大模型不看图也能回答视觉问题

微软利用 GPT-4 进行指令微调，新任务零样本性能显著提升

AI 大模型学习路线全面解析：从理论到实践

20 道产品经理经典面试题深度解析与应对策略

RAG 实践指南：利用 Ollama+AnythingLLM 搭建本地知识库

Python 基础入门：核心数据类型与特性详解

角色扮演大模型的产品设计与训练经验分享

国内主流大模型 API 调用指南与 Python 实战

2025 年人工智能发展趋势与学习路径指南

Flutter 跨平台开发学习指南：从 Dart 基础到实战项目

Python 爬虫数据分析基础概念与常用库详解

信息系统安全等级保护定级流程、方法及注意事项