小熊软糖的博客文章

编程语言AI算法

LLM 数据工程解析：从预训练到 RAG 的实战策略

探讨大语言模型（LLM）的数据工程核心方法。涵盖预训练、增量预训练（DAPT）、监督微调（SFT）及检索增强生成（RAG）四个阶段。详细阐述了通用文本与专用文本的收集清洗流程，包括质量过滤、去重、隐私去除等步骤。针对研发场景，分析了指令格式构建、领域知识融合及 Prompt 工程策略。强调数据质量对模型性能的决定性作用，并提出 Prompt、微调与知识库的协…

发布于 2025/2/721 浏览0 点赞

PythonNode.jsAI

LLM 生态下爬虫程序的现状与未来

对比分析了 LLM 生态下的两类爬虫框架。第一类是以 Jina Reader 为代表的传统爬虫增强方案，利用 Puppeteer 和 Readability 将网页解析为 Markdown，适合标准化内容提取。第二类是以 ScrapeGraphAI 为代表的 LLM+Agent 工作流方案，基于 LangChain 构建可编排的 Graph，支持复杂的信息抽…

发布于 2025/2/730 浏览0 点赞

编程语言AI算法

转行 AI 产品经理：如何利用比较优势找到最优赛道

探讨了从传统岗位转型为 AI 产品经理的策略。首先引入经济学中的比较优势理论，指导从业者基于现有行业经验和技能积累寻找差异化竞争点，避免从零开始。其次分析了 AI 产品经理岗位的细分趋势，涵盖应用层、平台层及垂直领域专家方向，并明确了提示词工程、RAG 技术及模型评估等核心能力要求。最后提出行动建议，强调在实践中学习的重要性，鼓励通过最小可行性项目、参与开源…

发布于 2025/2/730 浏览0 点赞

PythonAI算法

探索 LoRA 低秩适应技术：提升大语言模型微调效率的方法

大语言模型微调面临资源消耗巨大的挑战，传统全量微调需更新所有参数。LoRA（Low-Rank Adaptation）通过引入低秩矩阵分解，仅训练少量旁路参数，显著降低显存与计算成本。 LoRA 数学原理、基于 HuggingFace PEFT 库的实现流程及超参数配置策略，对比全量微调与量化微调的优劣，为垂直领域模型部署提供高效解决方案。

发布于 2025/2/728 浏览0 点赞

编程语言AI算法

使用 Ollama + AnythingLLM 搭建本地知识库

如何使用 Ollama 和 AnythingLLM 搭建本地知识库。首先阐述了 RAG 技术的原理及其与 LLM 的关系，随后提供了详细的软硬件环境准备指南。核心内容包括 Ollama 的安装与模型拉取、AnythingLLM 的配置与连接、知识库工作空间的创建及文档上传流程。文章还补充了常见问题排查方法，如连接失败、内存优化、检索效果调优及数据安全措施，旨…

发布于 2025/2/628 浏览0 点赞

PythonAI算法

基于 LangChain 搭建本地知识库系统

如何利用 LangChain 框架结合检索增强生成（RAG）技术构建本地知识库。内容涵盖 RAG 原理、LangChain 依赖安装、Embedding 模型配置、向量数据库（Chroma）存储与检索流程，以及完整的代码实现示例。通过该方案，可解决大语言模型知识滞后及私有数据安全问题，实现基于最新或私有数据的准确问答。

发布于 2025/2/628 浏览0 点赞

PythonAI算法

使用大语言模型从零构建知识图谱

利用大语言模型从零开始构建知识图谱的完整流程。首先配置本地开源模型如 Ollama，提取数据集结构定义节点属性。接着通过提示词工程引导模型生成节点定义与关系三元组，并引入重试机制确保稳定性。随后构建 Cypher 查询模板，验证语法后加载数据至 Neo4j 图数据库。该方法展示了如何自动化处理非结构化业务数据，为设计自定义 GraphRAG 系统提供基础方案…

发布于 2025/2/625 浏览0 点赞

编程语言WeChatAI

抖音小说推文项目操作流程：利用解压视频实现变现

抖音小说推文项目的完整操作流程。项目核心是通过制作解压视频配合有声小说，引导用户搜索关键词下载 APP 实现变现。内容包括账号准备、工具使用（右豹、豆包、剪映）、实操步骤（获取链接、生成关键词、配音、剪辑去重、发布回填）以及运营优化策略。文章强调了规避版权风险、提升转化率的技巧，并说明了拉新奖励与阅读分成的变现模式，适合希望从事自媒体副业的用户参考。

发布于 2025/2/626 浏览0 点赞

PythonAI算法

28 岁转行 Python：可行性分析与学习路径指南

28 岁程序员转行 Python 的可行性，探讨了年龄因素与职业方向选择。内容涵盖 Python 语言优势、基础语法到进阶特性的学习路线，以及 Web 开发、数据分析等专项技能培养。提供了实战项目建议与职业发展策略，包括简历优化、面试准备及持续学习计划，旨在帮助读者建立清晰的技术成长路径与职业转型规划。

发布于 2025/2/636 浏览0 点赞

编程语言

50 个渗透测试常用安全术语详解

50 个渗透测试与安全领域的核心术语，涵盖渗透测试类型、网络攻击手段、安全工具及防御技术。内容涉及黑盒白盒测试、SQL 注入、XSS、DDoS 等常见漏洞，以及红蓝对抗、社会工程学等攻防概念。通过解析这些名词及其防御策略，帮助读者建立系统的网络安全知识体系，提升对潜在威胁的识别与应对能力，为构建更安全的网络环境提供理论支持。

发布于 2025/2/624 浏览0 点赞

PythonAI算法

Python 新手必备的 5 个编程练习网站指南

五个适合 Python 初学者的在线练习平台，包括 LearnPython、Python 练习册、PythonPractice、500 Line or Less 以及 PYnative。这些资源涵盖基础语法、数据结构、数据分析及项目实战，提供交互式编码环境和丰富题库，帮助初学者巩固知识并提升编程能力。文章还详细阐述了各平台的特点、适用场景及高效学习策略，指导…

发布于 2025/2/621 浏览0 点赞

编程语言AI算法

7 个优质网络安全学习平台推荐，助力新手进阶

整理了 7 个主流的网络安全学习平台，涵盖实战演练、技术社区、认证培训及漏洞利用框架等方向。内容包括 Hack This Site 的基础挑战、Hack a Day 的社区资讯、Offensive Security 的专业认证、Metasploit 的漏洞利用框架、Cybrary 的系统课程、Null Byte 的技术教程以及 HITB 的行业会议资源。这些…

发布于 2025/2/628 浏览0 点赞

编程语言Nuct算法

渗透测试入门指南：零基础如何系统学习网络安全技术

渗透测试是通过模拟攻击来评估目标系统安全防护能力的过程。详细阐述了渗透测试的定义、学习战略方针及具体方法。内容涵盖编程基础的重要性、计算机领域知识储备要求、渗透测试思维模型构建以及疑难问题解决方案。同时介绍了常用工具的使用场景、实战靶场搭建建议以及职业发展方向。强调在合法合规的前提下进行技术实践，遵守网络安全法规，通过持续学习和项目积累提升实战能力，为进入网…

发布于 2025/2/636 浏览0 点赞

编程语言AI算法

AIGC 产品经理：定义、核心职责与 AI 产品经理的区别

AIGC 产品经理负责将人工智能生成内容的能力结合于公司现有业务，需具备行业洞察力与技术理解力。其工作涵盖捕捉行业动态、控制 AI 输出不确定性、预知风险并推动商业化落地。与 AI 产品经理侧重模型全生命周期管理不同，AIGC 产品经理更聚焦于应用层优化与业务赋能，无需构建底层大模型即可利用现有能力实现产品迭代。该角色要求全能型素质，包括搜索、创作、社交等多…

发布于 2025/2/620 浏览0 点赞

Shell / BashAI算法

本地部署 Ollama 大模型与 Open WebUI 离线使用指南

在本地电脑部署开源大模型无需联网即可使用 AI。介绍如何使用 Ollama 工具在 Mac、Windows 及 Linux 系统上安装并运行 Llama 等模型，结合 Open WebUI 构建类 ChatGPT 的网页界面。内容涵盖环境准备、命令行操作、Docker 部署及模型管理，确保数据隐私安全，适合希望离线体验大模型能力的开发者。

发布于 2025/2/626 浏览0 点赞

PythonAI算法

大模型高效微调：LoRA 技术原理与实战经验总结

LoRA 技术通过低秩分解显著降低大模型微调成本，使千亿参数模型在单卡环境下成为可能。基于 Sebastian Raschka 的实验经验，深入解析了 LoRA 原理、QLoRA 内存权衡、优化器选择及超参数调整策略。内容指出在有限算力下，LoRA 能以较低成本实现高效微调，并提供具体的参数配置建议与性能对比数据，强调数据质量优于数量，且多轮迭代可能引发过拟…

发布于 2025/2/628 浏览0 点赞

编程语言java算法

网络安全入门指南：从基础原理到实战进阶

网络安全入门需要系统化的学习路径。首先定义了从脚本小子到安全专家的能力分级，随后详细拆解了操作系统、网络协议、数据库、开发语言及常见漏洞原理五大基础模块。内容涵盖主流安全工具的使用、SRC 挖洞、靶场演练、CTF 比赛及护网行动等实战经验，并针对自学过程中的路线缺失、引导不足及自制力问题提供了具体的解决方案，旨在帮助初学者构建完整的知识体系与持续学习动力。

发布于 2025/2/630 浏览0 点赞

编程语言SaaSPay大前端

程序员副业接单平台推荐与避坑指南

程序员副业接单需甄别平台可靠性，优先选择有资金担保的项目。梳理了开发邦、程序员客栈、电鸭社区等主流国内外平台的优缺点及接单难度，并提供了判断项目靠谱程度的通用标准。建议开发者完善作品集，注意合同签署与分阶段收款，以保障自身权益并实现稳定增收。

发布于 2025/2/630 浏览0 点赞

编程语言AI算法

大模型提示工程实战：15 个核心技巧与策略

大模型提示工程的 15 个核心技巧，涵盖从零样本、单样本提示到思维链、模板填充及自动化提示工程等多种策略。文章阐述了每种方法的应用场景、操作要点及实际案例，旨在帮助用户通过优化提示词提升大语言模型的输出质量与准确性。内容涉及创意写作、信息检索、特定领域摘要、角色扮演等实用场景，强调了迭代测试与上下文构建的重要性，为开发者提供了系统化的提示工程实践指南。

发布于 2025/2/626 浏览0 点赞

小熊软糖

发布的文章

LLM 数据工程解析：从预训练到 RAG 的实战策略

Android 中高级开发核心面试题与解析

LLM 生态下爬虫程序的现状与未来

转行 AI 产品经理：如何利用比较优势找到最优赛道

探索 LoRA 低秩适应技术：提升大语言模型微调效率的方法

使用 Ollama + AnythingLLM 搭建本地知识库

基于 LangChain 搭建本地知识库系统

使用大语言模型从零构建知识图谱

抖音小说推文项目操作流程：利用解压视频实现变现

28 岁转行 Python：可行性分析与学习路径指南

50 个渗透测试常用安全术语详解

Python 新手必备的 5 个编程练习网站指南

7 个优质网络安全学习平台推荐，助力新手进阶

渗透测试入门指南：零基础如何系统学习网络安全技术

AIGC 产品经理：定义、核心职责与 AI 产品经理的区别

本地部署 Ollama 大模型与 Open WebUI 离线使用指南

大模型高效微调：LoRA 技术原理与实战经验总结

网络安全入门指南：从基础原理到实战进阶

程序员副业接单平台推荐与避坑指南

大模型提示工程实战：15 个核心技巧与策略