
上海交大《动手学大模型应用开发》入门指南
介绍上海交大《动手学大模型应用开发》教程,面向具备 Python 基础的开发者。内容涵盖微调部署、提示学习、知识编辑、模型安全及多模态技术。提供从基础概念到 API 开发、架构实践及私有化部署的系统路线,旨在帮助学习者掌握大模型应用构建能力,无需 GPU 环境即可入门。文章详细解析了四个学习阶段的核心知识点,包括 GPT 发展历程、API 接入代码示例、Ag…
博客作者
观照内心
355
已发布文章
10K
博客获赞
424K
博客浏览
第 17 页

介绍上海交大《动手学大模型应用开发》教程,面向具备 Python 基础的开发者。内容涵盖微调部署、提示学习、知识编辑、模型安全及多模态技术。提供从基础概念到 API 开发、架构实践及私有化部署的系统路线,旨在帮助学习者掌握大模型应用构建能力,无需 GPU 环境即可入门。文章详细解析了四个学习阶段的核心知识点,包括 GPT 发展历程、API 接入代码示例、Ag…

检索增强生成(RAG)通过整合外部知识解决大语言模型知识更新困难及幻觉问题。文章详细介绍了 RAG 的七大关键组成部分,包括自定义知识库、分块处理、嵌入模型、向量数据库等,并探讨了其在企业搜索、问答等场景的应用。此外,还梳理了从基础理解到私有化部署的大模型学习路线,旨在帮助开发者系统掌握 LLM 技术栈。

中国信通院 2024 大模型典型示范应用案例集的概况,涵盖 99 个精选案例及其在医疗、金融、政务等领域的应用分布。同时提供了系统的 LLM 大模型学习路线,包含基础理解、API 开发、架构实践及私有化部署四个阶段的核心知识点与技术栈,旨在帮助技术人员掌握大模型应用开发与治理能力。

详细阐述了构建可靠 LLM 链式架构的核心方法。内容涵盖单一模型调用的局限性分析、模块化组件设计模式、提示词工程优化策略以及健壮的错误处理机制。通过智能问答系统的实战案例,展示了预处理、LLM 调用及后处理的完整流程。此外,还探讨了重试策略、降级方案、安全隐私保护及性能优化建议,为开发者提供了一套可复用、易维护的大模型应用开发框架。

详细阐述了在内网环境中部署高德地图的完整流程。首先介绍如何使用开源工具下载指定区域的地图瓦片数据,并强调路径设置的重要性。接着说明如何获取高德离线开发包并在 Vue 项目中集成。核心部分展示了如何通过自定义 TileLayer 将地图请求指向本地静态资源,从而实现无网络依赖的地图展示。最后提供了完整的 Vue 组件代码示例,包含地图初始化、标记点、折线及文本…

通过房产中介抖音运营的实际案例,演示了如何利用 AI 大模型进行问题拆解、方案迭代及内容生成。核心方法包括明确背景信息、分步深入提问、质疑修正答案以及结构化输出表格。文章补充了提示词工程的高级技巧如少样本提示和思维链,分析了上下文丢失、幻觉等局限性及应对策略,并提供了 Python 调用 API 的自动化代码示例,帮助读者将 AI 能力集成至工作流中,提升工…

通过本地部署的 Llama3 大模型配合 Ollama 工具,实现了导航站点数据的自动化分类标记。文章详细阐述了从方案选型、环境搭建、API 调用设计到提示词优化的全过程。针对 AI 关键词导致的分类偏差问题,提出了具体的 Prompt 约束策略。提供了完整的 Python 批量处理代码示例,展示了如何调用 /api/generate 接口并解析 JSON…

LangChain 中 Vector Stores 的核心概念与使用方法。内容涵盖向量嵌入原理、相似性搜索(similarity_search)、本地保存与加载(save_local/load_local)、数据库合并(merge_from)及异步操作。详细解析了欧氏距离、余弦相似度等距离策略,并阐述了在 RAG 应用中引入向量存储以提升检索效率和 LLM…

提示工程(Prompt Engineering)的核心概念,涵盖通用人工智能与专用人工智能的区别、提示词的组成要素及设计原则。详细阐述了提示词的迭代调优方法,包括指定输出格式、上下文语境构建及约束条件设置。此外,深入解析了思维链(Chain of Thought)的原理与应用,通过算术推理示例展示如何通过分步拆解提升大模型的逻辑准确性。文章还补充了少样本提示…

利用 B 站视频评论区构建中文对话数据集的方法。通过异步爬虫获取评论数据,依据父子关系构建树状结构,提取根到叶的路径生成对话序列,并进行必要的清洗与格式化。该方法生成的数据集可用于大语言模型的指令微调或对话生成任务。实际应用中,建议结合具体业务需求进一步调整数据过滤策略,以确保数据集的质量与多样性。

梳理了大模型学习的五个进阶阶段,从概念认知到本地部署,再到 API 调用与业务集成。内容涵盖 LangChain 框架使用、Agents 与 Tools 实践、RAG 架构及多模型协同方案。同时提供了详细的学习路线图,包括概念理解、模型选择、部署策略、数据处理、推理解析及实战优化,旨在帮助开发者系统掌握 AI 大模型应用开发技能,避开常见技术坑点,实现从入门…

如何使用 Python 结合 Twilio 短信接口实现每日自动发送天气信息的方案。主要步骤包括注册 Twilio 账号获取试用号码和凭证、验证接收端号码、编写集成天气 API 查询与短信发送功能的脚本、以及配置定时任务。文中提供了完整的代码示例及部署建议,帮助开发者快速搭建自动化通知系统。

Meta Llama 3.1 模型的本地部署方案。内容涵盖环境准备、Ollama 工具的安装步骤、模型拉取与运行指令,以及基于 Docker 部署 OpenWebUI 图形界面的详细流程。文章还提供了常见问题排查指南,帮助用户解决显存不足、模型加载失败等问题,最终实现在本地安全、高效地使用开源大语言模型进行对话交互。

深入解析了大语言模型(LLM)中的幻觉现象,涵盖定义、成因、类型、度量方法及缓解策略。幻觉指模型生成看似合理但不准确的内容,源于数据差异、噪声、解码随机性及知识偏向等。主要分为内在与外在幻觉。缓解手段包括检索增强生成(RAG)、思维链提示、SelfCheckGPT 及微调对齐。文章指出幻觉在数值处理、长文本及逻辑推断中高发,并提出实践建议如引入 RAG 架构…

使用 Python 和 SQLAlchemy 库进行数据库管理,涵盖安装、模型创建、连接设置、CRUD 操作及表关联配置。补充了会话管理与事务处理的最佳实践,展示如何通过 ORM 技术在不编写 SQL 的情况下高效操作关系型数据库,并提供异常处理与资源释放的代码示例。

LangChain 中的 Chain 指链式操作,用于组合 LLM 任务。框架支持文本总结、文档问答等场景。工作流程包括文件加载、分割、向量化及检索增强生成(RAG)。项目结构包含配置、服务、UI 等模块。核心组件涵盖 Memory、Tools 和 Callbacks,适用于聊天机器人、智能体等多种应用。实际部署需注意向量数据库选择、Embedding 模型…

Prompt 工程是通过设计和优化提示词来引导大语言模型生成高质量输出的技术。 Prompt 的基本构成要素,阐述了清晰指令和思维链等核心原则,详细讲解了思维链(CoT)、思维树(ToT)及 Prompt 编写 Prompt 等高阶方法,并结合 Python 代码示例展示了角色设定与任务拆解的实践技巧,旨在帮助开发者提升与大模型的交互效率。

大模型应用开发的基础知识与实战指南。重点涵盖 Python 编程在 AI 领域的应用、OpenAI API 调用方法、LangChain 框架的使用以及提示工程技巧。通过代码示例展示了如何构建简单的智能应用,并提供了从基础概念到项目实战的学习路线建议,帮助开发者快速掌握大模型技术并应用于实际场景。

检索增强生成(RAG)通过结合检索模块与生成模型,有效提升了大语言模型在知识密集型任务中的准确性与事实性。综述了 RAG 的核心架构,涵盖 BM25、DPR、REALM 等检索技术及 T5、BART 等生成模型。重点分析了 Self-RAG、RAPTOR、RAFT 等 15 种典型框架及其在长上下文、多模态场景下的应用。文章还探讨了 RAG 在扩展性、偏见、…

Python 领域的七大核心岗位,包括开发工程师、数据分析师、运维工程师、爬虫工程师、人工智能工程师、测试工程师及游戏开发工程师。针对每个岗位,文章梳理了核心职责、所需知识结构、学习路径及代码示例,旨在为初学者提供清晰的职业进阶指南。内容涵盖 Web 开发、数据分析、自动化运维、数据采集、机器学习、自动化测试及游戏服务端开发等关键技术栈,帮助读者根据自身兴趣…