
学习大语言模型 (LLM) 应从哪个开源模型入手?
探讨了以大语言模型 (LLM) 为起点的技术学习路径,重点分析了 Meta 开源的 LLaMA 系列模型。内容涵盖 LLaMA 的架构原理、训练数据来源、基于 Hugging Face Transformers 库的代码推理示例,以及从初阶应用到高阶微调的系统化学习阶段建议,旨在帮助开发者快速掌握大模型核心技术与落地方法。
博客作者
这位作者暂未填写个人简介。
196
已发布文章
2.1K
博客获赞
26K
博客浏览
第 9 页

探讨了以大语言模型 (LLM) 为起点的技术学习路径,重点分析了 Meta 开源的 LLaMA 系列模型。内容涵盖 LLaMA 的架构原理、训练数据来源、基于 Hugging Face Transformers 库的代码推理示例,以及从初阶应用到高阶微调的系统化学习阶段建议,旨在帮助开发者快速掌握大模型核心技术与落地方法。

针对两人零和博弈任务,提出一种结合强化学习(RL)、大语言模型(LLM)与决策树(DT)的策略求解方法。该方法利用强化学习寻找现有决策树的对抗策略以暴露弱点,再通过大语言模型分析对局录像并生成改进后的决策树代码。通过迭代优化,逐步逼近纳什均衡。实验在冰壶游戏中验证了该流程的有效性,展示了自动化决策树生成的可行性及在可解释性与策略强度之间的平衡优势。

2024 年国内人工智能大模型涵盖了百度文心一言、阿里通义千问、腾讯混元、字节豆包、华为盘古、360 智脑、商汤商量、科大讯飞星火、智谱 ChatGLM、百川智能、昆仑万维天工、澜舟孟子、电信九天、中科院紫东太初、京东言犀及网易 AI 等多个头部厂商的产品。这些模型在自然语言处理、计算机视觉、多模态理解及行业应用等方面各有侧重,推动了产业数字化与智能化升级。…

Ollama 在本地部署私有大模型的方法。涵盖系统环境准备、客户端安装步骤、常用命令行操作及模型管理。详细讲解了如何通过 Modelfile 自定义模型参数,以及使用 Python SDK 和 REST API 进行程序化调用的具体代码示例。内容还包括流式输出实现、API 接口类型说明、性能优化策略及安全注意事项,旨在帮助开发者快速搭建本地 AI 推理环境并…

LLM 微调是将通用预训练模型转化为特定领域专用模型的关键技术。通过在小规模针对性数据集上进一步训练,微调能显著提升模型在垂直领域的性能、可控性和效率。文章详细解析了微调的核心概念、必要性、主要目标如领域适配与任务定制,以及相比从头训练的优势。同时分析了面临的数据质量瓶颈、灾难性遗忘及算力挑战,并补充了常见的微调策略如全量微调与参数高效微调(PEFT),为开…

详细阐述了 AI 产品经理的核心成长路径与必备技能。内容涵盖 AI 与机器学习基础、数据管理与分析、编程技能、产品管理基础、沟通领导力、用户体验设计及伦理合规等方面。文章提供了具体的学习方法与实践技巧,并针对职业转型提出了切实可行的建议,旨在帮助从业者构建系统的知识体系,提升在人工智能领域的专业能力与竞争力。

AI 行业人才需求井喷,AI 产品经理成为热门转型方向。分析行业现状、定义岗位职责,并提供从技术理解到项目实战的转行准备建议,帮助从业者把握大模型时代机遇。文章涵盖角色差异、核心技能、实战路径及风险应对,旨在为有意进入该领域的专业人士提供系统性参考。

梳理了大模型时代 AI 产品经理的核心能力模型,涵盖计算机科学基础、机器学习与大模型技术原理、产品管理与商业分析、项目实战及持续学习五个维度。重点讲解提示词工程、RAG 架构、微调策略及模型部署流程,提供从需求调研到上线评估的全链路方法论,帮助从业者构建系统知识体系并提升行业竞争力。

如何使用 AutoGen 框架构建 AI Agent 以实现自动化任务。文章首先解释了 AI Agent 的基本概念及其感知、决策、执行三大模块。接着重点讲解了 AutoGen 的核心组件,包括 AssistantAgent 和 UserProxyAgent,以及代码执行器的两种模式:本地执行与 Docker 容器隔离。通过绘制股票趋势图的实战案例,演示了…

2024 全球软件研发技术大会大模型智能应用开发论坛综述。腾讯分享智能数据研发全流程 AI 化方案;去哪儿探讨机票主流程 AIGC 落地与代理架构;京东详解神机妙算算法平台 2.0 迭代与实验评估体系;衍数科技剖析垂直行业大模型构建难点与微调策略;宾夕法尼亚州立大学介绍 AutoGen 多智能体编程框架;eBay 展示风控实时特征平台设计;美图分享 AIGC…

综述了大型语言模型(LLMs)的发展、架构及应用。内容涵盖从统计模型到 Transformer 的演进,重点分析了扩展法则及 BERT、GPT、LLaMA 等模型家族的特性。探讨了预训练策略、数据源、预处理技术及模型适应方法(如指令微调)。此外,详细阐述了利用策略,包括上下文学习(ICL)、思维链(CoT)及规划能力,并评估了 LLM 在医疗、金融、教育等领…

介绍如何使用 Python 和 Selenium 库实现淘宝商品数据的自动化采集。内容涵盖环境配置、浏览器驱动初始化、搜索定位、登录模拟、数据解析及 CSV 存储流程。同时包含反爬策略说明与代码优化建议,帮助开发者构建稳定的爬虫脚本。注意数据采集需遵守法律法规及网站服务条款。

介绍如何使用 Stable Diffusion 结合 LoRA 模型生成高质感人物图片。内容涵盖模型与 LoRA 文件配置、正向与负向提示词编写技巧、关键参数设置及常见问题排查。通过调整采样器、步数及权重,优化出图效果,解决真实感不足问题,提供从环境准备到最终生成的完整流程指导。

大模型部署框架解决了推理引擎碎片化问题,提供统一接口降低开发成本。对比了 Xinference、LocalAI、Ollama 和 FastChat 四大主流框架的特性、支持模型及加速引擎。通过安装指南与 API 调用示例,阐述了如何根据硬件环境和业务需求选择合适方案,并介绍了量化技术与集群部署策略,帮助开发者高效落地大模型应用。

通过分析拉钩网 1300+ 条 Python 招聘信息,探讨了自学 Python 的就业门槛。数据显示,北京、上海、深圳、杭州是主要需求城市,本科及以上学历及 1-5 年经验最受青睐。技能方面,除 Python 外,后端、MySQL、爬虫及算法能力是高频要求。薪资普遍在 20K-35K 区间。文章建议学习者不仅限于语法,需结合数据库与算法,并通过项目积累实战…

Python 稳居 TIOBE 编程语言排行榜榜首,在人工智能、数据分析等领域应用广泛。介绍 Python 语言特性、受欢迎原因及主要应用场景,涵盖安装、基础语法与生态库使用,帮助开发者快速入门并理解其技术优势。

pip 是 Python 的包管理工具,用于安装、升级和卸载第三方库。 pip 的安装验证、基础安装卸载命令、版本指定、依赖检查以及 requirements.txt 的使用规范,涵盖自定义源配置和虚拟环境配合等高级用法,帮助开发者高效管理 Python 环境。

详细阐述了黑客的定义与分类,包括白帽、黑帽、灰帽及红帽黑客的区别。重点分析了自学黑客的难点,涵盖计算机基础理论、多门编程语言、各类漏洞原理(Web 与二进制)、常用安全工具以及网站通讯知识。文章还梳理了网络安全的主要从业方向,包括 Web 安全岗位(渗透测试、安全工程师、安全服务)和二进制逆向岗位(逆向工程师、漏洞分析、安全研究员)的具体技术要求。最后强调了…

当前就业市场竞争激烈,求职者面临较大压力。Python 作为通用编程语言,在数据分析、人工智能、办公自动化等领域需求旺盛。 Python 在不同职业场景中的应用价值,包括科研、财务、销售、设计等岗位如何利用 Python 提升效率。同时梳理了从零基础入门到实战进阶的学习路径,涵盖环境搭建、核心库使用及项目实践建议,旨在帮助技术人员明确发展方向,增强职场竞争力…

2023 年 Python 的主要就业方向,涵盖人工智能、大数据、网络爬虫、自动化运维与测试等领域。文章详细阐述了各方向的核心技术栈,如 AI 方向的 PyTorch、大数据方向的 ETL 流程、爬虫的反爬策略以及自动化测试的 Pytest 框架。同时介绍了 Python 基础语法、面向对象编程及工程化能力的重要性,并为学习者提供了从基础到项目的职业发展建议…