
大模型技术原理、发展历程与分类详解
大模型是具有大规模参数和复杂计算结构的机器学习模型。文章介绍了大模型的定义及其与小模型的区别,阐述了从 CNN 到 Transformer 再到 GPT 系列的发展历程。内容涵盖大模型的涌现能力、多任务学习等特点,并按数据类型分为语言、视觉及多模态模型,按应用层级分为通用、行业及垂直大模型。最后讲解了泛化能力概念及微调方法,如 Fine-tuning、LoR…
博客作者
K8s运维工程师
345
已发布文章
6.7K
博客获赞
422K
博客浏览
第 17 页

大模型是具有大规模参数和复杂计算结构的机器学习模型。文章介绍了大模型的定义及其与小模型的区别,阐述了从 CNN 到 Transformer 再到 GPT 系列的发展历程。内容涵盖大模型的涌现能力、多任务学习等特点,并按数据类型分为语言、视觉及多模态模型,按应用层级分为通用、行业及垂直大模型。最后讲解了泛化能力概念及微调方法,如 Fine-tuning、LoR…

网络安全专业作为新兴学科,涵盖网络空间组成、形态、安全及管理研究。就业方向广泛,涉及金融、政府、电信及互联网行业,岗位包括安全运维、渗透测试、安全架构师等。行业受国家战略支持,十四五规划明确建设网络强国,市场规模随数字化进程持续增长。职业发展空间大,技术性强,越老越吃香。核心技能需掌握网络协议、操作系统、编程及安全工具。建议考取 CISP、CISSP 等证书…

五款免费且好用的在线代码编辑器,包括 CodePen、JsFiddle、CodeSandbox、StackBlitz 和 Playcode。这些工具无需本地配置即可直接运行 HTML、CSS、JavaScript 及各类前端框架代码。CodePen 和 JsFiddle 适合前端片段展示与快速测试;CodeSandbox 和 StackBlitz 支持全栈项…

详细阐述了转行 Python 工程师的系统性学习路径与实战经验。内容涵盖开发环境搭建、基础语法核心、进阶特性与最佳实践、主流框架生态(Web 后端、数据分析、爬虫等)、实战项目建议以及求职面试指南。旨在帮助初学者建立扎实的技术体系,通过科学规划与持续演练,掌握 Python 核心技术,从容应对职场挑战,实现职业转型目标。

汇总了程序员客栈、码市、猪八戒等 19 个主流接单平台,涵盖国内外包与众包及国际自由职业市场。文章分析了各平台特点与适用人群,并针对接私活过程中的时间成本、合同风险、款项安全及技能提升提出了具体建议,帮助开发者在保障主业的前提下合理开展副业。内容包含详细的平台介绍及接单安全策略,如需求评估、合同定金、沟通文档、知识产权处理及常见陷阱规避,旨在提供实用的副业指…

Jupyter Notebook 是一种支持多语言交互式的编程环境,广泛应用于数据分析和科学计算。详细阐述了四种主流安装方案:通过 Anaconda 集成安装适合初学者,利用 pip 命令安装适合已有 Python 环境的用户,Docker 容器化部署便于环境隔离与版本管理,而云端服务则免去了本地配置负担。此外,还涵盖了安装后的验证步骤、基础使用方法及常见故…

行业大模型针对特定领域需求训练,相比通用大模型在专业性和成本上更具优势。探讨其构建流程包括需求分析、模型选型与优化部署,分析其在金融、教育、工业等场景的应用价值,如提升效率、优化产品体验及推动智能化转型。同时阐述面临的挑战与未来发展趋势,强调数据治理与算力协同的重要性,为企业落地大模型技术提供参考路径。

探讨了大模型在智能财务领域的落地实践与应用思路。针对财务审核中非标票据结构化和规则自动化的两大痛点,文章提出了利用大模型'用强弃弱'的策略,将其应用于智能提单、审单等高价值环节。详细介绍了非标票据定向数据结构化的五步实践方法论,包括双模型调用、对话式训练集构建及提示词工程等关键技术。同时阐述了大模型在理解纸面财务规则方面的应用,实现了从文档到系统的自动化流转…

基于 IBM 和微软 2024 年的调研论文,深入探讨了 AI Agent 架构在推理、规划和工具调用方面的发展现状。文章对比了单智能体与多智能体架构的优劣,详细分析了 ReAct、MetaGPT 等主流架构的特点及适用场景。同时指出了当前智能体在评估标准、数据污染、现实适用性及偏见等方面面临的挑战,并强调了清晰的角色定义、动态团队构建及有效反馈机制对提升系…

2024 年国产大模型数量超 300 个,国务院提出'人工智能 +'行动加速产业落地。基于《2024 大模型典型示范应用案例集》,分析了 97 个精选案例的特征。报告显示上海占比超 50%,大中型企业占 80%,覆盖医疗、金融、工业等 10 余个行业。关键技术趋势包括 AI Agent 占比超 23% 成为新热点,以及基于 RAG 技术的知识库成为提升落地实…

阿里云发布《2024 大模型典型示范应用案例集》,收录 99 个精选案例。报告显示国产大模型超 300 个,人工智能 + 行动推动产业融合。上海成应用热土,大中型企业主导创新。医疗、金融、能源等为重点场景。AI 智能体和 RAG 知识库成为关键热点,助力新质生产力发展。

介绍 AI Agent 的定义、核心特性及架构组件,涵盖自主性、适应性等四大特性。详细解析基于大模型的 Agent 开发方法论,包括感知、决策、执行等关键步骤。重点讲解 OpenAI API、LangChain、LlamaIndex 等技术工具的使用,并通过自动化办公、函数调用、检索增强生成等七个实战项目案例,展示从理论到实践的开发流程,适合希望转型 AI…

详细讲解了 LangChain-Chatchat 在 Windows 系统下的本地化部署流程。内容包括基础环境搭建(Python、CUDA、Conda)、依赖安装(区分全量与按需模式)、开源模型下载与配置、配置文件修改(模型路径、API 地址、服务端口)、知识库初始化以及三大核心服务(LLM、API、WebUI)的启动方法。此外,还补充了服务验证步骤及常见故…

Python 面向对象编程基础通过定义类 Student 创建对象实例。代码展示了如何声明类属性如姓名性别国籍籍贯年龄,实例化后赋值并打印输出。重点在于理解类作为模板生成对象以及对象属性的访问方式。

Python 身份验证是 Web 开发安全的核心环节。七款实用的 Python 认证库,涵盖 OAuth 协议支持、JWT 处理、会话管理及社交登录等场景。Authlib 提供标准的 OAuth1/2 实现;PyJWT 专注于令牌编码解码;Flask-Login 和 Flask-Security 分别解决 Flask 项目的会话与综合安全需求;Django-…

布隆过滤器基于哈希与位图结构,通过数据量 n 和失误率 p 计算位图大小 m 与哈希函数数量 k。Zset 采用 ziplist 或 skiplist 编码,当元素少于 128 个且成员长度小于 64 字节时使用 ziplist 优化存储。

Java Integer 对象比较存在陷阱,使用 == 运算符比较可能因自动装箱机制导致意外结果。这是因为 Integer.valueOf 方法内部维护了 -128 到 127 的缓存池,范围内的值返回同一对象引用,范围外则新建对象。因此比较 Integer 值应始终使用 equals 方法而非 ==,避免混淆引用地址与数值相等性。
JPA 全称 Java Persistence API,是 Java EE 持久化标准规范,通过注解或 XML 描述对象与关系表映射,将实体对象持久化至数据库。其技术涵盖 ORM 元数据、API 操作及查询语言。优势包括标准化架构、容器级事务支持、编程模型简单及面向对象查询能力。主流实现框架有 Hibernate、EclipseLink 等。常见问题涉及主键…
华为机试'素数伴侣'问题本质是求最大二分图匹配。因大于 2 的素数均为奇数,两数之和为素数必为一奇一偶配对。将数字按奇偶分为两个集合构建二分图,利用深度优先搜索(DFS)寻找增广路即可得出最佳方案的对数。代码采用 C++ 实现,含素数筛法预处理及图匹配逻辑,支持多组测试数据输入。

Scala 语言控制结构精简,强调函数式编程风格。解析 if 表达式的返回值机制,演示如何通过直接赋值减少变量声明。掌握该特性可提升代码简洁度与不可变性,是编写高质量 Scala 代码的基础。