
To B 领域最易实现的 Agent 应用场景(一):DataAgent
探讨了 To B 领域最易实现的 Agent 应用场景 DataAgent。文章详细分析了 DataAgent 的核心要素,包括结构化与非结构化数据源的处理、自然语言转 SQL/代码/API 三种模型技术路径、以及自助分析、预测分析等落地场景。重点阐述了四种设计思路:直接与通用模型交互、引入领域模型层、与指标平台/API 交互以及与可视化看板对接。文中还对比…
博客作者
高可用架构师
332
已发布文章
9.3K
博客获赞
730K
博客浏览
第 16 页

探讨了 To B 领域最易实现的 Agent 应用场景 DataAgent。文章详细分析了 DataAgent 的核心要素,包括结构化与非结构化数据源的处理、自然语言转 SQL/代码/API 三种模型技术路径、以及自助分析、预测分析等落地场景。重点阐述了四种设计思路:直接与通用模型交互、引入领域模型层、与指标平台/API 交互以及与可视化看板对接。文中还对比…

Transformer 是一种基于自注意力机制的神经网络架构,广泛应用于自然语言处理任务。详细解析了 Transformer 的核心组件,包括自注意力机制、位置编码、多头注意力及前馈网络,并通过纯 Python 和 NumPy 从零实现了一个简化版的 Transformer 模型。内容涵盖数学公式推导、数据预处理流程以及完整的代码示例,帮助读者深入理解模型内…

梳理了大模型学习的五个进阶阶段,从概念认知到业务落地再到专家级应用。涵盖本地部署挑战、API 调用、LangChain 框架使用、Agents 与 Tools 集成、多模型校验等关键技术点。同时提供了详细的学习路线,包括模型选择、数据预处理、推理解析及项目实战,帮助开发者系统掌握大模型应用技术。

介绍如何在本地电脑通过 Ollama 部署开源大模型,并结合 Chatbox 实现图形化交互。涵盖系统环境要求、命令行操作、模型选择策略及第三方应用集成方法,帮助用户构建离线可用的 AI 助手。内容包含详细安装步骤、API 配置及常见故障排查,适用于 Windows、macOS 及 Linux 用户。

基于 XTuner 框架在单卡环境下对 Llama3-8B-Instruct 模型进行微调。通过构建包含特定身份信息的指令数据集,使用 QLoRA 技术降低显存占用,完成模型自我认知的定制。流程涵盖环境配置、数据准备、模型下载、配置文件修改、训练执行及 LoRA 权重合并。最终通过推理脚本验证模型回答是否符合预设身份设定,适用于个人化助手开发场景。

大语言模型中的分词(Tokenization)机制,解释了 1 token 约等于 3/4 单词的经验法则。详细阐述了分词的三种粒度(词级、字符级、子词级)及主流子词算法(BPE、WordPiece、Unigram)。通过 Python 的 transformers 库演示了 AutoTokenizer 的 tokenize、encode 和 decode…

基于 LangChain 框架结合 ChatGLM 大模型搭建本地私有知识库。步骤包括克隆源码、配置 Python 虚拟环境、安装依赖(如 llama-cpp-python、paddleocr)、升级 GCC 版本以解决编译问题。通过修改 model_config.py 指定本地模型路径及 Embedding 模型。最后启动服务实现文档问答功能。

详细解析了普通人利用 AI 大模型实现商业变现的路径。内容包括 AI 大模型的基础概念、四大核心应用场景(内容创作、智能客服、推荐系统、教育工具)及其具体技术实现方案。文章提供了 Python 代码示例、RAG 架构设计思路以及从环境搭建到部署运维的全流程指南。此外,还涵盖了提示词工程技巧、模型选型建议以及版权、幻觉、数据安全等风险管控措施,旨在帮助读者掌握…

2024 年大模型发展迅速,开源社区进步显著,Qwen 等国产模型表现优异。数据质量成为核心竞争力,合成数据在训练占比提升。Continue-Pretrain 因成本和通用性影响减少,Post-training 更受重视。RAG 落地面临文档解析、向量召回及多模态处理挑战,GraphRAG 成本较高。Agent 概念火热但实际落地多为 WorkFlow,稳定…

2024 年大模型入门畅销书单,涵盖 GPT 图解、AI Agent 开发、ChatGPT 应用、AIGC 编程及 AWS 实战等内容。同时补充了深度学习、机器学习公式详解等基础理论书籍,以及 AI 辅助写作指南。文章还梳理了从系统设计、提示词工程、平台应用到微调开发的七阶段学习路径,帮助程序员系统掌握大模型技术,提升全栈工程能力及垂直领域模型训练水平。

详细解析了大模型时代的六大核心高薪岗位,涵盖模型研发、算法、数据科学、AI 产品、机器学习及深度学习工程师。文章阐述了各岗位的核心职责、技能要求及适用领域,并补充了当前主流技术生态工具链、常见挑战应对策略及系统化的学习路径建议。旨在帮助程序员明确转型方向,掌握关键技术栈,适应人工智能行业的快速发展。

NumPy 是 Python 数据科学的核心库,提供高效的多维数组对象和数学函数。系统梳理了 NumPy 的基础用法,包括数组创建、增删改查、变形拼接、统计计算、视图与拷贝机制、随机数生成及线性代数运算。重点解析了 axis 参数含义与广播机制原理,辅以代码示例帮助初学者快速掌握数值计算核心技能。

适合新手入门的六个自媒体变现平台,包括公众号、小红书、今日头条、知乎、百家号和得物。文章分析了各平台的受众特征、变现方式及运营技巧,涵盖了从账号注册、内容创作到流量变现的全流程。同时指出了新手常见的误区与风险控制要点,强调合规运营与持续学习的重要性,为希望从事自媒体副业的用户提供了系统的参考指南。

Python 办公自动化主要涉及 Excel、Word、PPT 文档处理,以及数据分析和网络爬虫等技能。 Python 基础知识、内置模块及第三方库的使用,重点讲解了 xlwings、openpyxl、python-pptx 等库在文档自动化中的具体应用。同时涵盖了邮件发送、文件管理及接口调用等内容,为初学者提供了系统的学习路径和代码示例,帮助实现工作效率提…

Python 与 Excel 结合使用的优势及环境配置方法,涵盖 Anaconda 安装、Conda 环境管理、Python 基础语法(数据类型、控制流、PEP 8 规范)以及 pandas 库的核心功能,包括 NumPy 数组操作、DataFrame 数据清洗、合并、统计分析及可视化等,旨在帮助 Excel 用户通过编程实现自动化数据处理与分析。

介绍 Python 在兼职接单中的应用场景,包括数据爬取、数据分析及后端开发。详细梳理了从基础语法到爬虫、数据分析、机器学习及高级进阶的学习路线,并列举了国内主流接单平台。强调法律合规性,提供各阶段技术要点与代码示例,帮助初学者建立系统知识体系,实现技能变现。

介绍如何利用 Ollama 和 AnythingLLM 在本地构建私有 AI 知识库。通过部署开源大语言模型、嵌入模型及向量数据库,实现文档的智能问答(RAG)。涵盖环境安装、模型选择、工作区配置、文档解析及 API 调用等全流程,确保数据隐私与离线可用。重点讲解了 Docker 部署方式、常见错误排查及性能优化策略,适合希望掌握本地 AI 应用的开发者参考…

网络安全行业包含渗透测试、Web 安全、安全运维等多个细分岗位。详细解析各岗位职责,提供从理论基础到编程实战的系统化学习路线,涵盖网络协议、漏洞原理及工具使用,帮助初学者规划职业发展。内容涉及等级保护、渗透测试流程、操作系统安全、Web 漏洞分析及 Python 编程实战,旨在建立完整的安全知识体系。

基于SpringBoot框架开发的网上租赁系统,采用MyBatis-Plus、Shiro及MySQL技术栈。系统包含管理员、商家和用户三种角色,支持商品信息管理、订单处理(发货、租赁、完成)、信誉值管理及个人中心等功能。前端使用Layui、ElementUI等构建界面,后端基于JDK 1.8与Maven环境部署。项目提供完整的数据库配置与启动教程,适用于毕业…
国家企业信用信息公示系统爬虫涉及复杂的 Cookie 链获取及极验验证码处理。流程包括三次页面访问初始化 Cookie、调用第三方打码平台解决滑动验证、最终构造请求解析企业详情。核心难点在于动态 JS 环境模拟与验证码参数传递。