
Llama 开源家族梳理:从 Llama-1 到 Llama-3
Meta 发布了 Llama-1 至 Llama-3 系列开源大模型。文章对比了各版本在架构、训练数据、方法及性能上的演进。Llama-1 开启开源生态,Llama-2 支持商用并优化上下文,Llama-3 进一步提升数据规模与多语言能力。内容涵盖模型结构细节、训练策略及基准测试表现,为理解开源大模型发展提供参考。
博客作者
独酌清酒
357
已发布文章
8.2K
博客获赞
451K
博客浏览
第 6 页

Meta 发布了 Llama-1 至 Llama-3 系列开源大模型。文章对比了各版本在架构、训练数据、方法及性能上的演进。Llama-1 开启开源生态,Llama-2 支持商用并优化上下文,Llama-3 进一步提升数据规模与多语言能力。内容涵盖模型结构细节、训练策略及基准测试表现,为理解开源大模型发展提供参考。

NVIDIA GTC 2026 开幕,发布 NemoClaw Agent 平台并聚焦 Physical AI。微软开源 AgentRx 解决 Agent 调试难题。Anthropic 披露 Claude 完成 70%-90% 开发代码。大晓机器人开源端侧具身世界模型 Kairos 3.0-4B。北京通用 AI 研究院发布 OmniXtreme 实现高动态运动…
解决了 Windows 系统下 Codex 等 AI 工具因网络限制导致'正在思考'无响应的问题。通过排查发现 Electron/Node 应用不读取系统代理,需手动配置环境变量。提供了一套基于 HTTP_PROXY 和 HTTPS_PROXY 环境变量的批处理脚本,实现一键开启或关闭代理,确保开发工具联网的同时不影响国内软件正常使用。适用于 Codex、C…
介绍基于 RaNER 模型的中文命名实体识别(NER)服务的部署与使用。内容涵盖从环境准备到启动服务的全过程,提供 WebUI 可视化操作指南及 REST API 接口调用示例(含 Python 代码)。此外还包含常见问题排查与性能优化建议,帮助开发者快速集成 NER 功能至业务系统。

清华大学发布的 AIGC 发展研究报告 4.0 的部分节选内容。主要包含报告中的关键数据图表及行业分析,例如智联招聘关于 AI 领域求职人数增长的数据,以及麦肯锡对中国 AI 专业人才需求的预测。原文中包含大量推广资料和引流信息,经清洗后仅保留报告核心观点与数据展示,旨在呈现 AIGC 领域的现状与发展趋势。
ROS1 导航栈的核心组件与配置方法。内容涵盖 move_base 框架架构、代价地图(Costmap)的层级结构与参数设置、全局路径规划算法(如 A*、Dijkstra)及局部路径规划器(如 DWA)。此外,还讲解了恢复行为机制、导航参数调优策略、多目标导航管理及多机器人协调方案。通过实战案例展示了完整自主导航系统的构建流程,旨在帮助开发者掌握机器人智能移…

电科金仓发布四款核心产品,包括融合数据库 KES V9 2025 等,提出融合、AI、平台能力三大关键词。旨在解决大模型时代非结构化数据、向量检索等新需求,打破传统数据库架构壁垒。通过内核级重构实现多模态数据统一存储查询,构建从内核到交付的全栈一体化平台,推动国产数据库从替代向定义下一代形态转型。
基于 ESP32-S3 构建智能语音对话机器人的完整方案。涵盖硬件选型(ESP32-S3 开发板、I2S 麦克风、扬声器等)、软件环境搭建(ESP-IDF、VSCode、Python 服务端)、核心代码实现(ESP-SR 语音唤醒、I2S 音频采集、WebSocket 流式传输)以及云端部署(SenseVoice 语音识别、DeepSeek/Qwen 大模型…
探讨了智能家居插件管理工具 HACS 的优化原理,包括请求路由、部署流程、缓存策略及性能调优技巧,旨在提升插件获取效率与系统响应速度。

VSCode Copilot 聊天加载过慢时,可通过修改设置文件解决。打开命令面板输入 setting 找到 setting.json,添加 github.copilot.nextEditSuggestions.enabled 为 true 及 chat.extensionUnification.enabled 为 false。保存重启后授权 Copilot…
在 Visual Studio Code 中配置和使用 GitHub Copilot 的详细指南。内容涵盖环境搭建、认证流程、网络代理注意事项以及核心设置项调优。通过调整 inlineSuggest 延迟和 enable 配置,可减少干扰并提升建议精准度。文章还提及了状态栏图标含义及多设备同步问题,旨在帮助用户避开常见陷阱,将 Copilot 融入日常编码工…

介绍如何在 Flutter 鸿蒙项目中集成 wallet_connect 库,实现 Web3 钱包协议连接。涵盖基础原理、配置步骤、核心 API 使用及典型应用场景。重点解决了 DeepLink 唤起钱包、网络代理延迟等 OpenHarmony 平台适配挑战,提供安全稳定的 DApp 授权登录与跨链交易签名方案。

ComfyUI 作为基于节点的 Stable Diffusion 图形界面工具,如何通过可视化工作流提升 AI 绘画的效率与可控性。内容涵盖环境部署、基础文生图工作流构建、ControlNet 与 LoRA 的高级应用、人像摄影实战案例以及性能优化技巧。文章旨在帮助用户掌握模块化、可复现的 AI 绘画方法论,实现从简单生成到精细化控制的转变。

基于 FPGA 的北斗导航系统自适应抗干扰算法的设计与实测验证。研究涵盖了空域滤波和空时二维联合两种算法,分别在 FPGA 嵌入式软核 NIOS II 和硬件逻辑语言(Verilog HDL)上实现。通过 MATLAB 建模仿真与 FPGA 数字板实测,验证了数字下变频(DDC)、权值计算及数据加权模块的正确性。实验结果表明,两种方案均具备抗干扰性能,其中空…

恩智浦在CES 2026发布S32N7超级集成处理器系列,基于5纳米工艺,支持将多达八个域整合至单一平台,降低20%总拥有成本。该芯片具备硬件强制功能隔离,支持车身、运动及底盘控制等功能,兼容2级自动驾驶及智能体AI能力。博世成为首家部署企业,双方合作开发参考设计以加速系统落地。新架构支持边缘计算与实时数据处理,助力车企实现软件定义车辆及差异化功能。

阿里通义万相 2.1 文生视频模型的技术特性,包括时空上下文建模及中文文字生成能力。提供了开源仓库获取方式,并演示了基于云平台的部署流程。通过对比 RTX3090 与 RTX4090 显卡的实测表现,验证了高算力硬件在视频生成任务中的速度优势,为 AIGC 内容创作提供硬件选型参考。
介绍 Qwen3-ASR-1.7B 在新闻发布会场景下的应用。针对人工记录易遗漏、多人发言难区分等痛点,该模型提供高精度语音识别、智能说话人分离及实时处理能力。文章涵盖环境搭建、实时转写配置、关键人物发言提取代码示例,以及提升准确率、处理混合语言和输出格式定制等优化技巧。实测显示识别准确率达 96.7%,延迟小于 3 秒,能有效提升会议记录效率和质量。

Neo4j 图数据库的入门指南。内容包括 Windows 和 Docker 环境下的安装步骤,Cypher 查询语言的基础语法(如创建节点关系、匹配查询、属性操作、排序去重等),常用函数与聚合操作,数据备份与恢复方法,复杂路径查询技巧,以及在 Spring Boot 项目中的集成配置。文章提供了详细的代码示例和配置文件说明,适合初学者快速上手 Neo4j 开…

阐述了人工智能、机器学习与深度学习的定义及包含关系,介绍了弱人工智能与强人工智能分类,详述了机器学习工作流程、类型及深度学习优势。通过 Python 代码示例展示基础实现,对比三者在实际场景中的应用差异,并为初学者提供学习路径建议。

如何使用字节跳动 Coze 平台开发 AI 智能体并部署为 Web 应用。涵盖 Coze 核心概念(智能体、应用、大模型)、资源(插件、知识库、数据库)、工作流开发以及 API/SDK 集成。通过实战案例展示了如何结合阿里云 OSS 生成视频,并提供完整的 Python Flask 后端与前端 HTML 代码示例,实现从智能体创建到独立 Web 应用封装的全…