
8 大 AI 平台速度与 Token 消耗对比测试
对比了智谱、Kimi、MiniMax、火山方舟、阿里百炼、腾讯混元、小米 MiMo2Pro 及 OpenRouter Opus 4.6 等 8 大 AI 平台的性能。测试涵盖极简回答、逻辑推理、空间理解、指令遵循及发散思维六个维度,重点评估首字延迟、总耗时与 Token 消耗。结果显示:Kimi 综合表现均衡;智谱与腾讯云响应快且省 Token;阿里云百炼首…
博客作者
清心寡欲
353
已发布文章
10K
博客获赞
608K
博客浏览
第 4 页

对比了智谱、Kimi、MiniMax、火山方舟、阿里百炼、腾讯混元、小米 MiMo2Pro 及 OpenRouter Opus 4.6 等 8 大 AI 平台的性能。测试涵盖极简回答、逻辑推理、空间理解、指令遵循及发散思维六个维度,重点评估首字延迟、总耗时与 Token 消耗。结果显示:Kimi 综合表现均衡;智谱与腾讯云响应快且省 Token;阿里云百炼首…
Chrome DevTools MCP 是连接 AI 编码助手与本地 Chrome 浏览器的协议工具。它允许 AI 直接控制浏览器进行性能分析、网络请求检查及自动化操作。部署需 Node.js v20.19+ 和 Chrome 浏览器。通过 npx 启动服务器并在 AI 客户端(如 Cursor、Gemini CLI)中配置 MCP 连接。配置完成后,用户可…

ChatGPT 记忆功能的概念、作用及使用方法。文章阐述了记忆功能如何通过保留用户偏好和对话上下文来提升交互的精准性与连贯性,实现了个性化体验。内容涵盖了记忆的开启与关闭步骤、查看与管理具体操作(包括删除单条或全部记忆),以及相关的隐私保护措施,如用户控制权、加密存储和数据透明度。此外,还探讨了记忆功能与 GPTs 的未来结合潜力及其在模型训练中的应用,强调…

解决了 Visual Studio 2022 中 GitHub Copilot 报错的问题。经排查,虽能连接域名但无法访问模型列表,确认为网络限制。通过设置环境变量 HTTP_PROXY、HTTPS_PROXY 及 COPILOT_USE_DEFAULTPROXY,并在启动脚本中指定代理,成功使 VS2022 内的 Copilot 正常工作,同时避免影响其他…

基于 Spring Boot 和 Leaflet 构建省级旅游口号 WebGIS 可视化平台的方案。通过 Spring Boot 搭建后端服务,利用 MyBatis Plus 与 PostGIS 处理空间数据关联,前端采用 Leaflet 库实现地图交互与口号展示。系统实现了旅游口号与省份地理信息的绑定,支持全国各省份口号的直观浏览与区域筛选。实践表明,该方…

检索增强生成(RAG)技术的核心思想与工作流程,旨在解决大模型幻觉及私有知识问答问题。通过对比 Langchain 框架与纯手搓两种实现方式,分析了开发效率、代码复杂度及适用场景。文章提供了基于 Langchain 和原生 Python 库(如 sentence-transformers、faiss)的详细代码示例,涵盖文档加载、文本切分、向量化、索引构建及…

在 Windows 10/11 系统上安装和配置 Neo4j 图数据库的详细步骤。内容包括系统要求、JDK 环境安装、Neo4j 解压与服务部署、Web 界面访问及基本 Cypher 操作。重点说明了不同版本 Neo4j 对 JDK 的要求,以及常见问题的排查方法,帮助用户快速搭建图数据库开发环境。

对操作系统智能助手 OS Copilot 进行了新功能测评。该工具结合语言模型与人工智能技术,优化用户与操作系统的交互模式。通过自然语言处理,支持文件管理、应用启动及系统设置调整,降低操作门槛。测评基于阿里云 ECS 环境,验证了其在运维与系统操作场景的适用性。
llama.cpp 是一个基于 C/C++ 的高性能推理框架,用于在本地设备运行 LLaMA 系列大语言模型。它通过量化技术降低内存占用,支持 CPU/GPU 加速及跨平台运行。无需联网即可保护隐私,适用于本地对话、开发集成及边缘设备研究。相比 Ollama 等工具,其优势在于极致轻量与低硬件需求。

探讨了结构化在信息管理中的核心作用,特别是在 AIGC 领域。结构化通过明确规则将杂乱数据转化为有序信息,提升检索与分析效率。文章介绍了结构化的定义、示例(如电话簿、数据库)及有序规则的重要性(如字典排序、交通信号)。在现代科技中,结构化数据是大数据和人工智能发展的基础,能显著提高处理效率和机器学习效果。最后提供了基于 OpenAI API 的 Python…

Stable Diffusion v4.10 与 ComfyUI 整合包的安装与环境配置。整合包内置模型、插件及一键启动器,支持 Intel 核显(需升级驱动)及 AMD 显卡(ZLUDA/DirectML)。包含 Python 3.11 与 PyTorch 2.5.1 环境。常见问题如报毒可通过白名单解决,卸载只需删除文件夹,启动器自带疑难解答功能可自动修…

Kiro AI 助手的完整使用指南。涵盖核心能力如读写代码、智能分析、Shell 命令执行等。工作模式包括 Autopilot 自动驾驶和 Supervised 监督模式。详细讲解了规范驱动开发(Specs),包含需求、设计、任务文档结构及 Feature/Bugfix 类型。介绍了 Hooks 自动化触发器配置,Steering 行为定制规则,以及 MCP…

介绍 Flutter 库 ml_algo 在 OpenHarmony 环境下的适配与应用。该库基于 Dart 编写,利用 SIMD 优化线性代数运算,支持回归、分类及聚类算法。文章解析了其在鸿蒙端侧推理的优势(低延迟、离线隐私),提供了线性回归、逻辑回归及决策树的代码示例,并讨论了 CPU 调度与资源加载挑战。旨在帮助开发者在鸿蒙设备上实现高性能、无需联网的…
介绍 Qwen3-Embedding-4B 模型的本地化部署实践。该模型支持 32k 长文本和 2560 维向量输出,采用 Apache 2.0 协议。教程涵盖两种方案:一是基于 llama.cpp 的轻量化部署,利用 GGUF 量化在消费级显卡运行;二是结合 vLLM 与 Open WebUI 构建可视化知识库系统,支持 RAG 检索。内容包含环境准备、代…

Workers AI 是 Cloudflare 提供的无服务器 AI 推理服务,提供每日 10,000 Neurons 免费额度及边缘网络加速。相比 OpenAI,其成本显著降低,适合个人项目及中小规模应用。支持多种开源模型如 Llama 3.1、Mistral 等。可通过 REST API、Wrangler 部署 Worker 或 OpenAI SDK 兼…

在 IntelliJ IDEA 中安装和配置 GitHub Copilot 插件的步骤,包括账号授权与激活。详细说明了核心功能如智能代码补全、注释驱动开发、Copilot Chat 对话式编程及单元测试生成。提供了提高上下文感知、编写精准提示词、快速生成样板代码等进阶技巧,并汇总了常用快捷键。最后强调了代码审查、隐私安全及保持插件更新的最佳实践,帮助开发者高…

CTF 竞赛的基本概念及 Web 题目的解题流程。内容涵盖 CTF 的七大主要类型,包括 Web 安全、密码学、逆向工程等;为新手提供了入门建议,如选择简单题目、学习基础知识、使用练习平台(如 PicoCTF、HTB)及掌握常用工具(如 Kali Linux、Burp Suite)。此外,还总结了信息收集、漏洞利用、工具使用和团队协作等核心解题技巧,旨在帮助…
对 FPGA 毕业设计中仿真周期长、调试难、资源利用率低等问题,提出从串行思维转向并行硬件思维的解决方案。通过对比传统 RTL 手写与高层次综合(HLS)工具链,推荐以 HLS 为核心加速算法实现。文章以图像边缘检测为例,展示了如何使用 Vitis HLS 进行代码优化,包括数据流接口、流水线及循环展开等技术。最后提供了性能评估指标及生产环境避坑指南,旨在帮…
介绍通过浏览器扩展解决微信网页版无法访问的问题。主要步骤包括获取项目源码、构建插件包及在浏览器中加载。插件通过拦截请求添加验证参数实现登录。适用于办公、多设备切换及开发者测试场景。需注意第三方插件可能违反使用条款的风险。
介绍智谱 AI 开源的 GLM-4v-9b 多模态模型,该模型支持高分辨率输入和中文优化,可通过 llama.cpp GGUF 格式在消费级 GPU(如 RTX 4090)上本地部署。文章详细说明了从下载权重、启动服务到 WebUI 交互的步骤,提供了基于 Python 脚本的 PDF 图表提取方案,以及与企业微信、Notion 等工具的集成方法。同时包含常…