CoderByte 的博客文章

编程语言AI算法

9 篇大模型领域最新论文精选

汇总了 9 篇大模型领域最新研究论文，涵盖大型多模态智能体综述、心智理论基准测试 ToMBench、脑机接口 BAI、端侧优化 MobileLLM、视觉语言模型幻觉抑制、主动少样本微调、推理效率提升策略、小学数学小模型潜力挖掘以及文生图数据集创建方法 Gen4Gen。内容涉及模型架构、评估基准、应用场景及训练技巧，为研究人员提供前沿技术参考。

发布于 2025/2/730 浏览0 点赞

PythonAI算法

Python 数据可视化入门教程

Python 数据可视化主要涉及 Pandas、Matplotlib、Seaborn 和 Pyecharts 四个核心库的使用。Pandas 提供 DataFrame 结构及基础绘图功能；Matplotlib 支持高度自定义的图表绘制与参数调整；Seaborn 基于 Matplotlib 提供更高级的统计图形接口；Pyecharts 则擅长交互式图表与地图展…

发布于 2025/2/735 浏览0 点赞

PythonAI大前端算法

Python 爬虫学习的四大阶段与核心技能

Python 爬虫技术体系通常划分为初级、中级、高级及更高级四个阶段。初级阶段侧重 Python 语法基础及 requests、BeautifulSoup 等常用库的使用；中级阶段涉及 Ajax 接口分析、多进程多线程并发处理及常见反爬应对；高级阶段聚焦分布式爬虫架构（如 Scrapy-Redis）及复杂反爬破解（验证码、字体加密）；更高级则涵盖 JS 逆向…

发布于 2025/2/723 浏览0 点赞

Shell / Bash

高校渗透测试实战：从信息收集到内网横向移动

记录了一次针对某高校系统的渗透测试全过程。通过子域名与端口扫描发现教务、缴费及 OA 系统。利用搜索引擎收集敏感信息，在缴费系统中发现 SQL 注入漏洞。通过混入管理群获取官网后台账号，尝试上传文件未成功。后在教材管理系统发现弱口令及文件上传漏洞获取服务器权限。进入内网后，通过扫描存活 IP 段、爆破弱口令及利用 OA 找回密码机制获取管理员权限，最终实现内…

发布于 2025/2/731 浏览0 点赞

Python算法

Windows 使用 VS Code 和 Terminal 进行 Python 开发指南

Windows 系统下 Visual Studio Code 与 Windows Terminal 的 Python 开发配置指南。涵盖工具安装、扩展配置、虚拟环境管理、代码编写运行、单元测试调试及 Git 集成。通过具体示例展示开发环境配置与项目协作流程。

发布于 2025/2/725 浏览0 点赞

PythonAI算法

LLM 大模型实践指南：从入门到应用开发路线

大语言模型（LLM）正在重塑技术行业，系统梳理了从基础认知到应用开发的完整学习路径。内容涵盖大模型核心价值分析、主流工具体验、提示词工程（Prompt Engineering）技巧、基于 LangChain 的应用构建、GPT 理论前沿以及商业模式思考。通过提供具体的 Python 代码示例与最佳实践建议，帮助开发者掌握 AI 技术核心能力，探索业务落地场景…

发布于 2025/2/730 浏览0 点赞

Pythonjava算法

红客联盟历史回顾与网络安全技术入门

回顾了红客联盟的历史背景及中美黑客大战，并系统梳理了网络安全学习路径。内容涵盖行业前景、法律法规、渗透测试基础、操作系统与网络协议知识、Web 安全漏洞原理及脚本编程能力培养，旨在为初学者提供科学的成长路线图。

发布于 2025/2/731 浏览0 点赞

Python

Python 快速入门教程

Python 是一门解释型、面向对象的高级编程语言，以其简洁的语法和强大的生态著称。涵盖从环境搭建到核心语法的完整入门路径。内容包括 Python 安装配置、虚拟环境管理、基础数据类型（字符串、列表、字典等）、控制流语句（条件判断、循环）、函数定义与参数传递、模块导入机制、异常处理及文件操作。通过实战代码示例，帮助初学者理解变量作用域、内存管理及常见编程模式…

发布于 2025/2/730 浏览0 点赞

PythonAI算法

大模型 AI 产品经理成长攻略与核心学习路线

详细阐述了大模型 AI 产品经理所需的知识体系与技能路径。内容涵盖计算机科学基础、人工智能与机器学习原理、大模型技术概览及训练优化、产品管理与商业分析、实战经验积累以及持续学习策略。通过系统化的学习路线，包括从系统设计到提示词工程、平台应用开发、知识库构建、微调开发及多模态应用等阶段，帮助读者构建完整的技术认知，提升在 AI 领域的产品规划与落地能力。

发布于 2025/2/727 浏览0 点赞

PythonAI算法

大模型与机器学习学习路线及核心书籍推荐

梳理了从零开始的大模型与机器学习学习路径，划分为零基础入门、基础进阶和工作应用三个阶段。推荐了包括机器学习算法数学解析、Python 程序设计、机器学习实战、神经网络与深度学习等核心书籍。内容涵盖机器学习基础、深度学习框架、系统工程及工程化落地方法，帮助开发者建立完整知识体系，掌握从理论到实践的核心技能，并涉及提示词工程、LangChain 框架应用及垂直领…

发布于 2025/2/730 浏览0 点赞

PythonAI算法

基于知识图谱与大模型的个人知识库构建方案

探讨了基于知识图谱与大模型的个人知识库构建方案。首先介绍了 RAG 技术的基本原理及其在处理长文档时的局限性，随后引出微软提出的 GraphRAG 解决方案，通过结合知识图谱增强 LLM 的推理能力。文章详细阐述了知识图谱的核心概念、GraphRAG 的索引与查询流程，以及 Neo4j LLM KG Builder 的使用体验。通过对比两种工具在复杂问题回答…

发布于 2025/2/741 浏览0 点赞

Kotlinjava

Kotlin 注解详解：声明、应用与元注解

详细讲解了 Kotlin 中注解的声明与应用方式。内容包括如何使用 @ 符号应用注解，注解参数的类型限制及 const 修饰符的使用，以及使用点目标控制注解作用范围。此外，还介绍了如何通过注解控制 Java API 可见性，利用注解定制 JSON 序列化行为，以及如何定义自定义注解和元注解。文章涵盖了从基础用法到高级特性如 KClass 引用和泛型参数支持的…

发布于 2025/2/724 浏览0 点赞

编程语言AI算法

千卡 GPU 利用率超 98%：JuiceFS 在 MLPerf 存储基准测试中的实践

JuiceFS 企业版在 MLPerf 存储基准测试中表现优异。BERT 模型千卡规模下 GPU 利用率超 98%，Unet3D 模型五百卡规模下保持 97% 以上。通过启用分布式缓存，JuiceFS 有效突破了对象存储带宽瓶颈，利用 SSD 聚合提升读吞吐。相比专有高性能存储，JuiceFS 凭借云原生架构与高性价比，更适合大规模 AI 训练场景。测试显示…

发布于 2025/2/723 浏览0 点赞

PythonAI算法

基于 ChatGLM-6B 的医疗领域大模型微调实战指南

基于 ChatGLM-6B 的医疗领域大模型微调实战指南。详细阐述环境配置、开源库下载、指令数据集构建、LoRA 参数训练、权重合并及推理测试等关键步骤。通过优化数据集格式与脚本逻辑，解决常见部署问题，实现针对特定医疗场景的模型定制，为垂直领域大模型应用提供可复现技术方案。

发布于 2025/2/730 浏览0 点赞

PythonAI算法

Qwen7b 大模型高效微调实战指南

基于 QLoRA 技术对 Qwen7b 大模型进行高效微调的完整流程。内容涵盖环境配置、数据集构建（支持单轮与多轮对话）、模型加载与量化、PEFT 适配器配置、训练过程管理及模型合并部署。通过实际案例演示了如何修改模型的自我认知，并提供了推理测试代码，帮助开发者快速掌握开源大模型的高效微调方法。

发布于 2025/2/737 浏览0 点赞

PythonAI算法

大型语言模型（LLM）入门指南：核心知识点与资源整理

系统梳理了大型语言模型（LLM）的学习路径，涵盖基础数学与编程、模型构建与微调、以及应用部署三大方向。内容涉及机器学习原理、Transformer 架构、指令微调、RLHF、量化技术及检索增强生成（RAG）等核心技术点，并整理了相关的工具库与学习资源，旨在为开发者提供从入门到实战的完整参考。

发布于 2025/2/723 浏览0 点赞

JavaScriptNode.jsAI算法

Ollama-OCR 基于 Llama 3.2-Vision 的本地高精度文字识别方案

介绍基于 Llama 3.2-Vision 模型的开源工具 ollama-ocr，用于本地图像文字识别。支持多种图片格式，可保留原始文本结构。通过安装 Ollama 环境及调用 npm 包，开发者可实现手写体识别、票据 OCR 及图片问答功能。文章涵盖环境配置、基础用法、自定义提示词及服务端集成示例，对比传统 OCR 优势，并提供性能优化建议，适合需要本地化…

发布于 2025/2/737 浏览0 点赞

PythonAI算法

大模型的 6 项核心技术：Transformer、预训练与 RLHF 等

大模型的六项核心技术，包括 Transformer 架构及其优缺点、预训练与微调范式、基于人类反馈的强化学习（RLHF）、模型压缩技术（量化、蒸馏等）、多模态融合方法以及大模型对算力资源的依赖。涵盖了从底层原理到工程落地的关键知识点。

发布于 2025/2/625 浏览0 点赞

编程语言AI算法

AI 产品经理的核心职责、工作流程与能力要求解析

AI 产品经理相较于传统产品经理，在技术边界理解、模型验收及数据分析方面要求更高。文章梳理了从需求定义到迭代反馈的全流程差异，指出 AI 产品更侧重能力交付而非功能实现，并强调了对算法基础及数据质量的深度依赖。主要区别体现在面向对象、实现目标、边界确定性以及工作重心四个方面，要求从业者具备更强的技术理解力和数据敏感度。

发布于 2025/2/628 浏览0 点赞

CoderByte

发布的文章