
9 篇大模型领域最新论文精选
汇总了 9 篇大模型领域最新研究论文,涵盖大型多模态智能体综述、心智理论基准测试 ToMBench、脑机接口 BAI、端侧优化 MobileLLM、视觉语言模型幻觉抑制、主动少样本微调、推理效率提升策略、小学数学小模型潜力挖掘以及文生图数据集创建方法 Gen4Gen。内容涉及模型架构、评估基准、应用场景及训练技巧,为研究人员提供前沿技术参考。
博客作者
全栈开发爱好者
328
已发布文章
12K
博客获赞
812K
博客浏览
第 15 页

汇总了 9 篇大模型领域最新研究论文,涵盖大型多模态智能体综述、心智理论基准测试 ToMBench、脑机接口 BAI、端侧优化 MobileLLM、视觉语言模型幻觉抑制、主动少样本微调、推理效率提升策略、小学数学小模型潜力挖掘以及文生图数据集创建方法 Gen4Gen。内容涉及模型架构、评估基准、应用场景及训练技巧,为研究人员提供前沿技术参考。

百度举办文心杯创业大赛,李彦宏看好智能体并承诺投资支持。参赛团队中 60% 聚焦智能体应用,门槛降低使非程序员也能参与。获奖项目覆盖电商、教育、心理等领域,如师者 AI 转型教育后需求激增,镜象科技提供 AI 心理诊疗。当前融资环境严峻,ToB 业务困难,大厂生态资源成为关键。百度搜索已成为智能体最大分发入口。

Python 数据可视化主要涉及 Pandas、Matplotlib、Seaborn 和 Pyecharts 四个核心库的使用。Pandas 提供 DataFrame 结构及基础绘图功能;Matplotlib 支持高度自定义的图表绘制与参数调整;Seaborn 基于 Matplotlib 提供更高级的统计图形接口;Pyecharts 则擅长交互式图表与地图展…

Python 爬虫技术体系通常划分为初级、中级、高级及更高级四个阶段。初级阶段侧重 Python 语法基础及 requests、BeautifulSoup 等常用库的使用;中级阶段涉及 Ajax 接口分析、多进程多线程并发处理及常见反爬应对;高级阶段聚焦分布式爬虫架构(如 Scrapy-Redis)及复杂反爬破解(验证码、字体加密);更高级则涵盖 JS 逆向…

记录了一次针对某高校系统的渗透测试全过程。通过子域名与端口扫描发现教务、缴费及 OA 系统。利用搜索引擎收集敏感信息,在缴费系统中发现 SQL 注入漏洞。通过混入管理群获取官网后台账号,尝试上传文件未成功。后在教材管理系统发现弱口令及文件上传漏洞获取服务器权限。进入内网后,通过扫描存活 IP 段、爆破弱口令及利用 OA 找回密码机制获取管理员权限,最终实现内…

Windows 系统下 Visual Studio Code 与 Windows Terminal 的 Python 开发配置指南。涵盖工具安装、扩展配置、虚拟环境管理、代码编写运行、单元测试调试及 Git 集成。通过具体示例展示开发环境配置与项目协作流程。

大语言模型(LLM)正在重塑技术行业,系统梳理了从基础认知到应用开发的完整学习路径。内容涵盖大模型核心价值分析、主流工具体验、提示词工程(Prompt Engineering)技巧、基于 LangChain 的应用构建、GPT 理论前沿以及商业模式思考。通过提供具体的 Python 代码示例与最佳实践建议,帮助开发者掌握 AI 技术核心能力,探索业务落地场景…

回顾了红客联盟的历史背景及中美黑客大战,并系统梳理了网络安全学习路径。内容涵盖行业前景、法律法规、渗透测试基础、操作系统与网络协议知识、Web 安全漏洞原理及脚本编程能力培养,旨在为初学者提供科学的成长路线图。

Python 是一门解释型、面向对象的高级编程语言,以其简洁的语法和强大的生态著称。涵盖从环境搭建到核心语法的完整入门路径。内容包括 Python 安装配置、虚拟环境管理、基础数据类型(字符串、列表、字典等)、控制流语句(条件判断、循环)、函数定义与参数传递、模块导入机制、异常处理及文件操作。通过实战代码示例,帮助初学者理解变量作用域、内存管理及常见编程模式…

详细阐述了大模型 AI 产品经理所需的知识体系与技能路径。内容涵盖计算机科学基础、人工智能与机器学习原理、大模型技术概览及训练优化、产品管理与商业分析、实战经验积累以及持续学习策略。通过系统化的学习路线,包括从系统设计到提示词工程、平台应用开发、知识库构建、微调开发及多模态应用等阶段,帮助读者构建完整的技术认知,提升在 AI 领域的产品规划与落地能力。

梳理了从零开始的大模型与机器学习学习路径,划分为零基础入门、基础进阶和工作应用三个阶段。推荐了包括机器学习算法数学解析、Python 程序设计、机器学习实战、神经网络与深度学习等核心书籍。内容涵盖机器学习基础、深度学习框架、系统工程及工程化落地方法,帮助开发者建立完整知识体系,掌握从理论到实践的核心技能,并涉及提示词工程、LangChain 框架应用及垂直领…

探讨了基于知识图谱与大模型的个人知识库构建方案。首先介绍了 RAG 技术的基本原理及其在处理长文档时的局限性,随后引出微软提出的 GraphRAG 解决方案,通过结合知识图谱增强 LLM 的推理能力。文章详细阐述了知识图谱的核心概念、GraphRAG 的索引与查询流程,以及 Neo4j LLM KG Builder 的使用体验。通过对比两种工具在复杂问题回答…

详细讲解了 Kotlin 中注解的声明与应用方式。内容包括如何使用 @ 符号应用注解,注解参数的类型限制及 const 修饰符的使用,以及使用点目标控制注解作用范围。此外,还介绍了如何通过注解控制 Java API 可见性,利用注解定制 JSON 序列化行为,以及如何定义自定义注解和元注解。文章涵盖了从基础用法到高级特性如 KClass 引用和泛型参数支持的…

JuiceFS 企业版在 MLPerf 存储基准测试中表现优异。BERT 模型千卡规模下 GPU 利用率超 98%,Unet3D 模型五百卡规模下保持 97% 以上。通过启用分布式缓存,JuiceFS 有效突破了对象存储带宽瓶颈,利用 SSD 聚合提升读吞吐。相比专有高性能存储,JuiceFS 凭借云原生架构与高性价比,更适合大规模 AI 训练场景。测试显示…

基于 ChatGLM-6B 的医疗领域大模型微调实战指南。详细阐述环境配置、开源库下载、指令数据集构建、LoRA 参数训练、权重合并及推理测试等关键步骤。通过优化数据集格式与脚本逻辑,解决常见部署问题,实现针对特定医疗场景的模型定制,为垂直领域大模型应用提供可复现技术方案。

基于 QLoRA 技术对 Qwen7b 大模型进行高效微调的完整流程。内容涵盖环境配置、数据集构建(支持单轮与多轮对话)、模型加载与量化、PEFT 适配器配置、训练过程管理及模型合并部署。通过实际案例演示了如何修改模型的自我认知,并提供了推理测试代码,帮助开发者快速掌握开源大模型的高效微调方法。

系统梳理了大型语言模型(LLM)的学习路径,涵盖基础数学与编程、模型构建与微调、以及应用部署三大方向。内容涉及机器学习原理、Transformer 架构、指令微调、RLHF、量化技术及检索增强生成(RAG)等核心技术点,并整理了相关的工具库与学习资源,旨在为开发者提供从入门到实战的完整参考。

介绍基于 Llama 3.2-Vision 模型的开源工具 ollama-ocr,用于本地图像文字识别。支持多种图片格式,可保留原始文本结构。通过安装 Ollama 环境及调用 npm 包,开发者可实现手写体识别、票据 OCR 及图片问答功能。文章涵盖环境配置、基础用法、自定义提示词及服务端集成示例,对比传统 OCR 优势,并提供性能优化建议,适合需要本地化…

大模型的六项核心技术,包括 Transformer 架构及其优缺点、预训练与微调范式、基于人类反馈的强化学习(RLHF)、模型压缩技术(量化、蒸馏等)、多模态融合方法以及大模型对算力资源的依赖。涵盖了从底层原理到工程落地的关键知识点。

AI 产品经理相较于传统产品经理,在技术边界理解、模型验收及数据分析方面要求更高。文章梳理了从需求定义到迭代反馈的全流程差异,指出 AI 产品更侧重能力交付而非功能实现,并强调了对算法基础及数据质量的深度依赖。主要区别体现在面向对象、实现目标、边界确定性以及工作重心四个方面,要求从业者具备更强的技术理解力和数据敏感度。