复旦：提升LLM在医疗领域的推理能力

优质文章学习记录

21 Jan 2025 — 4 min read

📖标题：FineMedLM-o1: Enhancing the Medical Reasoning Ability of LLM from Supervised Fine-Tuning to Test-Time Training
🌐来源：

🌟摘要

🔸大型语言模型（LLM）的最新进展在疾病诊断和治疗计划等医学应用中显示出希望。然而，大多数现有的医学LLM都难以应对复杂临床场景所需的高级推理，例如鉴别诊断或个性化治疗建议。
🔸我们提出了FineMedLM-o1，它利用高质量的合成医学数据和长形式推理数据进行监督微调（SFT）和直接偏好优化（DPO），实现了高级对话和深度推理功能。此外，我们首次在医学领域引入了测试时间训练（TTT），促进了领域适应，并确保了可靠、准确的推理。
🔸实验结果表明，FineMedLM-o1在关键医疗基准上比先前的模型平均性能提高了23%。此外，TTT的引入使性能提高了14%，突出了其在增强医学推理能力方面的有效性。为了支持这一过程，我们还提出了一种合成医学对话的新方法。与其他开源数据集相比，我们的数据集在质量和复杂性方面都表现出色。项目和数据将在上发布

🛎️文章简介

🔸研究问题：现有医疗领域大语言模型（LLM）在处理复杂医疗问题时缺乏深度推理能力。
🔸主要贡献：论文提出了FineMedLM-o1模型和一种新颖的合成数据生成方法，显著提升了LLM在医疗领域的推理能力和领域适应性。

📝重点思路

🔸数据合成与分类：使用互联网语料库（如Common Crawl）作为基础，从中随机选取420000个样本作为原始医疗文本，并通过Qwen模型对这些数据进行细粒度分类，生成包含5个主要类别和29个次级类别的FineMed数据集。
🔸三阶段监督微调（SFT）：借鉴行业多阶段微调经验，第一阶段从整个医学数据集抽样训练，第二阶段从FineMed的内部医学子集抽样训练，第三阶段从内分泌子集抽样训练
🔸推理能力强化：首先使用一半的o1风格长形式推理数据进行SFT，使模型获得初步推理能力，然后使用剩余的一半数据进行DPO，进一步提升模型的推理能力。
🔸测试时训练（TTT）：在推理阶段引入TTT技术，使模型能够适应特定领域的知识和流程，增强其生成解决方案的鲁棒性和可靠性。

🔎分析总结

🔸模型性能提升：FineMedLM-o1在复杂医疗推理任务上的表现显著优于FineMedLM，推理能力提升了约27个百分点，并在多个医疗基准测试中表现出色。
🔸数据集质量验证：通过LLM-as-a-judge方法评估，FineMed数据集在指令质量和复杂性方面均优于其他开源医疗SFT数据集。
🔸三阶段SFT的有效性：实验表明，采用三阶段SFT策略的FineMedLM在所有基准测试中均优于未采用多阶段训练的基线模型，最大性能提升达15%。
🔸TTT的贡献：引入TTT技术进一步提升了FineMedLM-o1的推理能力，使其在复杂医疗任务上的表现接近GPT-4o-mini。

💡个人观点

论文的核心在于通过数据合成、三阶段SFT和TTT来训练模型推理能力。

🧩附录

安装启动使用 Neo4j的超详细教程

最近在做一个基于知识图谱的智能生成项目。需要用到Neo4j图数据库。写这篇文章记录一下Neo4j的安装及其使用。一.Neo4j的安装 1.首先安装JDK，配环境变量。（参照网上教程，很多） Neo4j是基于Java的图形数据库，运行Neo4j需要启动JVM进程，因此必须安装JAVA SE的JDK。从Oracle官方网站下载 Java SE JDK。我使用的版本是JDK1.8 2.官网上安装neo4j。官方网址：https://neo4j.com/deployment-center/ 在官网上下载对应版本。Neo4j应用程序有如下主要的目录结构： bin目录：用于存储Neo4j的可执行程序； conf目录：用于控制Neo4j启动的配置文件； data目录：用于存储核心数据库文件； plugins目录：用于存储Neo4j的插件； 3.配置环境变量创建主目录环境变量NEO4J_HOME，并把主目录设置为变量值。复制具体的neo4j文件地址作为变量值。配置文档存储在conf目录下，Neo4j通过配置文件neo4j.conf控制服务器的工作。默认情况下，不需

企业微信群机器人Webhook配置全攻略：从创建到发送消息的完整流程

企业微信群机器人Webhook配置全攻略：从创建到发送消息的完整流程在数字化办公日益普及的今天，企业微信作为国内领先的企业级通讯工具，其群机器人功能为团队协作带来了极大的便利。本文将手把手教你如何从零开始配置企业微信群机器人Webhook，实现自动化消息推送，提升团队沟通效率。 1. 准备工作与环境配置在开始创建机器人之前，需要确保满足以下基本条件： * 企业微信账号：拥有有效的企业微信管理员或成员账号 * 群聊条件：至少包含3名成员的群聊（这是创建机器人的最低人数要求） * 网络环境：能够正常访问企业微信服务器提示：如果是企业管理员，建议先在"企业微信管理后台"确认机器人功能是否已对企业开放。某些企业可能出于安全考虑会限制此功能。 2. 创建群机器人 2.1 添加机器人到群聊 1. 打开企业微信客户端，进入目标群聊 2. 点击右上角的群菜单按钮（通常显示为"..."或"⋮"） 3. 选择"添加群机器人"选项 4.

Flowise物联网融合：与智能家居设备联动的应用设想

Flowise物联网融合：与智能家居设备联动的应用设想 1. Flowise：让AI工作流变得像搭积木一样简单 Flowise 是一个真正把“AI平民化”落地的工具。它不像传统开发那样需要写几十行 LangChain 代码、配置向量库、调试提示词模板，而是把所有这些能力打包成一个个可拖拽的节点——就像小时候玩乐高，你不需要懂塑料怎么合成，只要知道哪块该拼在哪，就能搭出一座城堡。它诞生于2023年，短短一年就收获了45.6k GitHub Stars，MIT协议开源，意味着你可以放心把它用在公司内部系统里，甚至嵌入到客户交付的产品中，完全不用担心授权问题。最打动人的不是它的技术多炫酷，而是它真的“不挑人”：产品经理能搭出知识库问答机器人，运营同学能配出自动抓取竞品文案的Agent，连刚学Python两周的实习生，也能在5分钟内跑通一个本地大模型的RAG流程。它的核心逻辑很朴素：把LangChain里那些抽象概念——比如LLM调用、文档切分、向量检索、工具调用——变成画布上看得见、摸得着的方块。你拖一个“Ollama LLM”节点，再拖一个“Chroma Vector

OpenClaw配置Bot接入飞书机器人+Kimi2.5

上一篇文章写了Ubuntu_24.04下安装OpenClaw的过程，这篇文档记录一下接入飞书机器+Kimi2.5。准备工作飞书创建飞书机器人访问飞书开放平台：https://open.feishu.cn/app，点击创建应用：填写应用名称和描述后就直接创建：复制App ID 和 App Secret 创建成功后，在“凭证与基础信息”中找到 App ID 和 App Secret，把这2个信息复制记录下来，后面需要配置到openclaw中配置权限点击【权限管理】→【开通权限】或使用【批量导入/导出权限】，选择导入，输入以下内容，如下图点击【下一步，确认新增权限】即可开通所需要的权限。配置事件与回调说明：这一步的配置需要先讲AppId和AppSecret配置到openclaw成功之后再设置订阅方式，

🌟摘要