本地笔记本运行 BioMedGPT 大模型入门教程
以大语言模型 (LLM) 为核心的 AI 技术正在快速发展。对于工程师而言,掌握与 AI 交流的能力(如 Prompt Engineering)以及理解模型运行机制变得尤为重要。然而,从零入门大模型技术存在一定门槛,例如对硬件资源(内存、GPU)的要求较高。
本文旨在提供一份详细的本地部署指南,帮助开发者在普通家用笔记本(MacBook 或 Windows)上运行开源的生物医药领域大模型 BioMedGPT-LM-7B。该模型基于 Llama-2-7B 架构,针对生物医药语料进行了增量训练。通过本教程,你将学会如何配置环境、下载模型、加载模型并执行文本生成推理。
前置准备
硬件建议
虽然本教程针对 CPU 环境优化,但为了获得较好的体验,建议:
- 内存:至少 16GB RAM(8GB 可能无法加载 7B 模型)。
- 存储:预留 20GB 以上空间用于模型文件及缓存。
- 网络:稳定连接以从 Hugging Face 下载模型。
软件依赖
- Python 3.10 及以上版本。
- Conda 环境管理工具(推荐)。
- Git(用于克隆仓库)。
第一部分:MacBook 环境搭建与运行
1. 环境配置
推荐使用 Miniconda 管理 Python 环境,避免系统自带 Python 冲突。
安装 Miniconda
访问 Miniconda 官网下载 macOS ARM64 版本安装包并安装。安装完成后,打开终端验证:
conda --version
创建虚拟环境
创建名为 biomedgpt 的环境,指定 Python 版本为 3.10:
conda create -n biomedgpt python=3.10
conda activate biomedgpt
安装核心库
安装 PyTorch 和 Transformers 库。Mac M1/M2 芯片需使用 Apple Silicon 版本的 PyTorch。
安装 PyTorch:
pip install torch torchvision torchaudio
注:若 pip 安装缓慢,可指定国内镜像源,如清华源:
pip install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple
安装 Transformers:
pip install transformers
2. 模型下载
BioMedGPT-LM-7B 托管于 Hugging Face Hub。由于模型文件较大(约 14GB),推荐使用以下三种方式之一下载。
方式一:使用 Git 下载
确保已安装 Git 和 Git LFS(Large File Storage):
brew install git
brew install git-lfs
git lfs install
然后克隆仓库:
git clone https://huggingface.co/PharMolix/BioMedGPT-LM-7B
cd PharMolix/BioMedGPT-LM-7B


