DrugCLIP 网页版使用指南
清华大学团队在《Science》发表的 DrugCLIP 模型实现了高效的蛋白–配体打分计算。该模型通常依赖高性能 GPU(如 A100),但官方提供网页版以降低硬件门槛,无需本地部署即可快速完成检索。
核心功能与逻辑
想快速上手任何 AI 工具,理解以下 3 个核心问题即可:
- 核心功能:给口袋找配体,或给配体找口袋。
- 应用域:适用于蛋白质 - 小分子口袋的筛选。
- 输入输出:明确输入格式与预期结果。
功能说明
- 给口袋找配体:已知目标口袋,在网站可选的化合物库中,快速筛选出最可能与之结合的化合物。
- 给配体找口袋:已知目标配体,在网站自带的蛋白口袋库中,精准匹配出最可能与之结合的口袋。
输入输出对应关系
| 输入 | Model | 输出 |
|---|---|---|
| 口袋 | DrugCLIP | 可能与之'结合'的配体 |
| 配体 | DrugCLIP | 可能与之'结合'的口袋 |
注意事项
- 文件格式:必须严格按照网站示例模板准备。需要蛋白 PDB 文件,这是后续提取口袋的基础。
- 口袋位置:口袋位置一定要给准。DrugCLIP 对口袋构象的要求相对宽松,但最怕口袋位置找错——位置一错,结果肯定不准。
操作步骤
类型一:给口袋(已知)找配体
以 CYPA 蛋白为例(PDB:8G9P,https://www.rcsb.org/structure/8G9P)。
1. 目标蛋白和配体预处理
在 PyMOL 或 RCSB 网站下载蛋白的 pdb 文件,得到 8G9P.pdb,然后建议删除水、删除其他蛋白及其他杂质,仅保留目标蛋白和配体,另存为 8g9p_protein.pdb 和 8g9p_lig.sdf,注意保存格式。
支持的文件格式包括:.pdb, .cif, .sdf, .mol2。确保上传的文件包含完整的蛋白受体结构。

2. 上传网站及选择口袋提取方法
将刚刚提取的蛋白 pdb 文件上传,并从以下四种方法中选择一种:
- By Upload Ligand:上传配体文件,基于配体位置自动识别口袋。需确保配体对接到正确的蛋白口袋中。
- By Het Id:上传无配体的 pdb 文件,输入配体的 Het Id 即可识别对应口袋。






