BoltzGen:安装与使用
项目地址:https://github.com/HannesStark/boltzgen
BoltzGen 开发背景

2024 年,麻省理工学院 Jameel Clinic 研究团队推出了开源的 Boltz-1 模型。Boltz-1 采用扩散模型与 Transformer 架构相结合的生成体系,能够在原子级别预测蛋白质、RNA、DNA 及小分子复合物结构。其灵活的条件化接口,让模型能针对特定结合位点或分子构象进行精准建模,极大拓宽了其产业应用范围,从新型抗体设计、酶工程优化,到小分子配体筛选,都能在 Boltz-1 框架下实现端到端预测,大大降低了生物计算的进入门槛。
2025 年,麻省理工学院 Jameel Clinic 团队在 Boltz-1 的基础上推出了 Boltz-2 模型。将蛋白折叠预测精度推至新高,被称为「结构生物学的 GPT-4」。相比前作,Boltz-2 在生成精度和计算效率上实现了显著提升,同时引入了多模态条件化输入,使其能够整合序列信息、实验数据及化学性质,实现更为精细的分子设计。在全球生物计算与药物发现迈向「全场景生成」的浪潮中,Boltz-2 的出现进一步填补了学术界与产业界对高可用、可扩展、可商用工具的需求。Boltz-2 继承并优化了扩散模型与 Transformer 架构的混合生成体系,其核心 Trunk 模块能够一次性提取蛋白质或核酸复合物的多层次表示,而 Diffusion 模块则在此基础上进行结构生成和优化。在此基础上,Boltz-2 引入了结合亲和力预测,超越了结构预测的范畴,能够捕捉分子间识别和相互作用的紧密程度。通过在同一框架内耦合结构预测和结合预测,Boltz-2 加深了人们对分子相互作用的理解,并为生成式设计奠定了基础。
2025 年 10 月,麻省理工学院研究团队推出 BoltzGen 开源 AI 模型,该模型突破了传统药物设计的局限,能够针对核酸、小分子及有序无序蛋白质等"任何"靶点进行通用治疗设计,涵盖纳米抗体、微型结合体等多元模态。通过多个湿实验室验证,在 9 个疾病相关靶点中实现 6 个靶点的纳摩尔级结合亲和力,为解决"不可药物靶点"难题提供新路径。针对传统的蛋白设计依赖物理计算、计算成本高、设计空间受限,且难以同时处理多模态目标的局限,BoltzGen 以几何连续表示代替传统离散残基标签,实现蛋白折叠与结合体设计的联合训练,并构建了灵活的设计规范语言,实现了跨分子类型的可控生成,提高了模型的设计效率、通用性和可解释性。
在药物研发和生物分子工程领域,「De-novo 蛋白设计(De-novo Binder Design)」是药物研发自动化的核心方法之一。研究人员能够借助计算模拟与深度学习,在特定靶点上生成具有结合能力的肽链或蛋白结构,抗体、纳米抗体、环肽等新型药物形态的开发也因此成为可能。然而,传统的蛋白设计策略多依赖基于分子动力学模拟等物理计算及序列优化算法。虽然在单个体系中可达高精度,但计算成本高、设计空间受限,且难以同时处理蛋白质小分子和 RNA 等多模态目标。而目前的深度生成模型一定程度上提高了生成速度,却普遍缺乏「原子级别」的结构推理能力,针对特定类别分子进行优化,通用性有限;同时,其模型评估常依赖训练集中已有相似复合物,难以验证其对「未见靶点」的泛化能力,缺乏可控的生成机制与灵活的结构约束表达,存在设计效率和可解释性局限。针对这一问题 BoltzGen,不仅以几何连续表示代替传统离散残基标签,在单一体系中实现蛋白折叠与结合体设计的联合训练,而且构建了灵活的「设计规范语言」,实现了跨分子类型的可控生成。
工作原理
BoltzGen 流程采用单一的全原子生成模型,将设计和结构预测统一起来。基于几何结构的残基类型表示方法使得同时进行这两项任务的可扩展训练成为可能。因此,与以往任何设计模型不同,BoltzGen 的性能可与最先进的折叠模型相媲美。BoltzGen 基于结构的靶标 - 结合剂相互作用推理支持设计针对新型靶标的高亲和力结合剂,这些靶标与训练过程中观察到的复合物无关。此外,它还提供了一种设计规范语言,该语言为各种约束(包括共价键、结构基团、结合位点、二级结构和设计掩码)提供了一个富有表现力的接口,这些约束在推理过程中引导扩散过程朝着特定的设计目标发展。这种语言具有通用性,允许在单次生成过程中添加多个约束,从而涵盖广泛的实验设计目标。除了核心扩散模型之外,我们还引入了一个用于端到端粘合剂设计的集成流程,该流程增加了下游验证、重新设计和排序模块,以缩小湿实验室就绪设计的小范围多样化设计集,用于实验筛选。
针对一系列高难度基准测试和实际应用场景中的结合剂设计挑战对 BoltzGen 进行了评估,并通过实验验证了其在活细胞中的结合能力和功能。我们发现,BoltzGen 能够与多种生物分子和靶点形成强效结合,这些靶点与任何结合蛋白的结构都存在显著差异。这些设计包括针对小分子、肽、酶和蛋白质靶点的纳米抗体、微型蛋白、线性肽和大环结合剂,其中还包括经实验验证的针对固有无序区域的结合剂。

模型架构 - 从噪声到结构的全原子推理:
该模型保留了 AlphaFold3 和 Boltz-2 架构的主要组件,并在此基础上进行了部分改进,以引入更多的条件输入。如下图所示,整个模型被分为两个主要部分:一个较大的 Trunk(主干网络),以及一个 Diffusion Module(扩散模块)。其中,Trunk 负责生成用于条件控制的 token 表征和 pairwise(成对)表征,而扩散模块则在此基础上生成三维结构。Trunk 仅运行一次,而扩散模块会多次迭代运行,以逐步去噪所有原子的三维坐标。

BoltzGen 模型架构图
在 Trunk 阶段,其与 Boltz-2 的 Trunk 模块相似,负责解析输入的蛋白结构与目标信息。**Trunk 模块处理的是经过 token 化的分子结构,**主体采用 PairFormer 架构,通过三角注意力(Triangle Attention)高效建模原子之间的空间关系;同时结合几何残基编码(Geometric Residue Encoding),在连续空间中同时推断残基类型与原子坐标,不再依赖离散的氨基酸标签。这一机制让模型能在生成时真正理解结构物理规律,而非仅依靠数据记忆。
在 Diffusion Module 阶段,**该模块接收带噪声的三维原子坐标(noisy 3D atomic coordinates)作为输入,**并预测其去噪后的坐标。同时,其采用标准的 Transformer 架构,在原子层级(atom level)和 token 层级(token level)上共同运行。BoltzGen 利用连续空间扩散模型对原子坐标进行逐步「去噪」生成,通过预测噪声向量实现从随机初态到稳定构象的转化,并在生成过程中保留分子能量面的约束,从而避免物理冲突或结构塌陷。


实验验证 - 面向生物体系的通用设计模型:
在实验部分,BoltzGen 模型的性能验证覆盖了从蛋白质到肽类、从新型病原体到小分子靶标的多个维度,展现出卓越的泛化与可控性。**团队在 8 个独立的湿实验验证项目中共测试了 26 个靶标,**涉及纳米抗体、蛋白质、线性与环状肽等多种结合体类型。结果显示,BoltzGen 在未见过的复杂目标上依然保持了高成功率:在 9 个与训练数据完全不同的新靶标实验中,所设计的蛋白质与纳米抗体均在 66% 的靶标上获得纳摩尔级(nM)高亲和力结合,显示出模型的强大的结构推理与跨模态设计能力。
**在针对多样结构的生物活性肽实验中,**BoltzGen 设计的蛋白质能以纳摩尔至微摩尔(μM)级的亲和力结合不同类型的肽分子,并有效中和其抗菌或溶血活性。针对急性髓系白血病相关的无序蛋白 NPM1,模型生成的多肽在活细胞中表现出核仁共定位,提供了首个体内证据支持 AI 设计的蛋白可与天然无序蛋白结合。
**BoltzGen 还在两个具有生物医学意义的小分子上展示了跨尺度设计能力,**生成的蛋白结合体在 50–150 µM 范围内显示出可检测的结合活性,证明该模型在无需专家化学指导的前提下即可实现小分子识别。此外,针对细菌 DNA 回旋酶 GyrA 的抗菌肽设计中,超过 19% 的候选序列能使细菌生长下降四倍以上,其中部分肽能直接杀灭宿主细胞。
**设计与小分子结合的蛋白质,在 5 个包含已知结合结构的基准靶标测试中(如 PD-L1、TNFα、PDGFR 等),**BoltzGen 同样取得高命中率——80% 的靶标出现纳摩尔级结合体,验证了其与当前最优模型持平的精度。
总体来看,这一系列实验表明 BoltzGen 不仅能在已知数据分布内再现高质量结合结构,更能在完全陌生的生物体系中实现功能性设计。其统一的全原子生成架构使「设计—预测—验证」流程融为一体,为未来的药物发现与生物分子工程提供了开放、可控且可扩展的 AI 基础设施。
我们推断基于结构的结合剂设计需要强大的结构预测和推理能力。BoltzGen 能够同时执行设计与折叠任务,其折叠性能与 Boltz-2 相当。下图中展示的是每个复合体在 5 个扩散样本中取得的最高局部距离差异测试分数(lDDT)。

总结
- BoltzGen是一种新型生成模型,用于设计任何形式的蛋白质和肽,使其能够结合各种生物分子靶标。
- 它统一了设计和结构预测,从而生成一个单一模型,该模型还能实现最先进的折叠性能。BoltzGen 的生成过程可以通过灵活的设计规范语言进行控制,该语言可以控制共价键、结构约束、结合位点等。
- BoltzGen 由麻省理工学院开发,并在涉及多个学术和工业实验室的大规模分布式研究中进行了实验验证。这些团队独立验证了设计的纳米抗体、微型结合剂、肽和环状肽对各种新型靶点(例如小分子、肽和具有无序区域的蛋白质)的活性,并进行了包括活细胞功能检测在内的可靠实验验证。
- 我们明确地将实验验证的重点放在与任何已存在结合结构的蛋白质都高度不同的目标上——更忠实地反映真实的发现过程。
- BoltzGen 与 Boltz-1 和 Boltz-2 一样,是根据 MIT 许可证开源的,可以免费用于不受限制的学术和商业用途,包括数据、模型权重、训练和推理代码。
BoltzGen 安装
创建 boltzgen 的 conda 环境:
conda create -n boltzgen python=3.12
激活环境:
conda activate boltzgen
使用 pip 安装 boltzgen:
pip install boltzgen
如果遇到没有自动安装的包,手动安装即可,例如:
pip install psutil py-cpuinfo pydantic pint pydantic
再次运行配置 boltzgen:
pip install boltzgen
安装完成。
如果运行中提示:Warning: PYTORCH_CUDA_ALLOC_CONF is deprecated, use PYTORCH_ALLOC_CONF instead (function operator())
则需要更新升级 Pytorch:
pip install --upgrade torch torchvision
BoltzGen 运行
运行示例
初次运行,会将模型(约 6GB)下载到~/.cache. 这可以通过传递参数--cache YOUR_PATH或设置来更改$HF_HOME。
如果运行被中断,你可以使用以下命令重新开始--reuse。不会丢失任何进度。
boltzgen run example/vanilla_protein/1g13prot.yaml \
--output workbench/test_run \
--protocol protein-anything \
--num_designs 10 \
--budget 2
# --num_designs is the number of intermediate designs. In practice you will want between 10,000 - 60,000
# --budget is how many designs should be in the final diversity optimized set



boltzgen设计步骤
- 创建一份
.yaml文件,其中指定您的目标和您想要设计的内容。我们提供了许多示例,例如example/vanilla_peptide_with_target_binding_site/beetletert.yaml。详情请参阅 '如何创建设计规范 .yaml 文件'。 - 检查您的设计规范是否符合预期。
- 运行
boltzgen check example/vanilla_peptide_with_target_binding_site/beetletert.yaml。 - 在蛋白质结构查看器(例如 PyMOL、Chimera 或在线查看器:https://molstar.org/viewer/)中可视化生成的 mmcif 文件。
- 您的查看器应该将结合位点显示为与靶标其余部分不同的颜色。
- 运行
- 对文件运行
boltzgen run ...上述命令.yaml。 - 您筛选并排名后的设计集将显示在
--output。 - 您可能需要使用不同的设置重新运行过滤步骤(大约需要 15 秒)。使用
boltzgen run --steps filtering --output ...Jupyter Notebookfilter.ipynb通常更方便。详细说明请参见 '重新运行过滤'。
boltzgen需要生成多少个设计?
越多越好。'最小'数量取决于您的目标。BoltzGen 应该在 GPU 上运行。下图显示的是在 A100 GPU 上生成单个设计时,流水线中每个步骤所需的时间。

建议先用例如 10,000 运行 --num_design 50,检查一切是否按预期运行,然后再增加到 --num_design 10,000 到 60,000 之间。
如何创建设计规范 .yaml 文件
.yaml关于我们的设计规范文件如何运作的更详细说明,请参阅 example/README.md 文件。以下是一个基于示例的说明,足以应对大多数任务。
注意:所有残基索引均从 1 开始指定,我们使用的是标准的 mmcif 残基索引 label_asym_id,而不是作者残基索引!
文件创建完成后,.yaml我们建议您 check对该文件运行以下命令:
run boltzgen check example/vanilla_peptide_with_target_binding_site/beetletert.yaml。- 在蛋白质结构查看器(例如 PyMOL、Chimera 或在线查看器:https://molstar.org/viewer/)中可视化生成的 mmcif 文件。
- 您的查看器应该将结合位点显示为与靶标其余部分不同的颜色。
example/目录中提供了许多.yaml示例文件,包括:
example/design_spec_showcasing_all_functionalities.yamlexample/vanilla_peptide_with_target_binding_site/beetletert.yamlexample/peptide_against_specific_site_on_ragc/rragc.yamlexample/nanobody_against_penguinpox/penguinpox.yamlexample/denovo_zinc_finger_against_dna/zinc_finger.yamlexample/protein_binding_small_molecule/chorismite.yaml
以下是一个针对目标蛋白设计蛋白质的简单示例,未指定结合位点:
entities: # Designed protein with between 80 and 140 residues # (The lenght is randomly sampled)
- protein:
id: B
sequence: 80..140
# The target is extracted from a .cif file
- file:
# file references are relative to the location of the .yaml file
path: 6m1u.cif
# .pdb files also work
# Which chain in the .cif file to use as target (uses all chains if unspecified)
include:
- chain:
id: A
yaml 文件中的文件引用(例如对 cif 文件的引用)是相对于 yaml 文件所在的目录进行的。
仅运行特定的步骤
您可以使用该标志仅运行管道的特定部分 --steps:
仅运行设计和逆折叠步骤:
boltzgen run example/cyclotide/3ivq.yaml \
--output workbench/partial-run \
--protocol peptide-anything \
--steps design inverse_folding \
--num_designs 2
可采取的步骤:
design- 根据您的设计规范,使用扩散模型生成 num_design 候选设计方案inverse_folding- 使用我们的逆向折叠模型重新设计上一步的序列folding- 使用 Boltz-2 模型重新折叠带有目标的已设计好的活页夹design_folding- 单独重新折叠设计的结合物,不涉及靶标(肽和纳米抗体结合物禁用)affinity- 使用 Boltz-2 预测设计蛋白质与其靶向小分子之间的结合亲和力(仅适用于小分子结合剂的设计)analysis- 利用各种指标分析折叠结构,以评估其设计质量filtering- 根据分析结果筛选和排序设计方案,以选出最佳候选方案。
重新运行筛选(推荐)
生成设计后,您可能需要多次重新运行筛选步骤(运行速度非常快),以调整选择优秀设计的标准。
boltzgen您可以使用命令行或我们提供的 Jupyter Notebook 来运行过滤步骤。大多数情况下,使用 Notebook 更方便。如果您更喜欢使用命令行,以下示例展示了如何在不使用 Notebook 的情况下重新运行过滤步骤。
首先,假设我们最初生成了一些具有默认过滤选项的设计:
boltzgen run example/binding_disordered_peptides/tpp4.yaml \
--output workbench/tpp4 \
--protocol protein-anything \
--num_designs 20
运行之后我们发现只有少数设计通过了筛选。现在我们可以通过运行以下命令来调整筛选条件:
boltzgen run example/binding_disordered_peptides/tpp4.yaml \
--output workbench/tpp4 \
--protocol protein-anything \
--steps filtering \
--refolding_rmsd_threshold 3.0 \
--filter_biased=false \
--additional_filters 'ALA_fraction<0.3' 'filter_rmsd_design<2.5' \
--metrics_override plip_hbonds_refolded=4 \
--alpha 0.2
所有命令行参数说明
boltzgen run
该 boltzgen run 命令执行 BoltzGen 绑定器设计流程。以下是所有可用选项:
通用配置
--protocol {protein-anything,peptide-anything,protein-small_molecule,nanobody-anything}- 设计过程中使用的协议。此协议决定默认设置,并在某些情况下决定运行哪些步骤。默认值:蛋白质 - 任意类型。详情请参阅 '协议'部分。--output OUTPUT- 管道结果的输出目录--config CONFIG [CONFIG ...]- 覆盖流水线步骤配置,格式为<step_name> <arg1>=<value1> <arg2>=<value2> ...(例如--config folding num_workers=4 trainer.devices=4:)。可多次使用。--devices DEVICES- 要使用的设备数量。默认值为所有可用设备。--num_workers NUM_WORKERS- DataLoader 工作进程数。--config_dir CONFIG_DIR- 默认配置文件所在的目录路径。默认值:src/boltzgen/resources/config--use_kernels {auto,true,false}- 是否使用内核。取值范围为'auto'、'true'或'false'。默认值为'auto'。如果为'auto',则当设备功能大于等于 8 时,将使用内核。--moldir MOLDIR- 模具目录路径。默认值:huggingface:boltzgen/inference-data:mols.zip
设计 design
--num_designs NUM_DESIGNS- 要生成的设计总数。通常情况下,这个数字约为 10,000。生成 10,000 个设计后,我们会--budget在筛选步骤中进一步筛选,最终得到许多设计。--diffusion_batch_size DIFFUSION_BATCH_SIZE- 每次主干运行要生成的扩散样本数量。如果未指定,则当--num-designs小于 100 时默认为 1,否则默认为 10。请注意,对于随机采样结合剂长度(或以其他方式使用随机性)的设计任务,同一批次生成的所有设计将具有相同的长度。因此,如果扩散批次大小相对于要生成的设计总数过大,则无法均匀地采样所有可能的长度。--design_checkpoints DESIGN_CHECKPOINTS [DESIGN_CHECKPOINTS ...]- 指向 Boltzgen 检查点的路径。支持一个或多个检查点。只需在此处指定单个路径即可。每个检查点将用于相同比例的设计。默认情况下,使用两个检查点。默认值:['huggingface:boltzgen/boltzgen1_diverse:boltzgen1_diverse.ckpt', 'huggingface:boltzgen/boltzgen1_adherence:boltzgen1_adherence.ckpt']--step_scale STEP_SCALE- 要使用的固定步长比例(例如 1.8)。默认使用日程表。--noise_scale NOISE_SCALE- 使用的固定噪声尺度(例如 0.98)。默认情况下使用日程表。
逆折叠 inverse_folding
--skip_inverse_folding- 跳过逆折叠步骤--inverse_fold_num_sequences INVERSE_FOLD_NUM_SEQUENCES- 反向折叠步骤中每个骨架要生成的序列数。默认值:1--inverse_fold_checkpoint INVERSE_FOLD_CHECKPOINT- Hugging Face 仓库的路径和反向折叠检查点的文件名。默认值:huggingface:boltzgen/boltzgen1_ifold:boltzgen1_ifold.ckpt--inverse_fold_avoid INVERSE_FOLD_AVOID- 不允许的残基以单字母氨基酸代码字符串的形式出现,例如'KEC'。此设置应用于反向折叠步骤,因此仅在启用反向折叠时才会影响结果。默认值:蛋白质设计为'无',肽和纳米抗体设计为'C'。如果您在使用纳米抗体或肽方案时希望生成半胱氨酸,请传递一个空列表。--only_inverse_fold- 跳过设计步骤,仅执行逆向折叠。需要完全指定的结构。
折叠和亲和力预测 affinity prediction
--folding_checkpoint FOLDING_CHECKPOINT- 折叠检查点的路径。默认值:huggingface:boltzgen/boltz2_conf_final:boltz2_conf_final.ckpt--affinity_checkpoint AFFINITY_CHECKPOINT- 亲和力预测器检查点的路径。默认值:huggingface:boltzgen/boltz2_affinity:boltz2_aff.ckpt
过滤 filter
--budget BUDGET最终的多样性优化集合中应该包含多少个设计?这用于筛选步骤。--alpha ALPHA- 序列多样性选择的权衡:0.0=仅质量,1.0=仅多样性。默认值为 0.01(肽 - 任何协议)或 0.001(其他协议)。--filter_biased {true,false}- 移除氨基酸组成异常值(默认限制 ALA/GLY/GLU/LEU/VAL)。默认值:true。--metrics_override METRICS_OVERRIDE [METRICS_OVERRIDE ...]- 用于排名的指标反向重要性权重。格式:(metric_name=weight例如,plip_hbonds_refolded=4 delta_sasa_refolded=2)。数值越大,该指标的排名权重越低。用于metric_name=none移除指标。--additional_filters ADDITIONAL_FILTERS [ADDITIONAL_FILTERS ...]- 更严格的过滤器。格式:feature>threshold或feature<threshold(例如,'design_ALA>0.3' 'design_GLY<0.2')。如果数值越大越好,请使用'>';如果数值越小越好,请使用'<'。请务必使用单引号将字符串括起来,以免 shell 混淆'<'和'>'字符。--size_buckets SIZE_BUCKETS [SIZE_BUCKETS ...]- 可选的约束条件,用于限制尺寸范围内设计的最大数量。格式:(min-max:count例如,10-20:5 20-30:10 30-40:5)。--refolding_rmsd_threshold REFOLDING_RMSD_THRESHOLD- 用于基于 RMSD 的滤波器的阈值(越低越好)。
选项
--reuse- 在所有步骤中复用现有结果。仅生成达到指定设计总数所需的新设计数量。--no_subprocess- 按主流程运行每个步骤。当设备数量大于 1 时会引发问题。--steps {design,inverse_folding,design_folding,folding,affinity,analysis,filtering} [{design,inverse_folding,design_folding,folding,affinity,analysis,filtering} ...]- 仅运行指定的流程步骤(默认:运行所有步骤)。有关详细信息,请参阅 '各个流程步骤'部分。
模型和数据下载选项
--force_download- 强制(重新)下载模型和数据。--models_token MODELS_TOKEN- 用于我们模型托管服务(Hugging Face)的密钥。默认值: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--cache CACHE- 下载的模型将存储在哪个目录中。默认值:~/.cache
boltzgen download 命令
该 boltzgen download 命令会下载 BoltzGen 所需的模型权重和数据文件。大多数情况下,您无需使用该命令 boltzgen download,因为 boltzgen run 它会自动下载所需内容。
默认情况下,下载的权重和数据集存储在 中,~/.cache 但可以通过指定 来更改此设置 --cache。
例子
boltzgen download all # downloads all models
boltzgen download inverse-fold # downloads only the inverse folding model
用法
boltzgen download [-h] [--force_download] [--models_token MODELS_TOKEN] [--cache CACHE] {affinity,design-adherence,design-diverse,folding,inverse-fold,moldir,all} [{affinity,design-adherence,design-diverse,folding,inverse-fold,moldir,all} ...]
位置参数
{affinity,design-adherence,design-diverse,folding,inverse-fold,moldir,all}- 要下载的工件子集,或者选择'全部'以下载所有工件。
选项
--force_download- 强制(重新)下载模型和数据。--models_token MODELS_TOKEN- 用于我们模型托管服务的密钥。通常不需要。--cache CACHE- 下载的模型将存储在哪个目录中。默认值:~/.cache
boltzgen configure
为了更好地控制设计过程,您可以将配置生成与执行分开:
例子
boltzgen configure example/cyclotide/3ivq.yaml \
--output workbench/test-peptide-protein \
--protocol peptide-anything \
--num_designs 2
这样会在不运行实际设计流程的情况下创建配置文件 workbench/test-peptide-protein/。您可以根据需要编辑这些文件,然后运行 boltzgen execute workbench/test-peptide-protein 以启动工作流。
这里列出的选项 boltzgen configure 只是部分选项 boltzgen run,所以我们不再一一列举。boltzgen configure --help 如有需要,请尝试其他方法。
boltzgen execute
该 boltzgen execute 命令从该命令生成的配置文件目录中执行预先配置的管道 boltzgen configure。
用法
boltzgen execute [-h] [--reuse] [--no_subprocess] [--steps {design,inverse_folding,design_folding,folding,affinity,analysis,filtering} [{design,inverse_folding,design_folding,folding,affinity,analysis,filtering} ...]] output
位置参数
output- 包含预配置流水线文件的目录(由'configure'命令生成)
选项
--reuse- 在所有步骤中复用现有结果。仅生成达到指定设计总数所需的新设计数量。--no_subprocess- 按主流程运行每个步骤。当设备数量大于 1 时会引发问题。--steps {design,inverse_folding,design_folding,folding,affinity,analysis,filtering} [{design,inverse_folding,design_folding,folding,affinity,analysis,filtering} ...]- 仅运行指定的流程步骤(默认:运行所有步骤)
训练 BoltzGen 模型
以开发模式安装,这将安装额外的软件包,并下载训练数据和检查点,通过配置 YAML 文件,训练 BoltzGen 模型。


