llamafactory/hparams/finetuning_args.py 【源码解析】

llamafactory/hparams/finetuning_args.py 【源码解析】
@dataclass
class FinetuningArguments(FreezeArguments, LoraArguments, RLHFArguments, GaloreArguments, BAdamArgument):
    r"""
    Arguments pertaining to which techniques we are going to fine-tuning with.
    """

    pure_bf16: bool = field(
        default=False,
        metadata={"help": "Whether or not to train model in purely bf16 precision (without AMP)."},
    )
    stage: Literal["pt", "sft", "rm", "ppo", "dpo", "kto"] = field(
        default="sft",
        metadata={"help": "Which stage will be performed in training."},
    )
    finetuning_type: Literal["lora", "freeze", "full"] = field(
        default="lora",
        metadata={"help": "Which fine-tuning method to use."},
    )
    use_llama_pro: bool = field(
        default=False,
        metadata={"help": "Whether or not to make only the parameters in the expanded blocks trainable."},
    )
    freeze_vision_tower: bool = field(
        default=True,
        metadata={"help": "Whether ot not to freeze vision tower in MLLM training."},
    )
    train_mm_proj_only: bool = field(
        default=False,
        metadata={"help": "Whether or not to train the multimodal projector for MLLM only."},
    )
    plot_loss: bool = field(
        default=False,
        metadata={"help": "Whether or not to save the training loss curves."},
    )

我们逐行解释这段代码。

数据类定义和继承

python

复制

@dataclass
class FinetuningArguments(FreezeArguments, LoraArguments, RLHFArguments, GaloreArguments, BAdamArgument):
    r"""
    Arguments pertaining to which techniques we are going to fine-tuning with.
    """
  • 使用 @dataclass 装饰器定义一个名为 FinetuningArguments 的数据类。
  • 该类继承自多个基类:FreezeArgumentsLoraArgumentsRLHFArgumentsGaloreArgumentsBAdamArgument
  • 文档字符串说明:该类包含与微调技术相关的参数。

pure_bf16 字段

python

复制

    pure_bf16: bool = field(
        default=False,
        metadata={"help": "Whether or not to train model in purely bf16 precision (without AMP)."},
    )
  • 定义一个名为 pure_bf16 的字段,类型为 bool
  • 默认值为 False
  • metadata 字典包含一个帮助信息,说明该字段表示是否使用纯 bf16 精度(不使用 AMP)进行模型训练。

stage 字段

python

复制

    stage: Literal["pt", "sft", "rm", "ppo", "dpo", "kto"] = field(
        default="sft",
        metadata={"help": "Which stage will be performed in training."},
    )
  • 定义一个名为 stage 的字段,类型为 Literal,可取值为 "pt""sft""rm""ppo""dpo""kto"
  • 默认值为 "sft"
  • metadata 字典包含一个帮助信息,说明该字段表示训练过程中执行的阶段。

finetuning_type 字段

python

复制

    finetuning_type: Literal["lora", "freeze", "full"] = field(
        default="lora",
        metadata={"help": "Which fine-tuning method to use."},
    )
  • 定义一个名为 finetuning_type 的字段,类型为 Literal,可取值为 "lora""freeze""full"
  • 默认值为 "lora"
  • metadata 字典包含一个帮助信息,说明该字段表示使用的微调方法。

use_llama_pro 字段

python

复制

    use_llama_pro: bool = field(
        default=False,
        metadata={"help": "Whether or not to make only the parameters in the expanded blocks trainable."},
    )
  • 定义一个名为 use_llama_pro 的字段,类型为 bool
  • 默认值为 False
  • metadata 字典包含一个帮助信息,说明该字段表示是否仅使扩展块中的参数可训练。

freeze_vision_tower 字段

python

复制

    freeze_vision_tower: bool = field(
        default=True,
        metadata={"help": "Whether ot not to freeze vision tower in MLLM training."},
    )
  • 定义一个名为 freeze_vision_tower 的字段,类型为 bool
  • 默认值为 True
  • metadata 字典包含一个帮助信息,说明该字段表示在 MLLM 训练中是否冻结视觉塔(vision tower)。

train_mm_proj_only 字段

python

复制

    train_mm_proj_only: bool = field(
        default=False,
        metadata={"help": "Whether or not to train the multimodal projector for MLLM only."},
    )
  • 定义一个名为 train_mm_proj_only 的字段,类型为 bool
  • 默认值为 False
  • metadata 字典包含一个帮助信息,说明该字段表示是否仅训练用于 MLLM 的多模态投影器。

plot_loss 字段

python

复制

    plot_loss: bool = field(
        default=False,
        metadata={"help": "Whether or not to save the training loss curves."},
    )
  • 定义一个名为 plot_loss 的字段,类型为 bool
  • 默认值为 False
  • metadata 字典包含一个帮助信息,说明该字段表示是否保存训练损失曲线。

通过以上逐行解释,我们详细了解了 FinetuningArguments 数据类的定义和每个字段的具体含义。

Read more

深入理解 Proxy 和 Object.defineProperty

在JavaScript中,对象是一种核心的数据结构,而对对象的操作也是开发中经常遇到的任务。在这个过程中,我们经常会使用到两个重要的特性:Proxy和Object.defineProperty。这两者都允许我们在对象上进行拦截和自定义操作,但它们在实现方式、应用场景和灵活性等方面存在一些显著的区别。本文将深入比较Proxy和Object.defineProperty,包括它们的基本概念、使用示例以及适用场景,以帮助读者更好地理解和运用这两个特性。 1. Object.defineProperty 1.1 基本概念 Object.defineProperty 是 ECMAScript 5 引入的一个方法,用于直接在对象上定义新属性或修改已有属性。它的基本语法如下: javascript 代码解读复制代码Object.defineProperty(obj, prop, descriptor); 其中,obj是目标对象,prop是要定义或修改的属性名,descriptor是一个描述符对象,用于定义属性的特性。 1.2 使用示例 javascript 代码解读复制代码//

By Ne0inhk

Proxy 和 Object.defineProperty 的区别

Proxy 和 Object.defineProperty 是 JavaScript 中两个不同的特性,它们的作用也不完全相同。 Object.defineProperty 允许你在一个对象上定义一个新属性或者修改一个已有属性。通过这个方法你可以精确地定义属性的特征,比如它是否可写、可枚举、可配置等。该方法的使用场景通常是需要在一个对象上创建一个属性,然后控制这个属性的行为。 Proxy 也可以用来代理一个对象,但是相比于 Object.defineProperty,它提供了更加强大的功能。使用 Proxy 可以截获并重定义对象的基本操作,比如访问属性、赋值、函数调用等等。在这些操作被执行之前,可以通过拦截器函数对这些操作进行拦截和修改。因此,通过 Proxy,你可以完全重写一个对象的默认行为。该方法的使用场景通常是需要对一个对象的行为进行定制化,或者需要在对象上添加额外的功能。 对比 以下是 Proxy 和 Object.defineProperty 的一些区别对比: 方面ProxyObject.defineProperty语法使用 new Proxy(target,

By Ne0inhk