冻结 Prompt 微调大语言模型：T5 与 PET 解析

冻结 Prompt 微调大语言模型：T5 与 PET 解析 | 极客日志

# T5 风格：文本转文本
def format_t5_prompt(task_type, input_text):
    prefixes = {
        "translation": "translate English to German",
        "summarization": "summarize",
        "qa": "question"
    }
    prefix = prefixes.get(task_type, "generate")
    return f"{prefix}: {input_text}"

# PET 风格：完形填空分类
def format_pet_prompt(input_text, mask_token="[MASK]"):
    # 假设标签为 'good' 或 'bad'
    template = f"This review is {mask_token}."
    return template.replace(mask_token, input_text)

冻结 Prompt 微调大语言模型：T5 与 PET 解析

冻结 Prompt 微调大语言模型：T5 与 PET 解析

引言

T5: 统一文本到文本框架

论文背景

实验对比维度

Text-to-Text 通用建模框架

任务构建示例

局限性与贡献

PET: 完形填空式 Prompt 微调

论文背景

核心机制

1. Prompt & Answer Engineer

2. 固定 Prompt 微调优势

3. 损失函数设计

4. 半监督 + 蒸馏

疑问与改进方向

代码实现示例

总结

参考资料

更多推荐文章

相关免费在线工具

冻结 Prompt 微调大语言模型：T5 与 PET 解析

冻结 Prompt 微调大语言模型：T5 与 PET 解析

引言

T5: 统一文本到文本框架

论文背景

实验对比维度

Text-to-Text 通用建模框架

任务构建示例

局限性与贡献

PET: 完形填空式 Prompt 微调

论文背景

核心机制

1. Prompt & Answer Engineer

2. 固定 Prompt 微调优势

3. 损失函数设计

4. 半监督 + 蒸馏

疑问与改进方向

代码实现示例

总结

参考资料

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具