从 Alpaca 到 ShareGPT:Llama Factory 数据格式全解析
作为一名数据工程师,在准备大模型微调数据时,你是否经常纠结于选择哪种数据格式?Alpaca、ShareGPT、Vicuna...各种格式的文档分散在不同地方,手动转换又容易出错。本文将带你全面解析 Llama Factory 支持的数据格式,帮助你快速测试不同格式的效果。
Llama Factory 数据格式概述
Llama Factory 作为大模型微调的热门框架,支持多种主流数据格式,主要分为两大类:
- :以 Alpaca 为代表,适合单轮问答任务

