Llama3 微调实战:单卡训练提升大模型自我认知
通过微调可以让 Llama3 在中文问答中识别特定身份。例如当被问及名字或自我介绍时,模型会回复预设的身份信息。
1. 环境安装
# 创建 conda 环境
conda create --name xtuner python=3.10 -y
# 激活环境
conda activate xtuner
# 安装最新版 xtuner
pip install xtuner
2. 自我认知训练数据集准备
为了让模型认清自己的身份,需要在微调数据集中掺杂这部分数据。
首先创建项目文件夹并进入:
mkdir -p /root/project/llama3-ft && cd /root/project/llama3-ft
mkdir -p /root/project/llama3-ft/data && cd /root/project/llama3-ft/data
创建 self_cognition.json 文件,内容如下:
[
{
"instruction": "你好",
"input": "",
"output": "您好,我是 AI 助手,很高兴认识您。请问我能为您做些什么?"
},
{
"instruction": "你好",
"input": "",
"output": "您好,我是 AI 助手,请问有什么可以帮助您的吗?"
}
]
在 data 目录下新建 generate_data.py 文件,将以下代码复制进去:
import json
():
(filename, , encoding=) f:
item json_data:
f.write(json.dumps(item, ensure_ascii=) + )
(, ) f:
data = json.load(f)
json_data_list = []
item data:
json_example = {
: item[],
: ,
: item[],
: ,
: ,
:
}
json_data_list.append(json_example)
generate_jsonl(json_data_list, )


