Llama3 微调工具介绍及在 Ollama 中运行方法

Llama3 是 Meta 提供的一个开源大模型，包含 8B 和 70B 两种参数规模，涵盖预训练和指令调优的变体。这个开源模型推出已经有一段时间，并且在许多标准测试中展示了其卓越的性能。特别是 Llama3 8B，其具备小尺寸和高质量的输出使其成为边缘设备或者移动设备上实现 LLM 的完美选择。但是 Llama3 也还有许多缺陷，因此，在场景应用中，有时候还需要对其进行微调，以提升中文能力、场景应用的专业度等。

目前有许多团队在做微调工具，他们的贡献提高了我们的效率、减少失误。比较优秀的例如：

MLX-LM
PyReft
litgpt
LLaMA-Factory

本文主要介绍如何使用这几个工具进行微调，以及如何在 Ollama 中安装运行微调后的模型。

01 MLX-LM

MLX 团队一直在不懈地努力改进 MLX-LM 库在模型微调工具方面的能力。使用 MLX-LM 微调 llama3 十分简单。

可以参考相关例子： https://github.com/ml-explore/mlx-examples/tree/main/llms/llama

大致步骤如下：

（1）准备训练数据

glaiveai/glaive-function-calling-v2 是一个专门用于训练大语言模型处理函数调用方面的数据集。我们可以下载这个数据集，并将数据转换为适合 Llama3 对话的格式，并保存到"/data"目录下。

数据下载地址： https://huggingface.co/datasets/glaiveai/glaive-function-calling-v2

数据格式转换的脚本如下：

from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments, BitsAndBytesConfig
from datasets import load_dataset
import json

model_name = "meta-llama/Meta-Llama-3-8B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name)

dataset = load_dataset("glaiveai/glaive-function-calling-v2", split="train")

def cleanup(input_string):
    arguments_index = input_string.find('"arguments"')
    if arguments_index == -1:
        return input_string
    start_quote = input_string.find("'", arguments_index)
    if start_quote == -1:
        return input_string
    end_quote = input_string.rfind("'")
    if end_quote == -  end_quote <= start_quote:
         input_string
    arguments_value = input_string[start_quote+:end_quote]
    output_string = input_string[:start_quote] + arguments_value + input_string[end_quote+:]
     output_string

 ():
    output_texts = []
     i  ((example[])):
        messages = [
            {
                : ,
                : example[][i][():].strip(),
            },
        ]
        conversations = example[][i].split()
         message  conversations:
            continue_outer = 
            message = message.strip()
             message:
                   message:
                    user_content = message.split()[].strip()
                    messages.append({: , : user_content[:].strip()})
                       message:
                        assistant_content = message.split()[].strip()
                           assistant_content:
                            text = assistant_content.replace(,).strip()
                            json_str = cleanup(text)
                            :
                                data = json.loads(json_str)
                             json.JSONDecodeError  e:
                                ()
                                continue_outer = 
                                
                            new_func_text = + json_str
                            messages.append({: , : new_func_text})
                        :
                            messages.append({: , : assistant_content})
                 message.startswith():
                    function_response = message[:].strip()
                       function_response:
                        function_content, assistant_content = function_response.split()
                        :
                            data = json.loads(function_content.strip())
                         json.JSONDecodeError  e:
                            ()
                            continue_outer = 
                            
                        messages.append({: , : function_content.strip()})
                        messages.append({: , : assistant_content.strip()})
                    :
                        :
                            data = json.loads(function_response.strip())
                         json.JSONDecodeError  e:
                            ()
                            continue_outer = 
                            
                        messages.append({: , : function_response.strip()})
                 message.startswith():
                    assistant_content = message.split()[].strip()
                       assistant_content:
                        text = assistant_content.replace(,).strip()
                        json_str = cleanup(text)
                        :
                            data = json.loads(json_str)
                         json.JSONDecodeError  e:
                            ()
                            continue_outer = 
                            
                        new_func_text = + json_str
                        messages.append({: , : new_func_text})
         continue_outer:
            
        text = tokenizer.apply_chat_template(messages, tokenize=, add_generation_prompt=)
        output_texts.append(text)
     example[]
     example[]
     {: output_texts}

dataset = dataset.(formatting_prompts_func, batched=)

Llama3 微调工具介绍及在 Ollama 中运行方法

01 MLX-LM

（1）准备训练数据

更多推荐文章

相关免费在线工具

（2）安装 mlx-lm 包

（3）创建 LoRA 配置

（4）执行微调

（5）模型融合发布

02 PyReft

（1）安装依赖库

（2）安装或导入 pyreft

（3）加载模型

（4）准备数据集

（5）执行训练

（6）发布与推理

03 LitGPT

（1）安装

（2）评估测试

（3）微调模型

（4）部署

04 LLaMA-Factory

（1）数据准备

（2）下载安装依赖包

（3）执行微调

（4）基准测试

如何在 Ollama 中安装微调后的 Llama3 模型？

（1）运行 Ollama

（2）GGML 格式转换

（3）在 Ollama 中创建自定义 Llama3 模型

使用 ollama 的 modelfile 来创建自定义 llama3 模型。需要创建一个 modefile 文件。

我们创建一个 llama3.modelfile，其内容如下：

更多推荐文章

相关免费在线工具

Llama3 微调工具介绍及在 Ollama 中运行方法

01 MLX-LM

（1）准备训练数据

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

（2）安装 mlx-lm 包

（3）创建 LoRA 配置

（4）执行微调

（5）模型融合发布

02 PyReft

（1）安装依赖库

（2）安装或导入 pyreft

（3）加载模型

（4）准备数据集

（5）执行训练

（6）发布与推理

03 LitGPT

（1）安装

（2）评估测试

（3）微调模型

（4）部署

04 LLaMA-Factory

（1）数据准备

（2）下载安装依赖包

（3）执行微调

（4）基准测试

如何在 Ollama 中安装微调后的 Llama3 模型？

（1）运行 Ollama

（2）GGML 格式转换

（3）在 Ollama 中创建自定义 Llama3 模型

使用 ollama 的 modelfile 来创建自定义 llama3 模型。需要创建一个 modefile 文件。

我们创建一个 llama3.modelfile，其内容如下：

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具