666 条数据训练 AI 写万字长文，模型数据集开源

666 条数据训练 AI 写万字长文，模型数据集开源 | 极客日志

{"messages": [

{"messages": [{"role": "user", "content": "你是一位优秀的辩手，请针对以下辩题，给出观点立论：\n辩题：当代大学生是否应该住校\n立论角度：阐述不住校的好处\n立论要点：运用数据、事例等论证住校的必要性；从锻炼独立能力、培养社交技巧等方面论证观点\n内容要求：表达清晰，论点突出，精辟见解，让人信服 20000 字"}, {"role": "assistant", "content": "### 引言：住校与否的辩论\n\n大学生活是每个青少年成长过程中的关键阶段，而当代大学生是否应该住校则成为一个备受争议的话题, ..."}], "length": 20000, "response_length": 7739}

swift sft \

# pip install evalscope[framework]

CUDA_VISIBLE_DEVICES=0,1,2,3 nohup swift sft \

CUDA_VISIBLE_DEVCIES=0 swift eval --model_type qwen2-7b-instruct --eval_dataset mmlu ceval ARC_c gsm8k

666 条数据训练 AI 写万字长文，模型数据集开源

666 条数据训练 AI 写万字长文，模型数据集开源

LongWriter 数据生成与模型训练

LongWriter-6K 数据

LongWriter 模型训练与评估

评价指标

实验结果

从 LongWriter-6k 到 LongWriter-6k-filtered：数据质量提升

基于不同数据集和模型的 LongWriter 微调

训练配置

模型效果评估

基于 Qwen2-7b-instruct

基于 GLM4-9b-Chat

基于 Qwen2.5-7b-instruct

微调对于基础能力的影响

结论

更多推荐文章

相关免费在线工具

666 条数据训练 AI 写万字长文，模型数据集开源

666 条数据训练 AI 写万字长文，模型数据集开源

LongWriter 数据生成与模型训练

LongWriter-6K 数据

LongWriter 模型训练与评估

评价指标

实验结果

从 LongWriter-6k 到 LongWriter-6k-filtered：数据质量提升

基于不同数据集和模型的 LongWriter 微调

训练配置

模型效果评估

基于 Qwen2-7b-instruct

基于 GLM4-9b-Chat

基于 Qwen2.5-7b-instruct

微调对于基础能力的影响

结论

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具