跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
PythonAI算法

清华大学开源 Kronos 模型:AI 解读 K 线规律与实战部署

综述由AI生成Kronos 是清华大学开源的 K 线分析模型,基于 120 亿条全球交易数据训练,支持沪深复权数据。文章介绍了 Kronos 的模型版本选择、Python 环境下的安装与加载流程、预测器初始化及数据准备方法。同时提供了基于 Qlib 工具的数据预处理、Tokenizer 与 Predictor 的微调步骤及回测评估命令,帮助开发者实现从预训练模型使用到自定义微调的技术落地。

编程诗人发布于 2026/4/5更新于 2026/5/2226 浏览
清华大学开源 Kronos 模型:AI 解读 K 线规律与实战部署

简介

Kronos 是清华大学信息科学研究院开源的 K 线分析模型,基于全球 45 个交易所的海量数据训练,支持沪深市场复权数据。该模型提供多个版本以适配不同的算力和应用需求。

模型名称Tokenizer上下文长度参数量开源情况
Kronos-miniTokenizer-2k20484.1MNeoQuasar/Kronos-mini
Kronos-smallTokenizer-base51224.7MNeoQuasar/Kronos-small
Kronos-baseTokenizer-base512102.3MNeoQuasar/Kronos-base
Kronos-largeTokenizer-base512499.2M暂未开放

安装与使用

1. 安装依赖

确保已安装 Python 3.10+,并运行:

pip install -r requirements.txt 

2. 加载模型与 Tokenizer

from model import Kronos, KronosTokenizer, KronosPredictor
tokenizer = KronosTokenizer.from_pretrained("NeoQuasar/Kronos-Tokenizer-base")
model = Kronos.from_pretrained("NeoQuasar/Kronos-small")

3. 初始化预测器

predictor = KronosPredictor(model, tokenizer, device="cuda:0", max_context=512)

4. 准备输入数据

输入需要包含历史的 K 线数据:

import pandas as pd
df = pd.read_csv("./data/XSHG_5min_600977.csv")
df['timestamps'] = pd.to_datetime(df['timestamps'])
lookback = 400
pred_len = 120
x_df = df.loc[:lookback-1, ['open', 'high', 'low', 'close', , ]]
x_timestamp = df.loc[:lookback-, ]
y_timestamp = df.loc[lookback:lookback+pred_len-, ]
'volume'
'amount'
1
'timestamps'
1
'timestamps'

5. 生成预测结果

pred_df = predictor.predict(df=x_df, x_timestamp=x_timestamp, y_timestamp=y_timestamp, pred_len=pred_len, T=1.0, top_p=0.9, sample_count=1)
print(pred_df.head())

输出将包含未来 open、high、low、close、volume 和 amount 的 DataFrame。

6. 可视化

运行官方示例脚本,即可得到预测效果图表。

微调指南

如需在自有数据上进行微调(Finetuning),可参考以下流程:

  1. 配置实验参数:设置数据路径、保存路径、训练超参数等。
  2. 准备数据:使用 Qlib 工具预处理,划分训练/验证/测试集。
  3. 模型微调:先微调 Tokenizer,再微调预测器。
  4. 回测评估:检验模型在历史数据上的表现。

核心命令示例

# 数据预处理
python finetune/qlib_data_preprocess.py

# 微调 Tokenizer
torchrun --standalone --nproc_per_node=2 finetune/train_tokenizer.py

# 微调 Predictor
torchrun --standalone --nproc_per_node=2 finetune/train_predictor.py

# 回测
python finetune/qlib_test.py --device cuda:0

运行后可获得回测曲线以评估模型表现。

目录

  1. 简介
  2. 安装与使用
  3. 1. 安装依赖
  4. 2. 加载模型与 Tokenizer
  5. 3. 初始化预测器
  6. 4. 准备输入数据
  7. 5. 生成预测结果
  8. 6. 可视化
  9. 微调指南
  10. 核心命令示例
  11. 数据预处理
  12. 微调 Tokenizer
  13. 微调 Predictor
  14. 回测
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • Clawdbot 部署 Qwen3:32B 避坑指南:解决 Token 过期及前端提示问题
  • Kotti Next 调试记录:后端连通与前端轻量级重构方案
  • 【前端发展】2026+ 年的前端行业发展:想吃蛋糕,别只会切页面/架子工
  • 蓝桥杯 C/C++ 组备考:C++ 基础知识(上)
  • Stable Diffusion 修复 Midjourney 生成图片的手部与面部瑕疵
  • Meta Quest VR 开机无法自动重连 WiFi 的解决方法
  • 前端加密 encrypt-labs 靶场:环境搭建与关卡解析
  • Python+AI 学习路线:从基础到实战
  • 基于C++的嵌入式AI模块化架构设计全流程
  • Python 打造 AI 三剑客:文档总结、代码生成与智能检索
  • 仓库管理系统前端开发:主区域查询与重置功能
  • CMake 构建 WebRTC 实战:从源码编译到性能优化
  • 算法实战:双指针解决三数之和与四数之和
  • C 语言指针与数组的核心关系及实战应用
  • OpenClaw 上下文记忆短问题:Token 限制分析与 6 种扩容方案
  • Python 爬虫从零入门:豆瓣电影数据抓取实战指南
  • AI 产品经理面试指南:核心能力、技术问答与项目实战
  • π0 开源项目源码深度剖析:从模型架构到 C/S 部署实战
  • 二叉树算法实战:美国血统与公共祖先求解
  • Seedance 2.0 实操教程:从入门到 AI 导演模式

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • curl 转代码

    解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online