DataX-web安装使用教程

DataX-web安装使用教程

1. 环境准备

  • MySQL (5.5+)  必选,对应客户端可以选装, Linux服务上若安装mysql的客户端可以通过部署脚本快速初始化数据库
  • JDK (1.8.0_xxx)  必选
  • Python (2.x) 必选 (支持Python3需要修改替换datax/bin下面的三个python文件,替换文件在doc/datax-web/datax-python3下) ,主要用于调度执行底层DataX的启动脚本,默认的方式是以Java子进程方式执行DataX,用户可以选择以Python方式来做自定义的改造

2.DataX安装

2.1 下载DataX安装包

DataX详情介绍:https://github.com/alibaba/DataX/blob/master/introduction.md

DataX官网下载地址:https://github.com/alibaba/DataX

网盘地址链接:https://pan.baidu.com/s/1qxCi1k36mbHWfuxfMpTfxg 提取码: 1234

2.2 安装DataX

上传后进行解压并检测安装是否成功

# 下载上传后进行解压 tar -zxvf /opt/software/datax.tar.gz -C /opt/modules/ # 运行自检脚本 python /opt/modules/datax/bin/datax.py /opt/modules/datax/job/job.json

当输出下图结果代表安装成功

3.DataX-web安装

3.1 下载DataX-web安装包

DataX-web官网下载地址:https://github.com/WeiYe-Jing/datax-web

网盘地址链接: https://pan.baidu.com/s/1UmFMHdVamfOOo4KEezBkeQ  提取码: 1234

3.2 安装DataX-web

3.2.1 上传后进行解压

# 下载上传后进行解压 tar -zxvf /opt/software/datax-web-2.1.2.tar.gz -C /opt/modules/

3.2.2 在Mysql中创建存放datax-web任务信息的库表

创建数据库dataxweb

# 创建 dataxweb 数据库 create database dataxweb;

在dataxweb中执行datax_web.sql脚本 

脚本位置为:/opt/modules/datax-web-2.1.2/bin/db/datax_web.sql

3.2.3 执行安装datax-web命令

# 执行安装命令 sh /opt/modules/datax-web-2.1.2/bin/install.sh

安装过程中需要下载一些插件,输入“Y”下载即可

安装过程中需要输入数据库配置,输入提前准备好的Mysql相关信息:ip port username password databaseName

3.2.4 DataX-web中配置datax路径

/opt/modules/datax-web-2.1.2/modules/datax-executor/conf/application.yml

# vi 编辑文本 application.yml vi /opt/modules/datax-web-2.1.2/modules/datax-executor/conf/application.yml # 最后一行添加DataX执行命令 pypath: /opt/modules/datax/bin/datax.py

3.2.5 启动 DataX-web

# 启动datax-web sh /opt/modules/datax-web-2.1.2/bin/start-all.sh

4.DataX-web登录使用

4.1 登录DataX-web

登录地址:http://{你的ip}:9527/index.html用户名:admin密码:123456

登录后报如下错误:Unknown column 't.user_id' in 'field list'。

这个错误表示DataX Web的数据库表结构不完整。具体问题是:job_info表中缺少 user_id字段。

我们可以手动添加缺失字段

-- 检查表结构 DESC job_info; -- 添加缺失的user_id字段 ALTER TABLE job_info ADD COLUMN user_id VARCHAR(50) DEFAULT NULL COMMENT '用户ID' AFTER update_time; -- 验证字段是否添加成功 DESC job_info;

4.2 使用DataX-web

新建项目

创建DataX任务模板,以后创建的任务使用相关的模板。

创建数据库链接

下面开始配置数据同步任务,可以批量配置,也可单独配置,本次以单独配置为例

点击 “构建” 生成任务json,选择 “选择模版” 选择对应的调度模板绑定任务。

查看并执行任务

点击执行一次后便可手动执行,如需定时执行可将状态部分改成启动。

查看任务执行状况

查看任务报错信息

报错原因:

        DataX配置了总bps限速(1048576字节/秒 = 1MB/秒),同时配置了3个channel,但没有配置单个channel的bps值

修复:增大 byte ,修改核心配置文件:/opt/modules/datax/conf/core.json

将byte值从默认的1048576调整为更高的正整数5m(如5242880),并确保record不为负数(如设为1000或删除record字段)。

# 修改 byte record 参数 "transport": { "channel": { "class": "com.alibaba.datax.core.transport.channel.memory.MemoryChannel", "speed": { "byte": 5242880,// 修改为正整数(如5MB)JSON不支持注释 "record": 1000 // 确保record值不为负数(可选)JSON不支持注释 }, "flowControlInterval": 20, "capacity": 512, "byteCapacity": 67108864 }, "exchanger": { "class": "com.alibaba.datax.core.plugin.BufferedRecordExchanger", "bufferSize": 32 } },

修改完配置再次执行

Read more

飞书 × OpenClaw 接入指南:不用服务器,用长连接把机器人跑起来

你想在飞书里用上一个能稳定对话、能发图/收文件、还能按规则在群里工作的 AI 机器人,最怕两件事:步骤多、出错后不知道查哪里。这个项目存在的意义,就是把“飞书接 OpenClaw”这件事,整理成一套对非技术也友好的配置入口,并把官方文档没覆盖到的坑集中写成排查清单。 先说清楚它的角色:OpenClaw 现在已经内置官方飞书插件 @openclaw/feishu,功能更完整、维护也更及时。这是好事,说明飞书 + AI 的接入已经走通。这个仓库并不是要替代官方插件,而是继续为大家提供: * 新用户:从零开始的新手教程(15–20 分钟) * 老用户:从旧版(独立桥接或旧 npm 插件)迁移到官方插件的保姆级路线 * 常见问题答疑 & 排查清单(最常见的坑优先) * 进阶场景:独立桥接模式依然可用(需要隔离/定制时再用) 另外,仓库也推荐了一个新项目

Spatial Joy 2025 全球 AR&AI 赛事:开发者要的资源、玩法、避坑攻略都在这

Spatial Joy 2025 全球 AR&AI 赛事:开发者要的资源、玩法、避坑攻略都在这

《Spatial Joy 2025 全球 AR&AI 赛事:开发者要的资源、玩法、避坑攻略都在这》 Spatial Joy 2025 Rokid乐奇 全球 AR&AI 开发大赛 值不值得参加?不少参加过连续两届 Rokid乐奇 赛事的老兵,纷纷表示非常值得参加。 先说最实在的——奖金。 AR赛道分为应用和游戏两个赛道,金奖各20万人民币,而且是现金!交完税全是你自己的!这还不够,AR赛道总共设了27个奖项,据我打听到的往年数据,能正常跑进初赛的作品大概就60-70个,这意味着获奖比例相当高。 20万就封顶了吗?远远没有!亚马孙科技给使用Kiro并获奖的开发者,在原奖金基础上再加20%现金奖励! AI赛道同样设置了27个奖项,奖金从1万到5万不等,主要以智能体开发为主,支持市面上所有智能体平台的适配。也就是说,你之前做的智能体微调一下就能参赛! 更重要的是,现在正是智能眼镜行业爆发前夜。据我观察,

OFD 在线阅读器(WEB 版)技术难点总结(Java 栈)

OFD 在线阅读器(WEB 版)技术难点总结(Java 栈)

基于 Java 栈开发的 OFD 在线阅读器(如浙舟 OFD 在线阅读器:https://ofd.zhezhou.cn),核心挑战集中在 OFD 格式解析兼容性、前端渲染性能、跨场景适配及安全验签等维度。以下结合实际开发实践,梳理关键技术难点及针对性解决方案,为同类项目提供参考。 一、OFD 格式解析与兼容性难点 1. 多版本 / 多厂商 OFD 文件格式差异 难点描述 OFD 作为我国自主研发的电子文件格式标准,存在 1.0/2.0 等多个版本,且不同厂商(如福昕、方正、政府电子签章系统)生成的 OFD 文件在结构细节上存在差异: * 签名信息存储路径不一致(部分文件将签名嵌入页面资源,部分独立存储在根目录); * 资源引用方式不同(绝对路径 / 相对路径