DataX-web安装使用教程

DataX-web安装使用教程

1. 环境准备

  • MySQL (5.5+)  必选,对应客户端可以选装, Linux服务上若安装mysql的客户端可以通过部署脚本快速初始化数据库
  • JDK (1.8.0_xxx)  必选
  • Python (2.x) 必选 (支持Python3需要修改替换datax/bin下面的三个python文件,替换文件在doc/datax-web/datax-python3下) ,主要用于调度执行底层DataX的启动脚本,默认的方式是以Java子进程方式执行DataX,用户可以选择以Python方式来做自定义的改造

2.DataX安装

2.1 下载DataX安装包

DataX详情介绍:https://github.com/alibaba/DataX/blob/master/introduction.md

DataX官网下载地址:https://github.com/alibaba/DataX

网盘地址链接:https://pan.baidu.com/s/1qxCi1k36mbHWfuxfMpTfxg 提取码: 1234

2.2 安装DataX

上传后进行解压并检测安装是否成功

# 下载上传后进行解压 tar -zxvf /opt/software/datax.tar.gz -C /opt/modules/ # 运行自检脚本 python /opt/modules/datax/bin/datax.py /opt/modules/datax/job/job.json

当输出下图结果代表安装成功

3.DataX-web安装

3.1 下载DataX-web安装包

DataX-web官网下载地址:https://github.com/WeiYe-Jing/datax-web

网盘地址链接: https://pan.baidu.com/s/1UmFMHdVamfOOo4KEezBkeQ  提取码: 1234

3.2 安装DataX-web

3.2.1 上传后进行解压

# 下载上传后进行解压 tar -zxvf /opt/software/datax-web-2.1.2.tar.gz -C /opt/modules/

3.2.2 在Mysql中创建存放datax-web任务信息的库表

创建数据库dataxweb

# 创建 dataxweb 数据库 create database dataxweb;

在dataxweb中执行datax_web.sql脚本 

脚本位置为:/opt/modules/datax-web-2.1.2/bin/db/datax_web.sql

3.2.3 执行安装datax-web命令

# 执行安装命令 sh /opt/modules/datax-web-2.1.2/bin/install.sh

安装过程中需要下载一些插件,输入“Y”下载即可

安装过程中需要输入数据库配置,输入提前准备好的Mysql相关信息:ip port username password databaseName

3.2.4 DataX-web中配置datax路径

/opt/modules/datax-web-2.1.2/modules/datax-executor/conf/application.yml

# vi 编辑文本 application.yml vi /opt/modules/datax-web-2.1.2/modules/datax-executor/conf/application.yml # 最后一行添加DataX执行命令 pypath: /opt/modules/datax/bin/datax.py

3.2.5 启动 DataX-web

# 启动datax-web sh /opt/modules/datax-web-2.1.2/bin/start-all.sh

4.DataX-web登录使用

4.1 登录DataX-web

登录地址:http://{你的ip}:9527/index.html用户名:admin密码:123456

登录后报如下错误:Unknown column 't.user_id' in 'field list'。

这个错误表示DataX Web的数据库表结构不完整。具体问题是:job_info表中缺少 user_id字段。

我们可以手动添加缺失字段

-- 检查表结构 DESC job_info; -- 添加缺失的user_id字段 ALTER TABLE job_info ADD COLUMN user_id VARCHAR(50) DEFAULT NULL COMMENT '用户ID' AFTER update_time; -- 验证字段是否添加成功 DESC job_info;

4.2 使用DataX-web

新建项目

创建DataX任务模板,以后创建的任务使用相关的模板。

创建数据库链接

下面开始配置数据同步任务,可以批量配置,也可单独配置,本次以单独配置为例

点击 “构建” 生成任务json,选择 “选择模版” 选择对应的调度模板绑定任务。

查看并执行任务

点击执行一次后便可手动执行,如需定时执行可将状态部分改成启动。

查看任务执行状况

查看任务报错信息

报错原因:

        DataX配置了总bps限速(1048576字节/秒 = 1MB/秒),同时配置了3个channel,但没有配置单个channel的bps值

修复:增大 byte ,修改核心配置文件:/opt/modules/datax/conf/core.json

将byte值从默认的1048576调整为更高的正整数5m(如5242880),并确保record不为负数(如设为1000或删除record字段)。

# 修改 byte record 参数 "transport": { "channel": { "class": "com.alibaba.datax.core.transport.channel.memory.MemoryChannel", "speed": { "byte": 5242880,// 修改为正整数(如5MB)JSON不支持注释 "record": 1000 // 确保record值不为负数(可选)JSON不支持注释 }, "flowControlInterval": 20, "capacity": 512, "byteCapacity": 67108864 }, "exchanger": { "class": "com.alibaba.datax.core.plugin.BufferedRecordExchanger", "bufferSize": 32 } },

修改完配置再次执行

Read more

Flutter 三方库 wallet_connect 的鸿蒙化适配指南 - 实现 Web3 钱包协议连接、支持 DApp 授权登录与跨链交易签名实战

Flutter 三方库 wallet_connect 的鸿蒙化适配指南 - 实现 Web3 钱包协议连接、支持 DApp 授权登录与跨链交易签名实战

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 wallet_connect 的鸿蒙化适配指南 - 实现 Web3 钱包协议连接、支持 DApp 授权登录与跨链交易签名实战 前言 在进行 Flutter for OpenHarmony 的去中心化应用(DApp)或加密货币钱包开发时,支持标准的 WalletConnect 协议是链接用户钱包的关键。wallet_connect 是该协议的 Dart 实现,它能让你的鸿蒙 App 安全地与 MetaMask、Trust Wallet 等钱包建立双向加密连接。本文将探讨如何在鸿蒙系统下构建安全、稳定的 Web3 授权流程。 一、原理解析 / 概念介绍 1.1 基础原理

如何利用简单的浏览器插件Web Scraper爬取知乎评论数据

如何利用简单的浏览器插件Web Scraper爬取知乎评论数据

一、简单介绍: Web Scraper 的优点就是对新手友好,在最初抓取数据时,把底层的编程知识和网页知识都屏蔽了,可以非常快的入门,只需要鼠标点选几下,几分钟就可以搭建一个自定义的爬虫。 我在过去的半年里,写了很多篇关于 Web Scraper 的教程,本文类似于一篇导航文章,把爬虫的注意要点和我的教程连接起来。最快一个小时,最多一个下午,就可以掌握 Web Scraper 的使用,轻松应对日常生活中的数据爬取需求。 像这样的网页数据,想要通过网页爬虫的方式获取数据,可以下载web scraper进行爬虫 这是常见的网页类型: 1.单页 单页是最常见的网页类型。 我们日常阅读的文章,推文的详情页都可以归于这种类型。作为网页里最简单最常见的类型,Web Scraper 教程里就拿豆瓣电影作为案例,入门 Web Scraper 的基础使用。 2.分页列表 分页列表也是非常常见的网页类型。 互联网的资源可以说是无限的,当我们访问一个网站时,不可能一次性把所有的资源都加载到浏览器里。现在的主流做法是先加载一部分数据,随着用户的交互操作(

Xinference-v1.17.1快速部署:GitHub Codespaces云端环境3分钟启动WebUI

Xinference-v1.17.1快速部署:GitHub Codespaces云端环境3分钟启动WebUI 1. 为什么这次更新值得你立刻试试? Xinference-v1.17.1不是一次普通的小版本迭代。它把“开箱即用”这件事做到了新高度——你不需要本地装Python、不用配CUDA、甚至不用下载模型文件,只要一个浏览器,三分钟内就能看到完整的WebUI界面跑起来,还能直接和Qwen2、Phi-3、Gemma2这些热门模型对话。 更关键的是,它彻底打破了“换模型=重装环境”的老套路。以前想试试Llama3还是DeepSeek-V2,得反复改配置、删缓存、调参数;现在只需要改一行代码,GPT的调用逻辑就自动切换成任意开源LLM。这不是概念演示,是实打实能在云上跑、在笔记本跑、在边缘设备跑的生产级推理平台。 如果你试过用Ollama拉模型卡在99%、被vLLM的编译折磨到放弃、或者被FastChat的端口冲突搞崩溃……那这次,真的可以松一口气了。 2. 什么是Xinference?一句话说清它能帮你省多少事 Xinference(全称Xorbits Inference

中兴B863AV3.1-M2卡刷固件实战:从萌虎动画到无线网卡全解析

1. 中兴B863AV3.1-M2卡刷固件入门指南 第一次接触中兴B863AV3.1-M2刷机的朋友可能会觉得有些复杂,但其实只要跟着步骤来,整个过程并不难。这个固件最大的亮点就是加入了萌虎动画和无线网卡支持,让原本功能受限的机顶盒焕发新生。 我去年第一次刷这个固件时也踩过不少坑,比如U盘格式不对、刷机按键时机没掌握好等等。后来反复尝试了几次,终于摸清了门道。现在我的盒子开机就能看到可爱的萌虎动画,还能用USB无线网卡连接WiFi,彻底摆脱了网线的束缚。 这个固件适合哪些人呢?首先你得有个中兴B863AV3.1-M2的盒子,或者兼容的魔百盒E900V22C/D系列。其次最好有些基础的刷机经验,至少知道怎么进Recovery模式。如果你是纯小白,建议先看看其他基础教程练练手。 2. 萌虎动画的实现原理与定制 2.1 萌虎动画的技术解析 这个固件最吸引人的就是那个虎年主题的开机动画了。我拆解过这个动画包,发现它其实是由一系列PNG图片组成的bootanimation.zip。这个压缩包放在/system/media/目录下,包含三个关键部分: * desc.txt:定义动