Flume 架构深度解析：构建高可用大数据采集系统

Flume 架构深度解析：构建高可用大数据采集系统 | 极客日志

public class FlumeAgent {
    public void start() {
        try {
            // 1. 加载配置文件
            Configuration configuration = configurationProvider.getConfiguration();
            // 2. 按依赖顺序启动组件
            for (EventDrivenSourceAndSinkConfiguration sourceConfig : config.getSourceConfigurations()) {
                Source source = sourceConfig.getSource();
                source.start();
                // 启动关联的 Channel 和 Sink
                for (String channelName : sourceConfig.getChannelNames()) {
                    Channel channel = config.getChannel(channelName);
                    channel.start();
                }
            }
            // 3. 启动生命周期监督
            supervisor.start();
        } catch (Exception e) {
            LOGGER.error("Agent 启动失败", e);
            stop();
        }
    }
}

public class ExecSource extends AbstractSource implements Configurable, EventDrivenSource {
    private String command;
    private long batchSize;
    private long batchTimeout;

    @Override
    public void configure(Context context) {
        command = context.getString("command");
        batchSize = context.getLong("batchSize", 100);
        batchTimeout = context.getLong("timeout", 3000);
        Preconditions.checkState(command != null && !command.isEmpty(), "command 不能为空");
    }

    private void processCommand() {
        try {
            Process process = Runtime.getRuntime().exec(command);
            BufferedReader reader = new BufferedReader(new InputStreamReader(process.getInputStream()));
            String line;
            List<Event> events = new ArrayList<>();
            while ((line = reader.readLine()) != null) {
                Event event = EventBuilder.withBody(line, Charset.defaultCharset().toByteBuffers());
                events.add(event);
                // 批处理逻辑：达到批大小或超时时间时发送事件
                if (events.size() >= batchSize || (events.size() > 0 && System.currentTimeMillis() - lastSendTime > batchTimeout)) {
                    sendBatch(events);
                    events.clear();
                    lastSendTime = System.currentTimeMillis();
                }
            }
        } catch (Exception e) {
            LOGGER.error("执行命令异常", e);
        }
    }
}

public class AvroSource extends AbstractSource implements Configurable, EventDrivenSource {
    private int port;
    private int threads;

    @Override
    public void configure(Context context) {
        port = context.getInteger("port", 41414);
        threads = context.getInteger("threads", 64);
    }

    private class AvroSourceHandler implements AvroSourceProtocol {
        @Override
        public List<Status> appendBatch(List<Event> events) {
            List<Status> statuses = new ArrayList<>();
            Transaction transaction = getChannel().getTransaction();
            try {
                transaction.begin();
                for (Event event : events) {
                    try {
                        getChannel().put(event);
                        statuses.add(Status.OK);
                    } catch (Exception e) {
                        statuses.add(Status.FAIL);
                    }
                }
                transaction.commit();
            } catch (Exception e) {
                transaction.rollback();
                for (int i = 0; i < events.size(); i++) {
                    statuses.add(Status.FAIL);
                }
            }
            return statuses;
        }
    }
}

public class MemoryChannel extends AbstractChannel implements Configurable {
    private int capacity = 100;
    private long transactionCapacity = 100;
    private long byteCapacity = 0;
    private BlockingQueue<Event> queue;

    @Override
    public void put(Event event) throws ChannelException {
        // 字节容量检查
        if (byteCapacity > 0) {
            int eventSize = estimateEventSize(event);
            long currentUsage = byteCapacityUsed.get();
            long newUsage = currentUsage + eventSize;
            if (newUsage > byteCapacity * 80 / 100) {
                throw new ChannelException("超出字节容量限制");
            }
            byteCapacityUsed.addAndGet(eventSize);
        }
        boolean success = queue.offer(event);
        if (!success) {
            throw new ChannelException("队列已满");
        }
        queueSize++;
        counterGroup.incrementAndGet("events.put");
    }

    @Override
    public Event take() throws ChannelException {
        Event event = queue.poll();
        if (event != null) {
            queueSize--;
            if (byteCapacity > 0) {
                int eventSize = estimateEventSize(event);
                byteCapacityUsed.addAndGet(-eventSize);
            }
            counterGroup.incrementAndGet("events.take");
        }
        return event;
    }
}

public class FileChannel extends AbstractChannel implements Configurable {
    private String dataDir;
    private FileQueue queue;

    @Override
    public void put(Event event) throws ChannelException {
        checkNotNull(event, "Event 不能为空");
        long transactionID = System.nanoTime();
        try {
            queue.beginTransaction();
            queue.put(event, transactionID);
        } catch (Exception e) {
            try {
                queue.rollback();
            } catch (Exception re) {
                LOGGER.error("回滚失败", re);
            }
            throw new ChannelException("写入失败", e);
        }
    }

    @Override
    public void commit() {
        try {
            queue.commit();
            counterGroup.incrementAndGet("events.commit");
        } catch (Exception e) {
            counterGroup.incrementAndGet("events.rollback");
            throw new ChannelException("提交失败", e);
        }
    }
}

public class HDFSEventSink extends AbstractSink implements Configurable {
    private String hdfsPath;
    private int hdfsRollSize = 1024;
    private int hdfsBatchSize = 100;
    private FSDataOutputStream outputStream;
    private long bytesProcessed = 0;

    @Override
    public void configure(Context context) {
        hdfsPath = context.getString("hdfs.path");
        hdfsRollSize = context.getInteger("hdfs.rollSize", 1024);
        hdfsBatchSize = context.getInteger("hdfs.batchSize", 100);
        Preconditions.checkNotNull(hdfsPath, "hdfs.path 不能为空");
    }

    @Override
    public Status process() throws EventDeliveryException {
        Channel channel = getChannel();
        Transaction transaction = channel.getTransaction();
        try {
            transaction.begin();
            List<Event> events = new ArrayList<>();
            for (int i = 0; i < hdfsBatchSize; i++) {
                Event event = channel.take();
                if (event == null) break;
                events.add(event);
            }
            if (events.isEmpty()) {
                transaction.commit();
                return Status.BACKOFF;
            }
            // 批量写入 HDFS
            writeEvents(events);
            // 检查文件滚动条件
            if (shouldRollFile()) {
                rollFile();
            }
            transaction.commit();
            return Status.READY;
        } catch (Exception e) {
            LOGGER.error("处理事件失败", e);
            transaction.rollback();
            return Status.BACKOFF;
        }
    }

    private void writeEvents(List<Event> events) throws IOException {
        for (Event event : events) {
            String line = new String(event.getBody(), "UTF-8");
            outputStream.write((line + "\n").getBytes("UTF-8"));
            outputStream.flush();
            bytesProcessed += event.getBody().length;
            counterGroup.incrementAndGet("events.successful");
        }
    }
}

# 负载均衡 Sink 配置
agent1.sinks = avroSink1 avroSink2
agent1.sinkgroups = sinkgroup1
agent1.sinkgroups.sinkgroup1.sinks = avroSink1 avroSink2
agent1.sinkgroups.sinkgroup1.processor.type = load_balance
agent1.sinkgroups.sinkgroup1.processor.selector = round_robin

# 备份 Agent 配置
agent2.sources.avroSource.type = avro
agent2.sources.avroSource.bind = 0.0.0.0
agent2.sources.avroSource.port = 41415

# File Channel 确保数据持久化
agent2.channels.fileChannel.type = file
agent2.channels.fileChannel.capacity = 1000000
agent2.channels.fileChannel.transactionCapacity = 10000

# JVM 参数优化
FLUME_JAVA_OPTS="-Xms2g -Xmx4g -XX:+UseG1GC"

# 批处理优化
agent1.channels.memoryChannel.capacity = 2000000
agent1.channels.memoryChannel.transactionCapacity = 10000

# 网络优化
agent1.sinks.avroSink1.batch-size = 1000
agent1.sinks.avroSink1.compression-type = deflate

public class FlumeMonitor {
    private CounterGroup counterGroup;

    public void collectMetrics() {
        Map<String, Number> metrics = new HashMap<>();
        // 收集核心指标
        metrics.put("events.successful", counterGroup.get("events.successful"));
        metrics.put("events.failed", counterGroup.get("events.failed"));
        
        // 计算吞吐量
        long currentTime = System.currentTimeMillis();
        long processedEvents = counterGroup.get("events.successful");
        if (lastCollectTime != null) {
            double throughput = (double) (processedEvents - lastProcessedEvents) / (currentTime - lastCollectTime) * 1000;
            metrics.put("throughput.events_per_second", throughput);
        }
        // 推送到监控系统
        pushToMonitoringSystem(metrics);
    }
}

# 多源日志采集
ecommerce_agent.sources = app_log_source access_log_source
ecommerce_agent.channels = rt_channel batch_channel
ecommerce_agent.sinks = kafka_sink hdfs_sink

# 应用日志监控
ecommerce_agent.sources.app_log_source.type = exec
ecommerce_agent.sources.app_log_source.command = tail -F /var/log/ecommerce/app.log
ecommerce_agent.sources.app_log_source.batchSize = 1000

# 实时处理 Channel
ecommerce_agent.channels.rt_channel.type = memory
ecommerce_agent.channels.rt_channel.capacity = 100000
ecommerce_agent.channels.rt_channel.transactionCapacity = 5000

# 批处理 Channel
ecommerce_agent.channels.batch_channel.type = file
ecommerce_agent.channels.batch_channel.capacity = 1000000

# Kafka 实时 Sink
ecommerce_agent.sinks.kafka_sink.type = org.apache.flume.sink.kafka.KafkaSink
ecommerce_agent.sinks.kafka_sink.batchSize = 100
ecommerce_agent.sinks.kafka_sink.brokerList = kafka1:9092,kafka2:9092,kafka3:9092
ecommerce_agent.sinks.kafka_sink.topic = ecommerce-realtime

# HDFS 批处理 Sink
ecommerce_agent.sinks.hdfs_sink.type = hdfs
ecommerce_agent.sinks.hdfs_sink.hdfs.path = hdfs://namenode:9000/ecommerce/logs/%Y-%m-%d/%H%M
ecommerce_agent.sinks.hdfs_sink.hdfs.rollInterval = 3600
ecommerce_agent.sinks.hdfs_sink.hdfs.rollSize = 134217728

# 检查 Channel 状态
curl http://flume-agent:port/metrics
# 检查内存使用
jstat -gc <pid>|grep -E "(S0|S1|E|O|YG|FGC)"

public class NetworkDiagnostics {
    public void diagnoseConnection(String hostname, int port) {
        try (Socket socket = new Socket()) {
            socket.connect(new InetSocketAddress(hostname, port), 5000);
            System.out.println("连接成功");
        } catch (IOException e) {
            // 连接诊断逻辑
            testDNSResolution(hostname);
            testNetworkConnectivity(hostname);
        }
    }
}

public class BatchOptimizer {
    public void calibrateBatchParameters(Channel channel, Sink sink) {
        int channelCapacity = getChannelCapacity(channel);
        double sinkThroughput = measureSinkThroughput(sink);
        
        // 计算最优批处理大小
        int optimalBatchSize = Math.min(
            channelCapacity * 10 / 100,      // Channel 容量的 10%
            (int) (sinkThroughput * 5 / 100) // 处理能力的 5%
        );
        System.out.printf("建议批处理大小：%d%n", optimalBatchSize);
    }
}

#!/bin/bash
# 获取系统内存信息
TOTAL_MEM=$(free -m |awk'NR==2{printf "%.0f", $2}')
AVAILABLE_MEM=$(free -m |awk'NR==2{printf "%.0f", $7}')
# 生成优化的 JVM 参数
HEAP_SIZE=$(($AVAILABLE_MEM *60/100))
HEAP_MAX=$(($TOTAL_MEM *70/100))
JAVA_OPTS="-Xms${HEAP_SIZE}m -Xmx${HEAP_MAX}m"
JAVA_OPTS="$JAVA_OPTS -XX:+UseG1GC -XX:MaxGCPauseMillis=200"
export FLUME_JAVA_OPTS="$JAVA_OPTS"

配置方案	Channel 类型	批处理大小	适用场景	性能表现	可靠性
高性能实时	Memory	10000	实时流处理	100%	中等
平衡型配置	Memory	5000	常规日志收集	85%	中等
高可靠性	File	2000	关键数据采集	60%	高
批处理优化	File	20000	大批量数据迁移	45%	高

Flume 架构深度解析：构建高可用大数据采集系统

Flume 架构深度解析：构建高可用大数据采集系统

概述

1. Flume 架构概览

1.1 整体架构设计理念

1.2 Agent 生命周期管理

更多推荐文章

相关免费在线工具

2. 核心组件深度解析

2.1 Source 组件详解

2.1.1 Exec Source 实现机制

2.1.2 Avro Source 网络通信

2.2 Channel 组件深度分析

2.2.1 Memory Channel 内存优化策略

2.2.2 File Channel 持久化机制深度解析

2.3 Sink 组件优化实践

2.3.1 HDFS Sink 大数据集成

3. 架构配置与优化

3.1 多级数据路由架构

3.2 高可用性配置

3.3 性能调优参数

4. 数据展示与监控

4.1 Flume 性能指标分布

4.2 性能优化优先级矩阵

4.3 监控指标收集

5. 实战案例分析

5.1 电商日志采集系统配置

5.2 实时监控告警流程

6. 故障诊断与最佳实践

6.1 常见故障与解决方案

6.1.1 Channel 满载问题

6.1.2 网络连接超时

6.2 性能优化最佳实践

6.2.1 批量处理优化

6.2.2 内存管理优化

7. 配置对比分析

总结

参考链接

更多推荐文章

相关免费在线工具

Flume 架构深度解析：构建高可用大数据采集系统

Flume 架构深度解析：构建高可用大数据采集系统

概述

1. Flume 架构概览

1.1 整体架构设计理念

1.2 Agent 生命周期管理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 核心组件深度解析

2.1 Source 组件详解

2.1.1 Exec Source 实现机制

2.1.2 Avro Source 网络通信

2.2 Channel 组件深度分析

2.2.1 Memory Channel 内存优化策略

2.2.2 File Channel 持久化机制深度解析

2.3 Sink 组件优化实践

2.3.1 HDFS Sink 大数据集成

3. 架构配置与优化

3.1 多级数据路由架构

3.2 高可用性配置

3.3 性能调优参数

4. 数据展示与监控

4.1 Flume 性能指标分布

4.2 性能优化优先级矩阵

4.3 监控指标收集

5. 实战案例分析

5.1 电商日志采集系统配置

5.2 实时监控告警流程

6. 故障诊断与最佳实践

6.1 常见故障与解决方案

6.1.1 Channel 满载问题

6.1.2 网络连接超时

6.2 性能优化最佳实践

6.2.1 批量处理优化

6.2.2 内存管理优化

7. 配置对比分析

总结

参考链接

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具