HDFS 读写究竟做了什么？从 Java 代码看数据流内幕

HDFS 读写围绕 FileSystem 抽象层展开。读文件时，客户端通过 DFSInputStream 向 NameNode 请求数据块位置，优先连接最近的 DataNode 读取数据，容错时自动切换节点。写文件时，DFSOutputStream 将数据切分成包在管道中顺序转发到多个 DataNode，依赖反向 ACK 确认保证副本可靠，最后通知 NameNode 关闭文件。整个过程通过 RPC 和流式处理在简洁 API 下实现了高吞吐与容错。

黑客帝国发布于 2026/6/8更新于 2026/7/12 浏览

想弄清楚 HDFS 怎么读写，最好从你写的 Java 代码开始。在 Hadoop 里，FileSystem 是统一的文件系统抽象层，HDFS 对应的具体实现是 DistributedFileSystem。打开文件时，FileSystem.open() 返回一个 FSDataInputStream，底子里其实是 DFSInputStream；创建文件用的 create() 返回 FSDataOutputStream，对应 DFSOutputStream。搞明白这几个类的分工，再跟内部流程就对得上号了。

读数据

先看一段最精简的读文件代码：

import java.io.BufferedReader;
import java.io.InputStreamReader;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataInputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;

public class Chapter3 {
    public static void main(String[] args) {
        try {
            Configuration conf = new Configuration();
            conf.set("fs.defaultFS", "hdfs://localhost:9000");
            conf.set("fs.hdfs.impl", "org.apache.hadoop.hdfs.DistributedFileSystem");
            FileSystem fs = FileSystem.get(conf);
            Path file = new Path("test");
            FSDataInputStream in = fs.open(file);
            BufferedReader    ( (in));
               reader.readLine();
            System.out.println(content);
            reader.close();
            in.close();
            fs.close();
        }  (Exception e) {
            e.printStackTrace();
        }
    }
}

相关免费在线工具

Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;

public class Chapter3 {
    public static void main(String[] args) {
        try {
            Configuration conf = new Configuration();
            conf.set("fs.defaultFS", "hdfs://localhost:9000");
            conf.set("fs.hdfs.impl", "org.apache.hadoop.hdfs.DistributedFileSystem");
            FileSystem fs = FileSystem.get(conf);
            byte[] buff = "Hello world".getBytes();
            String filename = "test";
            FSDataOutputStream out = fs.create(new Path(filename));
            out.write(buff, 0, buff.length);
            System.out.println("Create:" + filename);
            out.close();
            fs.close();
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}

HDFS 读写究竟做了什么？从 Java 代码看数据流内幕

读数据

更多推荐文章

相关免费在线工具

写数据

更多推荐文章

相关免费在线工具

HDFS 读写究竟做了什么？从 Java 代码看数据流内幕

读数据

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

写数据

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具