PostgreSQL 高级分区表实战：哈希与复合分区策略 | 极客日志

SQLjava算法

PostgreSQL 高级分区表实战：哈希与复合分区策略

PostgreSQL 10.0 起支持原生分区，哈希分区利用哈希函数均匀分布数据，适合高并发写入和等值查询。复合分区结合范围与哈希策略，通过多级剪枝优化大规模数据查询性能。两种分区原理、创建方式及 Java 应用集成方案，涵盖连接池配置、索引策略与动态分区管理工具实现。结合实际电商订单场景分析性能基准，提供常见陷阱规避与最佳实践建议，助力构建高性能易维护的数据存储架构。

接口猎人发布于 2026/3/26更新于 2026/7/2033 浏览

PostgreSQL 高级分区表实战：哈希与复合分区策略

在现代数据密集型应用中，数据库性能和可维护性是决定系统成败的关键因素。随着业务规模的扩大，单表数据量可能达到数亿甚至数十亿行，这给传统的数据库管理带来了巨大挑战。PostgreSQL 自 10.0 版本开始引入原生分区表功能，并在后续版本中不断完善，为处理大规模数据提供了优雅的解决方案。

本文将深入探讨 PostgreSQL 中的高级分区技术，特别是 哈希分区（Hash Partitioning） 和 复合分区（Composite Partitioning），通过理论分析、实际示例和 Java 代码演示，帮助开发者全面掌握这些高级特性，构建高性能、易维护的数据存储架构。

分区表基础回顾

在深入高级分区之前，让我们先快速回顾一下 PostgreSQL 分区表的基本概念。

分区表是一种将大表逻辑上划分为多个较小、更易管理的物理表（称为分区）的技术。每个分区都包含原始表的一个子集数据，但对外表现为一个统一的逻辑表。这种设计带来了多重优势：

查询性能提升：查询优化器可以执行"分区剪枝"（Partition Pruning），只扫描相关的分区，大幅减少 I/O 操作
维护操作简化：可以对单个分区进行维护操作（如 VACUUM、REINDEX），而不影响整个表
数据生命周期管理：便于实现数据归档和删除策略
并行处理能力：某些操作可以在多个分区上并行执行

PostgreSQL 支持三种主要的分区策略：

范围分区（Range Partitioning）：基于列值的范围进行分区
列表分区（List Partitioning）：基于列值的明确列表进行分区
哈希分区（Hash Partitioning）：基于哈希函数的结果进行分区

-- 范围分区示例
CREATE TABLE sales (
    id SERIAL,
    sale_date DATE,
    amount DECIMAL(10,2)
) PARTITION BY RANGE (sale_date);

-- 列表分区示例
CREATE TABLE users (
    id SERIAL,
    country VARCHAR(50),
    name VARCHAR(100)
) PARTITION BY LIST (country);

-- 哈希分区示例
CREATE TABLE orders (
    id SERIAL,
    customer_id INT,
    order_date DATE
) PARTITION BY HASH (customer_id);

哈希分区详解

哈希分区的工作原理

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
Keycode 信息
查找任何按下的键的javascript键代码、代码、位置和修饰符。在线工具，Keycode 信息在线工具，online
Escape 与 Native 编解码
JavaScript 字符串转义/反转义；Java 风格 \uXXXX（Native2Ascii）编码与解码。在线工具，Escape 与 Native 编解码在线工具，online
JavaScript / HTML 格式化
使用 Prettier 在浏览器内格式化 JavaScript 或 HTML 片段。在线工具，JavaScript / HTML 格式化在线工具，online
JavaScript 压缩与混淆
Terser 压缩、变量名混淆，或 javascript-obfuscator 高强度混淆（体积会增大）。在线工具，JavaScript 压缩与混淆在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online

-- 创建主表（分区表）
CREATE TABLE orders (
    id BIGSERIAL PRIMARY KEY,
    customer_id INT NOT NULL,
    order_date TIMESTAMP NOT NULL DEFAULT CURRENT_TIMESTAMP,
    total_amount DECIMAL(12,2) NOT NULL,
    status VARCHAR(20) NOT NULL
) PARTITION BY HASH (customer_id);

-- 创建 4 个分区
CREATE TABLE orders_p0 PARTITION OF orders FOR VALUES WITH (MODULUS 4, REMAINDER 0);
CREATE TABLE orders_p1 PARTITION OF orders FOR VALUES WITH (MODULUS 4, REMAINDER 1);
CREATE TABLE orders_p2 PARTITION OF orders FOR VALUES WITH (MODULUS 4, REMAINDER 2);
CREATE TABLE orders_p3 PARTITION OF orders FOR VALUES WITH (MODULUS 4, REMAINDER 3);

-- 第一级：按订单日期范围分区
CREATE TABLE orders_composite (
    id BIGSERIAL,
    customer_id INT NOT NULL,
    order_date DATE NOT NULL,
    total_amount DECIMAL(12,2) NOT NULL,
    status VARCHAR(20) NOT NULL
) PARTITION BY RANGE (order_date);

-- 2023 年分区（第二级：按 customer_id 哈希分区）
CREATE TABLE orders_2023 PARTITION OF orders_composite 
FOR VALUES FROM ('2023-01-01') TO ('2024-01-01') PARTITION BY HASH (customer_id);
CREATE TABLE orders_2023_p0 PARTITION OF orders_2023 FOR VALUES WITH (MODULUS 4, REMAINDER 0);
CREATE TABLE orders_2023_p1 PARTITION OF orders_2023 FOR VALUES WITH (MODULUS 4, REMAINDER 1);
CREATE TABLE orders_2023_p2 PARTITION OF orders_2023 FOR VALUES WITH (MODULUS 4, REMAINDER 2);
CREATE TABLE orders_2023_p3 PARTITION OF orders_2023 FOR VALUES WITH (MODULUS 4, REMAINDER 3);

-- 2024 年分区（第二级：按 customer_id 哈希分区）
CREATE TABLE orders_2024 PARTITION OF orders_composite 
FOR VALUES FROM ('2024-01-01') TO ('2025-01-01') PARTITION BY HASH (customer_id);
CREATE TABLE orders_2024_p0 PARTITION OF orders_2024 FOR VALUES WITH (MODULUS 4, REMAINDER 0);
CREATE TABLE orders_2024_p1 PARTITION OF orders_2024 FOR VALUES WITH (MODULUS 4, REMAINDER 1);
CREATE TABLE orders_2024_p2 PARTITION OF orders_2024 FOR VALUES WITH (MODULUS 4, REMAINDER 2);
CREATE TABLE orders_2024_p3 PARTITION OF orders_2024 FOR VALUES WITH (MODULUS 4, REMAINDER 3);

-- 查询 2023 年特定用户的订单
SELECT * FROM orders_composite 
WHERE order_date BETWEEN '2023-06-01' AND '2023-06-30' AND customer_id = 12345;

<dependencies>
    <!-- PostgreSQL JDBC Driver -->
    <dependency>
        <groupId>org.postgresql</groupId>
        <artifactId>postgresql</artifactId>
        <version>42.6.0</version>
    </dependency>
    <!-- Spring Boot Starter Data JPA (可选) -->
    <dependency>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-data-jpa</artifactId>
        <version>3.1.0</version>
    </dependency>
    <!-- HikariCP Connection Pool -->
    <dependency>
        <groupId>com.zaxxer</groupId>
        <artifactId>HikariCP</artifactId>
        <version>5.0.1</version>
    </dependency>
</dependencies>

// Order.java
import jakarta.persistence.*;
import java.math.BigDecimal;
import java.time.LocalDateTime;

@Entity
@Table(name = "orders")
public class Order {
    @Id
    @GeneratedValue(strategy = GenerationType.IDENTITY)
    private Long id;

    @Column(name = "customer_id", nullable = false)
    private Integer customerId;

    @Column(name = "order_date", nullable = false)
    private LocalDateTime orderDate;

    @Column(name = "total_amount", nullable = false, precision = 12, scale = 2)
    private BigDecimal totalAmount;

    @Column(name = "status", nullable = false, length = 20)
    private String status;

    // Constructors, getters and setters
    public Order() {}

    public Order(Integer customerId, LocalDateTime orderDate, BigDecimal totalAmount, String status) {
        this.customerId = customerId;
        this.orderDate = orderDate;
        this.totalAmount = totalAmount;
        this.status = status;
    }

    // Getters and Setters...
    public Long getId() { return id; }
    public void setId(Long id) { this.id = id; }
    public Integer getCustomerId() { return customerId; }
    public void setCustomerId(Integer customerId) { this.customerId = customerId; }
    public LocalDateTime getOrderDate() { return orderDate; }
    public void setOrderDate(LocalDateTime orderDate) { this.orderDate = orderDate; }
    public BigDecimal getTotalAmount() { return totalAmount; }
    public void setTotalAmount(BigDecimal totalAmount) { this.totalAmount = totalAmount; }
    public String getStatus() { return status; }
    public void setStatus(String status) { this.status = status; }
}

// OrderRepository.java
import org.springframework.data.jpa.repository.JpaRepository;
import org.springframework.data.jpa.repository.Query;
import org.springframework.data.repository.query.Param;
import java.time.LocalDateTime;
import java.util.List;

public interface OrderRepository extends JpaRepository<Order, Long> {
    // 精确查询：利用哈希分区的优势
    List<Order> findByCustomerId(Integer customerId);

    // 范围查询：注意这会扫描所有分区
    List<Order> findByOrderDateBetween(LocalDateTime start, LocalDateTime end);

    // 复合查询：如果使用复合分区，可以同时利用两种分区策略
    @Query("SELECT o FROM Order o WHERE o.customerId = :customerId " +
           "AND o.orderDate BETWEEN :startDate AND :endDate")
    List<Order> findOrdersByCustomerAndDate(
        @Param("customerId") Integer customerId,
        @Param("startDate") LocalDateTime startDate,
        @Param("endDate") LocalDateTime endDate
    );
}

// PartitionManager.java
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.jdbc.core.JdbcTemplate;
import org.springframework.stereotype.Component;
import java.time.LocalDate;
import java.time.format.DateTimeFormatter;

@Component
public class PartitionManager {
    @Autowired
    private JdbcTemplate jdbcTemplate;

    private static final DateTimeFormatter YEAR_FORMATTER = DateTimeFormatter.ofPattern("yyyy");

    /**
     * 为指定年份创建复合分区（范围 + 哈希）
     */
    public void createYearlyCompositePartition(int year) {
        String yearStr = String.valueOf(year);
        String nextYearStr = String.valueOf(year + 1);

        // 创建年份范围分区
        String rangePartitionSql = String.format(
            "CREATE TABLE IF NOT EXISTS orders_%s " +
            "PARTITION OF orders_composite " +
            "FOR VALUES FROM ('%s-01-01') TO ('%s-01-01') " +
            "PARTITION BY HASH (customer_id)",
            yearStr, yearStr, nextYearStr
        );
        jdbcTemplate.execute(rangePartitionSql);

        // 创建 4 个哈希子分区
        for (int i = 0; i < 4; i++) {
            String hashPartitionSql = String.format(
                "CREATE TABLE IF NOT EXISTS orders_%s_p%d " +
                "PARTITION OF orders_%s " +
                "FOR VALUES WITH (MODULUS 4, REMAINDER %d)",
                yearStr, i, yearStr, i
            );
            jdbcTemplate.execute(hashPartitionSql);
        }
        System.out.println("Created composite partitions for year " + year);
    }

    /**
     * 删除指定年份的分区（用于数据归档）
     */
    public void dropYearlyPartition(int year) {
        String yearStr = String.valueOf(year);
        String dropSql = "DROP TABLE IF EXISTS orders_" + yearStr + " CASCADE";
        jdbcTemplate.execute(dropSql);
        System.out.println("Dropped partition for year " + year);
    }

    /**
     * 获取分区统计信息
     */
    public void printPartitionStats() {
        String sql = """
            SELECT nmsp_parent.nspname AS parent_schema,
                   parent.relname AS parent_table,
                   nmsp_child.nspname AS child_schema,
                   child.relname AS child_table,
                   pg_size_pretty(pg_total_relation_size(child.oid)) AS size
            FROM pg_inherits
            JOIN pg_class parent ON pg_inherits.inhparent = parent.oid
            JOIN pg_class child ON pg_inherits.inhrelid = child.oid
            JOIN pg_namespace nmsp_parent ON nmsp_parent.oid = parent.relnamespace
            JOIN pg_namespace nmsp_child ON nmsp_child.oid = child.relnamespace
            WHERE parent.relname = 'orders_composite'
            ORDER BY child.relname;
            """;
        jdbcTemplate.query(sql, (rs, rowNum) -> {
            System.out.printf("Partition: %s.%s, Size: %s%n",
                rs.getString("child_schema"), rs.getString("child_table"), rs.getString("size"));
            return null;
        });
    }
}

// PartitionPerformanceTest.java
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.CommandLineRunner;
import org.springframework.stereotype.Component;
import java.math.BigDecimal;
import java.time.LocalDateTime;
import java.util.ArrayList;
import java.util.List;
import java.util.Random;

@Component
public class PartitionPerformanceTest implements CommandLineRunner {
    @Autowired
    private OrderRepository orderRepository;
    @Autowired
    private PartitionManager partitionManager;

    private final Random random = new Random();

    @Override
    public void run(String... args) throws Exception {
        prepareTestData();
        testHashPartitionQuery();
        testCompositePartitionQuery();
    }

    private void prepareTestData() {
        System.out.println("Generating test data...");
        // 创建 2023 年和 2024 年的分区
        partitionManager.createYearlyCompositePartition(2023);
        partitionManager.createYearlyCompositePartition(2024);

        // 生成 10000 条测试订单
        List<Order> orders = new ArrayList<>();
        for (int i = 0; i < 10000; i++) {
            int customerId = random.nextInt(1000) + 1; // 1-1000
            LocalDateTime orderDate;
            // 50% 2023 年，50% 2024 年
            if (random.nextBoolean()) {
                orderDate = LocalDateTime.of(2023, 1, 1, 0, 0).plusDays(random.nextInt(365));
            } else {
                orderDate = LocalDateTime.of(2024, 1, 1, 0, 0).plusDays(random.nextInt(365));
            }
            BigDecimal amount = new BigDecimal(random.nextInt(10000) + 1).divide(BigDecimal.valueOf(100));
            String status = random.nextBoolean() ? "completed" : "pending";
            orders.add(new Order(customerId, orderDate, amount, status));
        }

        // 批量插入
        orderRepository.saveAll(orders);
        System.out.println("Inserted " + orders.size() + " test orders");
    }

    private void testHashPartitionQuery() {
        System.out.println("\n=== Testing Hash Partition Query ===");
        int testCustomerId = 123;
        long startTime = System.currentTimeMillis();
        List<Order> orders = orderRepository.findByCustomerId(testCustomerId);
        long endTime = System.currentTimeMillis();
        System.out.printf("Found %d orders for customer %d in %d ms%n",
            orders.size(), testCustomerId, (endTime - startTime));
    }

    private void testCompositePartitionQuery() {
        System.out.println("\n=== Testing Composite Partition Query ===");
        int testCustomerId = 456;
        LocalDateTime startDate = LocalDateTime.of(2023, 6, 1, 0, 0);
        LocalDateTime endDate = LocalDateTime.of(2023, 6, 30, 23, 59, 59);
        long startTime = System.currentTimeMillis();
        List<Order> orders = orderRepository.findOrdersByCustomerAndDate(
            testCustomerId, startDate, endDate);
        long endTime = System.currentTimeMillis();
        System.out.printf("Found %d orders for customer %d in June 2023 in %d ms%n",
            orders.size(), testCustomerId, (endTime - startTime));
    }
}

// DatabaseConfig.java
import com.zaxxer.hikari.HikariConfig;
import com.zaxxer.hikari.HikariDataSource;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;

@Configuration
public class DatabaseConfig {
    @Bean
    public HikariDataSource dataSource() {
        HikariConfig config = new HikariConfig();
        config.setJdbcUrl("jdbc:postgresql://localhost:5432/mydb");
        config.setUsername("postgres");
        config.setPassword("password");

        // 连接池配置
        config.setMaximumPoolSize(20); // 根据应用并发需求调整
        config.setMinimumIdle(5);
        config.setConnectionTimeout(30000);
        config.setIdleTimeout(600000);
        config.setMaxLifetime(1800000);

        // PostgreSQL 特定优化
        config.addDataSourceProperty("ApplicationName", "MyApp");
        config.addDataSourceProperty("tcpKeepAlive", "true");
        config.addDataSourceProperty("loginTimeout", "30");

        return new HikariDataSource(config);
    }
}

-- 查看查询计划
EXPLAIN (ANALYZE, BUFFERS)
SELECT * FROM orders_composite 
WHERE order_date BETWEEN '2023-06-01' AND '2023-06-30' AND customer_id = 12345;

// QueryPlanLogger.java
import org.springframework.jdbc.core.JdbcTemplate;
import org.springframework.stereotype.Component;

@Component
public class QueryPlanLogger {
    @Autowired
    private JdbcTemplate jdbcTemplate;

    public void logQueryPlan(String query, Object... params) {
        String explainQuery = "EXPLAIN (ANALYZE, BUFFERS) " + query;
        List<String> plan = jdbcTemplate.query(explainQuery, params, (rs, rowNum) -> rs.getString(1));
        System.out.println("Query Execution Plan:");
        plan.forEach(System.out::println);
    }
}

// AutoPartitionManager.java
import org.springframework.scheduling.annotation.Scheduled;
import org.springframework.stereotype.Component;
import java.time.LocalDate;
import java.time.temporal.ChronoUnit;

@Component
public class AutoPartitionManager {
    @Autowired
    private PartitionManager partitionManager;

    /**
     * 每月 1 号检查并创建未来 3 个月的分区
     */
    @Scheduled(cron = "0 0 2 1 * ?") // 每月 1 号凌晨 2 点
    public void createFuturePartitions() {
        LocalDate now = LocalDate.now();
        // 创建当前年份和下一年的分区
        int currentYear = now.getYear();
        partitionManager.createYearlyCompositePartition(currentYear);
        partitionManager.createYearlyCompositePartition(currentYear + 1);

        // 清理 3 年前的旧分区
        int cleanupYear = currentYear - 3;
        partitionManager.dropYearlyPartition(cleanupYear);
    }
}

-- 在主表上创建索引（会在所有分区上自动创建）
CREATE INDEX idx_orders_customer_id ON orders_composite (customer_id);

-- 在特定分区上创建索引（针对特殊查询模式）
CREATE INDEX idx_orders_2023_p0_status ON orders_2023_p0 (status);

-- V2__create_partition_indexes.sql
-- 为每个哈希分区创建状态索引
CREATE INDEX CONCURRENTLY idx_orders_2023_p0_status ON orders_2023_p0 (status);
CREATE INDEX CONCURRENTLY idx_orders_2023_p1_status ON orders_2023_p1 (status);
CREATE INDEX CONCURRENTLY idx_orders_2023_p2_status ON orders_2023_p2 (status);
CREATE INDEX CONCURRENTLY idx_orders_2023_p3_status ON orders_2023_p3 (status);
CREATE INDEX CONCURRENTLY idx_orders_2024_p0_status ON orders_2024_p0 (status);
CREATE INDEX CONCURRENTLY idx_orders_2024_p1_status ON orders_2024_p1 (status);
CREATE INDEX CONCURRENTLY idx_orders_2024_p2_status ON orders_2024_p2 (status);
CREATE INDEX CONCURRENTLY idx_orders_2024_p3_status ON orders_2024_p3 (status);

-- 最终的表结构
CREATE TABLE ecommerce_orders (
    id BIGSERIAL,
    user_id BIGINT NOT NULL,
    order_date TIMESTAMP NOT NULL,
    total_amount DECIMAL(12,2) NOT NULL,
    status VARCHAR(20) NOT NULL,
    created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
) PARTITION BY RANGE (order_date);

-- 月度分区示例
CREATE TABLE orders_2023_12 PARTITION OF ecommerce_orders 
FOR VALUES FROM ('2023-12-01') TO ('2024-01-01') PARTITION BY HASH (user_id);

-- 哈希子分区
CREATE TABLE orders_2023_12_p0 PARTITION OF orders_2023_12 FOR VALUES WITH (MODULUS 8, REMAINDER 0);
CREATE TABLE orders_2023_12_p1 PARTITION OF orders_2023_12 FOR VALUES WITH (MODULUS 8, REMAINDER 1);
-- ... 其他 6 个分区

-- 如果只查询非分区键，会扫描所有分区
SELECT * FROM orders WHERE status = 'completed'; -- 扫描所有分区

-- ❌ 错误：无法使用分区剪枝
SELECT * FROM orders WHERE EXTRACT(YEAR FROM order_date) = 2023;

-- ✅ 正确：可以使用分区剪枝
SELECT * FROM orders WHERE order_date >= '2023-01-01' AND order_date < '2024-01-01';

-- 监控分区大小，避免数据倾斜
SELECT schemaname, tablename, pg_size_pretty(pg_total_relation_size(schemaname||'.'||tablename)) as size 
FROM pg_tables 
WHERE tablename LIKE 'orders_%' 
ORDER BY size DESC;

-- 使用分区切换进行高效数据加载
CREATE TABLE orders_temp (LIKE orders INCLUDING ALL);
-- 加载数据到临时表
INSERT INTO orders_temp SELECT * FROM staging_data;
-- 切换分区
ALTER TABLE orders DETACH PARTITION orders_2023_12;
ALTER TABLE orders ATTACH PARTITION orders_temp AS PARTITION OF orders 
FOR VALUES FROM ('2023-12-01') TO ('2024-01-01');

-- 对单个分区进行维护
VACUUM ANALYZE orders_2023_p0;
-- 避免对整个分区表进行全表操作

PostgreSQL 高级分区表实战：哈希与复合分区策略

PostgreSQL 高级分区表实战：哈希与复合分区策略

分区表基础回顾

哈希分区详解

哈希分区的工作原理

更多推荐文章

相关免费在线工具

创建哈希分区表

哈希分区的性能特点

实际应用场景

复合分区（多级分区）

复合分区的概念

复合分区的实现方式

复合分区的查询优化

复合分区的设计考虑

Java 应用集成示例

依赖配置

基础数据访问层

哈希分区的 Java 操作

手动分区管理工具类

性能测试对比

连接池配置优化

高级优化技巧

分区剪枝监控

动态分区管理

索引策略优化

实际案例分析

电商平台订单系统

性能基准测试

常见陷阱与最佳实践

分区数量的平衡

查询条件的注意事项

维护操作的最佳实践

未来发展趋势

总结

更多推荐文章

相关免费在线工具

PostgreSQL 高级分区表实战：哈希与复合分区策略

PostgreSQL 高级分区表实战：哈希与复合分区策略

分区表基础回顾

哈希分区详解

哈希分区的工作原理

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

创建哈希分区表

哈希分区的性能特点

实际应用场景

复合分区（多级分区）

复合分区的概念

复合分区的实现方式

复合分区的查询优化

复合分区的设计考虑

Java 应用集成示例

依赖配置

基础数据访问层

哈希分区的 Java 操作

手动分区管理工具类

性能测试对比

连接池配置优化

高级优化技巧

分区剪枝监控

动态分区管理

索引策略优化

实际案例分析

电商平台订单系统

性能基准测试

常见陷阱与最佳实践

分区数量的平衡

查询条件的注意事项

维护操作的最佳实践

未来发展趋势

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具