动态规划详解：核心概念与经典案例 | 极客日志

Python算法

动态规划详解：核心概念与经典案例

介绍动态规划的基本概念、核心要素及解题步骤。通过 0-1 背包、爬楼梯、编辑距离等经典案例，展示暴力搜索、记忆化搜索及动态规划的实现方法。此外还涵盖空间优化技巧、状态压缩以及与其他算法的结合应用。旨在帮助读者掌握重叠子问题和最优子结构问题的解决思路，提升算法设计能力。

晚风叙旧发布于 2026/3/22更新于 2026/5/1219 浏览

引言

动态规划是解决具有重叠子问题和最优子结构性质问题的一种算法设计技术。它将复杂问题分解为更小的子问题，通过保存子问题的解来避免重复计算，从而提高算法效率。动态规划广泛应用于最优化问题，如资源分配、路径规划、序列比对等领域。

动态规划基本概念

核心要素

动态规划问题通常具有以下三个核心要素：

重叠子问题：问题可以分解为相互重叠的子问题
最优子结构：问题的最优解包含子问题的最优解
无后效性：某阶段状态一旦确定，不受这个状态以后决策的影响

解题步骤

使用动态规划解决问题通常包括以下步骤：

定义状态：确定用哪些变量表示问题的状态
状态转移方程：找出状态之间的递推关系
初始化：确定初始状态的值
计算顺序：确定状态的计算顺序
返回结果：根据计算结果返回最终答案

经典动态规划问题

0-1 背包问题

0-1 背包问题是动态规划的经典问题之一。给定一个容量为 cap 的背包和 n 个物品，每个物品有重量 wgt[i] 和价值 val[i]，要求在不超过背包容量的前提下，使装入背包的物品总价值最大。

暴力搜索解法

def knapsack_dfs(wgt: list[int], val: list[int], i: int, c: int) -> int:
    """0-1 背包：暴力搜索"""
    # 若已选完所有物品或背包无剩余容量，则返回价值 0
    if i == 0 or c == 0:
        return 0
    # 若超过背包容量，则只能选择不放入背包
    if wgt[i - 1] > c:
        return knapsack_dfs(wgt, val, i - 1, c)
    # 计算不放入和放入物品 i 的最大价值
    no = knapsack_dfs(wgt, val, i - 1, c)
    yes = knapsack_dfs(wgt, val, i - 1, c - wgt[i - 1]) + val[i - 1]
    
     (no, yes)

def knapsack_dfs_mem(wgt: list[int], val: list[int], mem: list[list[int]], i: int, c: int) -> int:
    """0-1 背包：记忆化搜索"""
    # 若已选完所有物品或背包无剩余容量，则返回价值 0
    if i == 0 or c == 0:
        return 0
    # 若已有记录，则直接返回
    if mem[i][c] != -1:
        return mem[i][c]
    # 若超过背包容量，则只能选择不放入背包
    if wgt[i - 1] > c:
        return knapsack_dfs_mem(wgt, val, mem, i - 1, c)
    # 计算不放入和放入物品 i 的最大价值
    no = knapsack_dfs_mem(wgt, val, mem, i - 1, c)
    yes = knapsack_dfs_mem(wgt, val, mem, i - 1, c - wgt[i - 1]) + val[i - 1]
    # 记录并返回两种方案中价值更大的那一个
    mem[i][c] = max(no, yes)
    return mem[i][c]

def knapsack_dp(wgt: list[int], val: list[int], cap: int) -> int:
    """0-1 背包：动态规划"""
    n = len(wgt)
    # 初始化 dp 表
    dp = [[0] * (cap + 1) for _ in range(n + 1)]
    # 状态转移
    for i in range(1, n + 1):
        for c in range(1, cap + 1):
            if wgt[i - 1] > c:
                # 若超过背包容量，则不选物品 i
                dp[i][c] = dp[i - 1][c]
            else:
                # 不选和选物品 i 这两种方案的较大值
                dp[i][c] = max(dp[i - 1][c], dp[i - 1][c - wgt[i - 1]] + val[i - 1])
    return dp[n][cap]

def knapsack_dp_comp(wgt: list[int], val: list[int], cap: int) -> int:
    """0-1 背包：空间优化后的动态规划"""
    n = len(wgt)
    # 初始化 dp 表
    dp = [0] * (cap + 1)
    # 状态转移
    for i in range(1, n + 1):
        # 倒序遍历
        for c in range(cap, 0, -1):
            if wgt[i - 1] > c:
                # 若超过背包容量，则不选物品 i
                dp[c] = dp[c]
            else:
                # 不选和选物品 i 这两种方案的较大值
                dp[c] = max(dp[c], dp[c - wgt[i - 1]] + val[i - 1])
    return dp[cap]

def climb_stairs_dp(n: int) -> int:
    """爬楼梯：动态规划"""
    if n <= 2:
        return n
    # 初始化 dp 表，用于存储子问题的解
    dp = [0] * (n + 1)
    # 初始状态：已在第 1, 2 阶
    dp[1], dp[2] = 1, 2
    # 状态转移：从第 3 阶开始
    for i in range(3, n + 1):
        dp[i] = dp[i - 1] + dp[i - 2]
    return dp[n]

def climb_stairs_dp_comp(n: int) -> int:
    """爬楼梯：空间优化后的动态规划"""
    if n <= 2:
        return n
    # 仅需存储前两个状态
    prev1, prev2 = 1, 2
    # 状态转移：从第 3 阶开始
    for _ in range(3, n + 1):
        curr = prev1 + prev2
        prev1, prev2 = prev2, curr
    return prev2

def edit_distance_dp(s: str, t: str) -> int:
    """编辑距离：动态规划"""
    n, m = len(s), len(t)
    # 初始化 dp 表
    dp = [[0] * (m + 1) for _ in range(n + 1)]
    # 初始化首行首列
    for i in range(1, n + 1):
        dp[i][0] = i
    for j in range(1, m + 1):
        dp[0][j] = j
    # 状态转移
    for i in range(1, n + 1):
        for j in range(1, m + 1):
            if s[i - 1] == t[j - 1]:
                # 两字符相等，不需要编辑
                dp[i][j] = dp[i - 1][j - 1]
            else:
                # 两字符不相等，取三者中的最小值
                dp[i][j] = min(
                    dp[i][j - 1] + 1,  # 插入
                    dp[i - 1][j] + 1,  # 删除
                    dp[i - 1][j - 1] + 1  # 替换
                )
    return dp[n][m]

def fibonacci(n: int) -> int:
    """斐波那契数列：空间优化后的动态规划"""
    if n <= 1:
        return n
    # 仅需存储前两个状态
    prev1, prev2 = 0, 1
    # 状态转移
    for _ in range(2, n + 1):
        curr = prev1 + prev2
        prev1, prev2 = prev2, curr
    return prev2

def min_path_sum_dp_comp(grid: list[list[int]]) -> int:
    """最小路径和：空间优化后的动态规划"""
    n, m = len(grid), len(grid[0])
    # 初始化 dp 表
    dp = [0] * m
    # 初始化首行
    dp[0] = grid[0][0]
    for j in range(1, m):
        dp[j] = dp[j - 1] + grid[0][j]
    # 状态转移
    for i in range(1, n):
        # 首列
        dp[0] += grid[i][0]
        for j in range(1, m):
            dp[j] = min(dp[j], dp[j - 1]) + grid[i][j]
    return dp[m - 1]

def coin_change_greedy(coins: list[int], amt: int) -> int:
    """零钱兑换：贪心"""
    # 假设 coins 列表有序
    i = len(coins) - 1
    count = 0
    # 循环进行贪心选择，直到无剩余金额
    while amt > 0:
        # 找到小于且最接近剩余金额的硬币
        while i > 0 and coins[i] > amt:
            i -= 1
        # 选择 coins[i]
        amt -= coins[i]
        count += 1
    # 若未找到可行方案，则返回 -1
    return count if amt == 0 else -1

def coin_change_dp(coins: list[int], amt: int) -> int:
    """零钱兑换：动态规划"""
    # 初始化 dp 表
    dp = [amt + 1] * (amt + 1)
    dp[0] = 0
    # 状态转移
    for coin in coins:
        for a in range(coin, amt + 1):
            dp[a] = min(dp[a], dp[a - coin] + 1)
    return dp[amt] if dp[amt] != amt + 1 else -1

# 股票买卖问题
def max_profit(prices: list[int]) -> int:
    """买卖股票的最佳时机"""
    if not prices:
        return 0
    min_price = prices[0]
    max_profit = 0
    for price in prices[1:]:
        min_price = min(min_price, price)
        max_profit = max(max_profit, price - min_price)
    return max_profit

# 最长公共子序列
def longest_common_subsequence(text1: str, text2: str) -> int:
    """最长公共子序列：动态规划"""
    n, m = len(text1), len(text2)
    # 初始化 dp 表
    dp = [[0] * (m + 1) for _ in range(n + 1)]
    # 状态转移
    for i in range(1, n + 1):
        for j in range(1, m + 1):
            if text1[i - 1] == text2[j - 1]:
                dp[i][j] = dp[i - 1][j - 1] + 1
            else:
                dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])
    return dp[n][m]