基于C++的多项式曲线拟合代码实现与实战 | 极客日志

C++AI算法

基于C++的多项式曲线拟合代码实现与实战

介绍使用C++结合Eigen库实现多项式曲线拟合的方法。内容涵盖最小二乘法原理、范德蒙矩阵构建、正规方程与SVD求解策略对比、数据预处理（归一化、异常值剔除）及模型评估（RMSE、R²）。通过模块化设计与命令行交互，提供从理论到工程落地的完整解决方案，强调数值稳定性与过拟合防范。

技术博主发布于 2026/3/24更新于 2026/5/2928 浏览

曲线拟合的数学本质与工程实现：从理论到代码的一体化实践

在实际业务场景中，常面临数据规律不明确的问题。需要构建简洁的数学模型去逼近复杂的现实。多项式拟合是这个过程最基础也最关键的工具之一。

多项式建模：不只是个公式，而是对自由度的掌控

为什么要用多项式？因为它'看起来非线性'，但'算起来却是线性的'。

假设我们要拟合的数据满足这样一个关系：

$$ f(x) = a_0 + a_1 x + a_2 x^2 + \cdots + a_n x^n $$

这个函数整体上看当然是非线性的。可注意！它对参数 $\mathbf{a} = [a_0, a_1, …, a_n]^T$ 的依赖却是完全线性的。

范德蒙矩阵：把离散数据变成代数语言

构造所谓的 范德蒙矩阵（Vandermonde Matrix） 。

$$ \mathbf{X} = \begin{bmatrix} 1 & x_1 & x_1^2 & \cdots & x_1^n \ 1 & x_2 & x_2^2 & \cdots & x_2^n \ \vdots & \vdots & \vdots & \ddots & \vdots \ 1 & x_m & x_m^2 & \cdots & x_m^n \ \end{bmatrix} $$

每一行对应一个数据点，每一列代表一个幂次项。

std::vector<std::vector<double>> buildVandermonde(const std::vector<double>& x, int degree) {
    int m = x.size();
    int n = degree + 1;
    std::vector<std::vector<double>> X(m, std::vector<double>(n));
    for (int i = 0; i < m; ++i) {
        for (int j = 0; j < n; ++j) {
            X[i][j] = std::pow(x[i], j);
        }
    }
    return X;
}

当 $x_i$ 比较大时，高阶项可能导致矩阵元素数量级差异巨大，称为'病态矩阵'。解决办法是归一化先行。

graph TD
A[原始数据点 xi, yi] --> B{是否需要预处理？}
B -->|是 | C[归一化/去噪]
B -->|否 | D[直接构造矩阵]
C --> D
D --> E[初始化空矩阵 X]
E --> F[遍历每个 xi]
F --> G[计算 1, xi, xi², ..., xin]
G --> H[填入矩阵第i行]
H --> I{是否所有点处理完毕？}
I -->|否 | F
I -->|是 | J[输出范德蒙矩阵 X]

阶数选择的艺术：偏差 - 方差的永恒博弈

现实中更常见的情况是：阶数越高，训练误差越低，但预测能力反而下降。

模型类型	偏差	方差	表现

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

#include <Eigen/Dense>
Eigen::VectorXd solve_normal_equation(const Eigen::MatrixXd& X, const Eigen::VectorXd& Y) {
    Eigen::MatrixXd XtX = X.transpose() * X;
    Eigen::VectorXd XtY = X.transpose() * Y;
    return XtX.ldlt().solve(XtY); // 使用 LDLT 分解提升稳定性
}

flowchart TD
P[最小二乘问题] --> Q{X是否列满秩？}
Q -->|是 | R[XtX正定 → 凸函数]
Q -->|否 | S[存在无穷多解或无解]
R --> T[梯度为零 ⇒ 唯一最优解]
S --> U[需引入正则化或SVD]

bool read_csv(const std::string& filename, std::vector<double>& x_vec, std::vector<double>& y_vec) {
    std::ifstream file(filename);
    if (!file.is_open()) {
        throw std::runtime_error("Cannot open file: " + filename);
    }
    std::string line;
    int line_num = 0;
    while (std::getline(file, line)) {
        ++line_num;
        std::istringstream ss(line);
        std::string cell_x, cell_y;
        if (!std::getline(ss, cell_x, ',')) continue;
        if (!std::getline(ss, cell_y, ',')) {
            throw std::invalid_argument("Incomplete data at line " + std::to_string(line_num));
        }
        try {
            double x = std::stod(cell_x);
            double y = std::stod(cell_y);
            x_vec.push_back(x);
            y_vec.push_back(y);
        } catch (...) {
            throw std::invalid_argument("Invalid number format at line " + std::to_string(line_num));
        }
    }
    if (x_vec.empty()) {
        throw std::length_error("No valid data found in file.");
    }
    return true;
}

void remove_outliers_iqr(std::vector<double>& x_data, std::vector<double>& y_data) {
    if (y_data.size() < 4) return;
    std::vector<double> y_sorted = y_data;
    std::sort(y_sorted.begin(), y_sorted.end());
    double Q1 = percentile(y_sorted, 0.25);
    double Q3 = percentile(y_sorted, 0.75);
    double IQR = Q3 - Q1;
    double lower_bound = Q1 - 1.5 * IQR;
    double upper_bound = Q3 + 1.5 * IQR;
    std::vector<double> new_x, new_y;
    for (size_t i = 0; i < y_data.size(); ++i) {
        if (y_data[i] >= lower_bound && y_data[i] <= upper_bound) {
            new_x.push_back(x_data[i]);
            new_y.push_back(y_data[i]);
        }
    }
    x_data = std::move(new_x);
    y_data = std::move(new_y);
}

void normalize_data(std::vector<double>& x_data) {
    double sum = 0.0;
    for (double x : x_data) sum += x;
    double mean = sum / x_data.size();
    double var_sum = 0.0;
    for (double x : x_data) var_sum += (x - mean) * (x - mean);
    double stddev = std::sqrt(var_sum / x_data.size());
    if (stddev == 0.0) stddev = 1.0;
    for (double& x : x_data) {
        x = (x - mean) / stddev;
    }
}

Eigen::JacobiSVD<Eigen::MatrixXd> svd(V, Eigen::ComputeThinU | Eigen::ComputeThinV);
return svd.solve(y);

flowchart TD
Start[开始求解] --> IsStable{矩阵是否良态？}
IsStable -- 是 | UseQR[使用 QR 分解]
IsStable -- 否 | UseSVD[使用 SVD 分解]
UseQR --> Result1[快速获得近似解]
UseSVD --> Result2[获得最稳健解]
Result1 --> End
Result2 --> End

class CurveFitter {
private:
    std::vector<double> x, y;
    Eigen::VectorXd coefficients;
    int degree;
public:
    CurveFitter(const std::vector<double>& x_data, const std::vector<double>& y_data, int deg)
        : x(x_data), y(y_data), degree(deg) {}
    void build_vandermonde_matrix(Eigen::MatrixXd& V);
    bool solve_normal_equations();
    double evaluate(double x_val) const;
    double compute_rmse() const;
    double compute_r_squared() const;
    void save_results(const std::string& output_path) const;
};

while ((opt = getopt(argc, argv, "i:d:o:h")) != -1) {
    switch (opt) {
        case 'i': input_file = optarg; break;
        case 'd': degree = atoi(optarg); break;
        case 'o': output_file = optarg; break;
        case 'h': cout << "Usage: " << argv[0] << " -i data.txt -d 3 -o result.csv" << endl; return 0;
    }
}

set title "Polynomial Fit (degree $1)"
set xlabel "x"
set ylabel "y"
set grid
set terminal png size 800,600
set output 'fit_plot.png'
plot '$2' using 1:2 with points pt 7 ps 0.8 title "Data",\
     '$2' using 1:3 with lines lw 2 title "Fitted Curve"
EOF

std::system("gnuplot plot.gp");

if (degree >= 8 && rmse_on_test_region > 2 * global_rmse) {
    std::cout << "[Warning] Possible overfitting detected. "
              << "Consider reducing polynomial degree." << std::endl;
}
double r2 = fitter.compute_r_squared();
if (r2 < 0.8) {
    std::cout << "[Suggestion] Low R² (" << r2 << "). Model may underfit. Try higher degree or check data noise." << std::endl;
}

Eigen::MatrixXd regularized_A = V.transpose() * V + lambda * Eigen::MatrixXd::Identity(degree+1, degree+1);
coefficients = regularized_A.ldlt().solve(V.transpose() * y_vector);

低阶（如线性）	高	低	欠拟合，错过趋势
中阶（如3~6次）	适中	适中	最佳平衡区
高阶（>8次）	低	高	过拟合，记住噪声

基于C++的多项式曲线拟合代码实现与实战

曲线拟合的数学本质与工程实现：从理论到代码的一体化实践

多项式建模：不只是个公式，而是对自由度的掌控

范德蒙矩阵：把离散数据变成代数语言

阶数选择的艺术：偏差 - 方差的永恒博弈

更多推荐文章

相关免费在线工具

最小二乘法：优雅背后的数学逻辑

正规方程推导：微积分遇上线性代数

凸优化视角：为什么你能相信这个解？

数据处理实战：让理论真正跑起来

文件读取：别让格式毁了你的努力

异常值剔除：别让 outliers 毁了整锅汤

归一化：拯救病态矩阵的最后一道防线

高效求解策略：不只是快，更是稳

高斯消元：教学经典 vs 实战局限

SVD：终极武器，专治各种不服

完整系统集成：从命令行到可视化

模块化设计：CurveFitter 类登场

命令行交互：让用户掌控节奏

自动绘图：一键生成图表

模型诊断：防止自我欺骗的关键一步

写在最后：拟合不仅是技术，更是思维方式

更多推荐文章

相关免费在线工具

基于C++的多项式曲线拟合代码实现与实战

曲线拟合的数学本质与工程实现：从理论到代码的一体化实践

多项式建模：不只是个公式，而是对自由度的掌控

范德蒙矩阵：把离散数据变成代数语言

阶数选择的艺术：偏差 - 方差的永恒博弈

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

最小二乘法：优雅背后的数学逻辑

正规方程推导：微积分遇上线性代数

凸优化视角：为什么你能相信这个解？

数据处理实战：让理论真正跑起来

文件读取：别让格式毁了你的努力

异常值剔除：别让 outliers 毁了整锅汤

归一化：拯救病态矩阵的最后一道防线

高效求解策略：不只是快，更是稳

高斯消元：教学经典 vs 实战局限

SVD：终极武器，专治各种不服

完整系统集成：从命令行到可视化

模块化设计：CurveFitter 类登场

命令行交互：让用户掌控节奏

自动绘图：一键生成图表

模型诊断：防止自我欺骗的关键一步

写在最后：拟合不仅是技术，更是思维方式

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具