一、前言
数学建模竞赛是检验数据处理、模型构建、算法设计与论文写作的综合赛事。本文整理内容涵盖竞赛论文撰写全过程,包含数据处理、模型选型、算法选择、论文写作,以及 AI 提示词模板可直接套用,帮助快速提升备赛效率与论文质量。
二、数据预处理(建模前的核心步骤)
数据质量直接决定模型精度,预处理需按缺失值、异常值、数据转换、标准化、降维依次处理。
- 缺失值:分为完全随机缺失、随机缺失与非随机缺失。数据量较小时可直接删除,数据量较大时采用均值、中位数或众数填充,时序数据优先使用插值法。
- 异常值检测:常用 3σ原则与箱线图,正态分布数据用均值替换,偏态分布数据用中位数替换,小样本数据直接修正或删除,大样本数据可采用缩尾处理。
- 数据转换:将类别、文本、时间等非数值信息转为数值格式,满足算法输入要求。
- 标准化:消除量纲影响,让不同特征具备可比性,常用方法为零 - 均值标准化与最大最小归一化。
- 数据降维:保留核心信息、降低计算复杂度,分类任务优先使用线性判别分析,无监督场景优先使用主成分分析。
三、常用模型与算法速查
(一)分类模型
分类模型依据历史数据建立规则,对新样本预测类别。常用方法包括 K 均值聚类、分层聚类、费舍尔判别、逻辑回归、决策树、随机森林、支持向量机与神经网络。聚类适用于无标签数据分类,判别分析适用于已知类别样本划分,逻辑回归输出概率便于解释,神经网络与集成模型精度更高。
(二)评价模型
评价模型用于方案优选与系统评估。常用方法有层次分析法、模糊综合评价、灰色关联法、主成分分析、优劣解距离法、数据包络分析。单一模型适用场景有限,组合评价可提升结果可靠性。
(三)预测模型
预测模型基于历史数据推断未来趋势。时间序列预测常用自回归积分移动平均、指数平滑、灰色预测。回归预测包括多元线性回归与非线性回归。机器学习预测依托决策树、随机森林、神经网络等模型,适合高维复杂数据。
(四)模型评估
分类模型用准确率、精确率、召回率、F1 值、AUC 与混淆矩阵评估。回归模型用平均绝对误差、均方根误差、决定系数评估。评估需结合任务场景选择指标,同时开展稳定性与灵敏度分析。
四、数学建模论文写作流程
(一)问题分析 明确问题背景、已知条件与求解目标,判断问题属于分类、评价、预测或优化类型。控制篇幅,单题不超过一页,多题不超过两页,可引用文献支撑背景分析。
(二)模型假设 简化实际问题,保留核心因素,假设需合理、明确且可验证,为模型建立提供基础。
(三)模型建立 基于问题与假设,用数学公式表达变量关系、目标函数与约束条件。优先选用成熟模型,可做局部改进形成创新点,公式用规范格式表述。
(四)模型求解 确定求解算法,借助软件实现计算。流程清晰分步呈现,关键步骤保留推导过程,过长代码放入附录,不替代核心求解步骤。
(五)结果展示 结果完整、规范、醒目,核心结果与中间结果均需呈现,优先使用表格,便于直观查看。
(六)结果分析 解读结果含义,验证建模目标,说明模型适用范围、稳定性与可靠性,给出合理结论与建议。
五、论文写作核心要点
(一)摘要 摘要最后撰写,第一段两句话,第一句说明背景,第二句说明研究问题。中间段落分别对应各问题,写明问题内容、模型、算法与结果。最后一段总结全文,点明创新点。摘要需包含问题、方法、模型、结果、价值,使用专业术语。另外关键词选取 4 至 5 个,要覆盖模型、算法、核心任务,体现研究核心。
(二)正文要求 模型建立与求解分开撰写,关系式明确,思路清晰,短句表达,逻辑连贯。每个问题独立阐述,段落间空行,避免长难句与非通用词汇,确保语句有主语。
六、AI 提示词
(一)问题分析提示词
你是一位有 20 年数学建模竞赛指导经验的资深专家,请深度分析这道题目的核心问题、数学本质、求解难点,并从问题类型判定、变量识别、约束分析、目标函数设计、求解方法选择等角度给出详细的建模思路,同时评估各种可能方案的可行性、创新性和竞赛得分潜力。
请从实际应用专家的角度分析这个问题的现实背景和意义,识别问题中涉及的行业特点、利益相关者、实际约束条件,并提出符合现实情况的建模假设和简化策略。

