项目背景
年初,随着人工智能技术的迅猛发展,企业对于智能化应用的需求日益增长。基于现有的地下市政系统 WEB 需求,我们决定在此基础上进行技术升级,尝试在手机钉钉终端开发一款地下市政智能助手。该项目历时半年,作为技术负责人主导了从需求分析到最终上线的全过程,期间积累了大量关于大模型落地应用的实践经验与教训。
本文总结了基于大模型构建地下市政智能助手的项目实战经验。项目涵盖团队配置、需求分析、数据优化、技术方案(问题感知、路由、Text-to-SQL)、测试评估及风险控制。重点探讨了 Text-to-SQL 与 Text-to-API 的技术路线选择,分析了幻觉、语义模糊、限流等模型原生局限及应对策略。文章强调需求边界的明确、数据 Schema 的精简优化、Prompt 工程的细节调整以及人机协同的重要性,为同类大模型落地项目提供参考。

年初,随着人工智能技术的迅猛发展,企业对于智能化应用的需求日益增长。基于现有的地下市政系统 WEB 需求,我们决定在此基础上进行技术升级,尝试在手机钉钉终端开发一款地下市政智能助手。该项目历时半年,作为技术负责人主导了从需求分析到最终上线的全过程,期间积累了大量关于大模型落地应用的实践经验与教训。
为确保项目高效推进,团队采用了精简高效的配置模式:
在启动大模型项目前,必须明确需求的必要性与边界,避免盲目跟风。
并非所有场景都适合引入大模型。需充分论证是否真的需要智能终端助手,确保是为了解决实际问题而非为了'智能'而'智能'。只有当传统规则引擎无法满足灵活查询或理解需求时,才考虑引入大模型方案。
与传统 WEB 开发不同,智能助手的需求边界更为模糊。传统开发只需按固定流程展示功能,而智能助手需处理灵活、抽象的用户提问。例如,用户可能询问'某些数据的分布概况',这需要系统具备语义理解能力,而非简单的关键词匹配。
由于大模型内容输出形式相对单一且生成速度较慢,交互设计至关重要。需明确 UI 如何呈现流式输出、如何处理加载状态以及如何引导用户修正问题,以提升用户体验。
需明确谁在用、何时用、怎么用。例如,一线巡检人员可能在现场通过语音快速查询管线信息,而管理人员可能在办公室进行复杂的数据统计。特殊需求如离线环境支持、数据安全合规等也需在早期确认。
在需求评审阶段,必须评估甲方对大模型理念的接受度、部署环境的兼容性以及数据安全性。任何一项未达标都可能导致项目不可行。
一切以生成准确的 SQL 为目标,数据层面的优化直接决定了系统的表现。
根据实际业务需求,剔除长期未被使用的冗余表字段。这不仅能减少 Prompt 的长度,降低 Token 消耗,还能提升大模型的推理速度和准确率。
数据库中应统一单位(如长度、面积),方便后期编写 SQL 更加简洁。同时,对字段定义进行标准化,增强区分度,便于大模型准确理解。例如,将'地铁区间'和'地铁站'的字段定义做明显区分,避免混淆。
针对单表大规模数据,需提前建立索引或采用分库分表策略,提升 SQL 查询或统计速度。此外,表之间的关联关系要清晰,避免多表 Join 时的歧义。
在前期制作样本的过程中,需求可能会反复变动。必须确保需求变更信息与数据团队实时同步,否则样本质量将无法保证,直接影响模型训练效果。
由于涉及多轮对话,上下文理解是基础。这一步通常由大模型完成,用于判断用户当前问题的意图,并维护对话状态。我们使用了通义千问接口进行意图识别。
不同的问题需要调用不同的工具或模块。由于工具数量众多,无法全部塞入 Prompt,因此需要设计路由策略。通过分类模型或大模型自身的能力,将问题分发到最合适的处理链路,平衡速度与准确率。
本项目结合了两种技术路线:
使用开源框架往往效果不佳,需自行调整以下环节:
尽管采取了上述措施,仍面临以下挑战:
测试是大模型项目中耗时耗力的重头戏。
生成的 SQL 往往格式混乱,需从技术层面规避语法错误,但仍需与基准 SQL 进行比对。这是一个工程化难题,需要构建自动化测试脚本。
测试指标需明确,主要关注准确率和响应速度。准确率包括 SQL 执行结果的正确性以及自然语言回答的相关性。
测试结果需标注详细的标签或备注,便于开发人员定位问题。建立持续迭代机制,基于反馈不断优化 Prompt 和模型参数。
反复测试会消耗大量大模型接口调用成本,需在测试覆盖率与成本之间找到平衡点。
大模型存在技术原理决定的局限性,难以完全规避。
在落地过程中,数据安全与合规性是重中之重。
大模型技术在市政管理领域的应用仍处于探索阶段。通过本次项目,我们验证了 Txt2Sql 在特定场景下的可行性,同时也深刻认识到其在稳定性、准确性和成本控制方面的挑战。未来的方向在于结合垂直领域的知识库,进一步优化 RAG 检索精度,并探索多模态交互的可能性,以实现真正的高效辅助。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online