IDS-Agent：基于大模型的物联网可解释入侵检测系统

IDS-Agent：一种用于物联网可解释入侵检测的大模型 Agent

一、引言

物联网（IoT）中不断出现的新型威胁正在加速入侵检测系统（IDS）的发展，其检测方法已从传统的基于攻击特征或异常检测，转向基于机器学习（ML）的方案。然而，现有的基于机器学习的 IDS 通常缺乏结果解释能力，并且由于输出标签空间固定，难以有效应对零日攻击。为此，本文提出 IDS-Agent，这是首个由大语言模型（LLM）驱动的人工智能入侵检测智能体系统。

在每次接收到用户的检测请求及对应的网络流量输入后，IDS-Agent 不仅能判断该流量是正常还是遭受攻击，还能生成检测结果的解释说明。系统的核心流程包括 LLM 基于观察信息进行多轮推理，并据此生成检测相关的动作。IDS-Agent 的动作空间涵盖数据提取与预处理、分类、知识与记忆检索以及结果聚合等功能，这些操作通过一系列专门用于入侵检测的工具执行。

此外，IDS-Agent 配备了记忆与知识库，用以保留当前及以往会话信息，以及与 IDS 相关的文档资料，从而增强其推理与行动生成能力。系统提示（system prompts）可以灵活定制，以调整检测灵敏度或识别此前未知的攻击类型。实验结果表明，IDS-Agent 相较于现有的 ML 型 IDS 和基于 LLM 提示工程的 IDS，展现出更强的检测性能。

在 ACI-IoT 和 CIC-IoT 数据集上，IDS-Agent 分别达到了 0.97 与 0.75 的检测 F1 值；在零日攻击检测中，召回率达到 0.61，优于此前专为该任务设计的方法。

二、论文概述

1. 整体框架

本文的核心工作是提出 IDS-Agent，一个首创性的、基于大语言模型（LLM）的智能入侵检测系统（Intrusion Detection Agent）。该系统面向物联网（IoT）环境设计，旨在解决传统入侵检测系统在解释性、灵活性以及未知攻击检测能力方面的不足。作者将 LLM 的推理能力、工具调用机制与知识增强（Retrieval-Augmented Generation, RAG）思想结合，使 IDS-Agent 能够像人类安全分析师一样进行多阶段思考与行动。

IDS-Agent 的整体设计理念是将入侵检测过程转化为一个由 LLM 主导的动态推理与执行流程。系统以用户检测请求和网络流量数据为输入，通过迭代推理（reasoning）、行动生成（action generation）和观察更新（observation update）三个阶段循环运行，直至得到最终的检测结果及其解释。

每一轮循环中，核心 LLM 会结合当前观察、历史记忆和知识检索结果，判断下一步应采取的动作。例如，当多个分类器给出冲突结果时，LLM 会主动调用'知识检索'模块，从外部数据库或论文资料中获取关于该攻击类型的背景信息，并据此推理最终结论。

在这里插入图片描述

2. 具体描述

与传统基于机器学习的 IDS 不同，IDS-Agent 不是一个单一分类模型，而是一个能够调用多种工具的'智能协调体'。论文将其工作流程概括为'Reasoning-Followed-by-Action Pipeline'，即'推理驱动的动作管线'。系统内置多个功能模块：

数据提取（Data Extraction）：从原始流量数据中提取结构化特征；
预处理（Preprocessing）：对数据进行清洗、标准化与编码；
分类（Classification）：调用多个机器学习模型（如 RF、SVM、MLP 等）对流量进行判别，并输出置信度；
知识检索（Knowledge Retrieval）：通过搜索引擎或知识库查找与预测攻击相关的外部信息；
记忆调用（Memory Retrieval）：利用历史正确决策样本（长期记忆）进行类比推理；
聚合（Aggregation）：通过 LLM 对所有分类与知识结果进行整合、解释并输出最终结论。

这种模块化的设计使 IDS-Agent 具备极高的灵活性与可扩展性。用户可随时新增分类器或外部知识源，而无需重新训练核心模型。这一特性使系统能快速适应新的攻击类型或网络环境变化，尤其适合 IoT 这种多样性高、攻击频繁的场景。

除了功能结构上的创新，作者还在交互与可控性方面进行了扩展。通过修改系统提示词（system prompt），安全分析人员可以调整检测敏感度，从而在不同场景下平衡误报率（False Alarm Rate）与漏报率（Missed Detection Rate）。论文在实验中设置了'激进（Aggressive）'、'平衡（Balanced）'与'保守（Conservative）'三种模式，验证 IDS-Agent 能够根据指令自动调整判断阈值与输出倾向。