IDS-Agent:一种用于物联网可解释入侵检测的大模型 Agent
一、引言
物联网(IoT)中不断出现的新型威胁正在加速入侵检测系统(IDS)的发展,其检测方法已从传统的基于攻击特征或异常检测,转向基于机器学习(ML)的方案。然而,现有的基于机器学习的 IDS 通常缺乏结果解释能力,并且由于输出标签空间固定,难以有效应对零日攻击。为此,本文提出 IDS-Agent,这是首个由大语言模型(LLM)驱动的人工智能入侵检测智能体系统。
在每次接收到用户的检测请求及对应的网络流量输入后,IDS-Agent 不仅能判断该流量是正常还是遭受攻击,还能生成检测结果的解释说明。系统的核心流程包括 LLM 基于观察信息进行多轮推理,并据此生成检测相关的动作。IDS-Agent 的动作空间涵盖数据提取与预处理、分类、知识与记忆检索以及结果聚合等功能,这些操作通过一系列专门用于入侵检测的工具执行。
此外,IDS-Agent 配备了记忆与知识库,用以保留当前及以往会话信息,以及与 IDS 相关的文档资料,从而增强其推理与行动生成能力。系统提示(system prompts)可以灵活定制,以调整检测灵敏度或识别此前未知的攻击类型。实验结果表明,IDS-Agent 相较于现有的 ML 型 IDS 和基于 LLM 提示工程的 IDS,展现出更强的检测性能。
在 ACI-IoT 和 CIC-IoT 数据集上,IDS-Agent 分别达到了 0.97 与 0.75 的检测 F1 值;在零日攻击检测中,召回率达到 0.61,优于此前专为该任务设计的方法。
二、论文概述
1. 整体框架
本文的核心工作是提出 IDS-Agent,一个首创性的、基于大语言模型(LLM)的智能入侵检测系统(Intrusion Detection Agent)。该系统面向物联网(IoT)环境设计,旨在解决传统入侵检测系统在解释性、灵活性以及未知攻击检测能力方面的不足。作者将 LLM 的推理能力、工具调用机制与知识增强(Retrieval-Augmented Generation, RAG)思想结合,使 IDS-Agent 能够像人类安全分析师一样进行多阶段思考与行动。
IDS-Agent 的整体设计理念是将入侵检测过程转化为一个由 LLM 主导的动态推理与执行流程。系统以用户检测请求和网络流量数据为输入,通过迭代推理(reasoning)、行动生成(action generation)和观察更新(observation update)三个阶段循环运行,直至得到最终的检测结果及其解释。
每一轮循环中,核心 LLM 会结合当前观察、历史记忆和知识检索结果,判断下一步应采取的动作。例如,当多个分类器给出冲突结果时,LLM 会主动调用'知识检索'模块,从外部数据库或论文资料中获取关于该攻击类型的背景信息,并据此推理最终结论。
2. 具体描述
与传统基于机器学习的 IDS 不同,IDS-Agent 不是一个单一分类模型,而是一个能够调用多种工具的'智能协调体'。论文将其工作流程概括为'Reasoning-Followed-by-Action Pipeline',即'推理驱动的动作管线'。系统内置多个功能模块:
- 数据提取(Data Extraction):从原始流量数据中提取结构化特征;
- 预处理(Preprocessing):对数据进行清洗、标准化与编码;
- 分类(Classification):调用多个机器学习模型(如 RF、SVM、MLP 等)对流量进行判别,并输出置信度;
- 知识检索(Knowledge Retrieval):通过搜索引擎或知识库查找与预测攻击相关的外部信息;
- 记忆调用(Memory Retrieval):利用历史正确决策样本(长期记忆)进行类比推理;
- 聚合(Aggregation):通过 LLM 对所有分类与知识结果进行整合、解释并输出最终结论。
这种模块化的设计使 IDS-Agent 具备极高的灵活性与可扩展性。用户可随时新增分类器或外部知识源,而无需重新训练核心模型。这一特性使系统能快速适应新的攻击类型或网络环境变化,尤其适合 IoT 这种多样性高、攻击频繁的场景。
除了功能结构上的创新,作者还在交互与可控性方面进行了扩展。通过修改系统提示词(system prompt),安全分析人员可以调整检测敏感度,从而在不同场景下平衡误报率(False Alarm Rate)与漏报率(Missed Detection Rate)。论文在实验中设置了'激进(Aggressive)'、'平衡(Balanced)'与'保守(Conservative)'三种模式,验证 IDS-Agent 能够根据指令自动调整判断阈值与输出倾向。


