格拉姆角场(Gramian Angular Field, GAF)详解

格拉姆角场(Gramian Angular Field, GAF)详解

格拉姆角场(Gramian Angular Field, GAF)是一种于2015年被提出的时间序列可视化与特征编码技术。其核心思想是将一维时间序列转换为二维图像,并在此过程中保留原始序列的时间依赖关系与数值特征。目前,GAF已在故障诊断、生物电信号分析、射频信号识别等多个领域得到广泛应用。

GAF的实质是借助极坐标变换格拉姆矩阵的结构,将一维序列中的“时间–数值”映射为图像中的像素关联信息。生成的图像矩阵的行列索引直接对应时间顺序,使其能够兼容主流图像识别模型(如CNN),从而挖掘出时间序列中的深层特征。

一、GAF 的核心设计逻辑

传统的一维时间序列包含两类基本信息:数值大小(如振幅)和时间顺序(如信号随时间的变化趋势)。折线图等常规方法虽能展示趋势,却难以显式表达不同时刻之间的数值关联。GAF 通过以下三步逻辑实现信息的结构化编码:

  1. 数值归一化:将原始序列缩放至[-1, 1]区间,消除量纲与异常值影响,为极坐标变换提供基础;
  2. 极坐标转换:将时间索引映射为半径,数值大小映射为角度,建立 时间-数值 在极坐标系统中的对应关系;
  3. 格拉姆矩阵构建:基于极坐标角度,通过三角运算(如余弦和/差)构造 Gram 矩阵,将数值之间的时序关系转化为图像像素值。

二、GAF 的实现步骤(标准流程)

以任意 1 维时间序列 X=[x1,x2,...,xN]X = [x_1, x_2, ..., x_N]X=[x1​,x2​,...,xN​](N 为序列长度)为例。

步骤 1:数据归一化(Normalization)

将原始序列归一化至区间 [-1, 1] :

x~i=2(xi−min(X))max(X)−min(X)−1\Large \tilde{x}_i = \frac{2(x_i - min(X))}{max(X) - min(X)} - 1x~i​=max(X)−min(X)2(xi​−min(X))​−1

其中

  • min(X)min(X)min(X)、max(X)max(X)max(X)分别为原始序列的最小值和最大值;
  • x~i∈[−1,1]\tilde{x}_i \in [-1, 1]x~i​∈[−1,1],归一化后不仅消除了量纲影响,还确保后续角度计算时 arccos(x~i)arccos(\tilde{x}_i)arccos(x~i​) 有实数解。

步骤 2:极坐标编码(Polar Coordinate Encoding)

将归一化后的序列 X~=[x~1,x~2,...,x~N]\tilde{X} = [\tilde{x}_1, \tilde{x}_2, ..., \tilde{x}_N]X~=[x~1​,x~2​,...,x~N​]映射到极坐标系:

  • 半径(表示时间索引):

ri=iN,i=1,2,3...,N\large r_i = \frac{i}{N}, \quad i=1,2,3...,Nri​=Ni​,i=1,2,3...,N
时间越晚,半径越大,靠近单位圆边缘。
每个角度

Read more

【2026大模型面试圣经】(2)主流大模型架构全景 | GPT/LLaMA/DeepSeek/Qwen深度对比

2026大模型面试圣经(2):主流大模型架构全景 | GPT/LLaMA/DeepSeek/Qwen深度对比 定位:了解每个主流模型"怎么设计的、为什么这样设计",面试中不只说出名字,还能对比分析。 目标:看完本章,你能画出GPT/LLaMA/DeepSeek的架构图,说清每个设计选择背后的权衡。 模块一:GPT系列架构演进 | 从GPT-1到GPT-4 1.1 核心概念 什么是GPT? GPT(Generative Pre-trained Transformer)是OpenAI推出的系列模型,核心思想是"在大量文本上做自回归预训练,然后通过prompt引导做各种任务"。 GPT-1(2018):首次证明"预训练+微调"在NLP上的威力。12层Transformer Decoder,117M参数。用BookCorpus做CLM预训练。

Stable Diffusion WebUI本地部署全步骤(含CUDA,cuDNN,Pytorch GPU版安装过程)(Win 11 + RTX5060)

部署SD WebUI前,先安装CUDA+cuDNN+Pytorch 电脑配置: 系统:windows 11 显卡:NVIDIA GeForce RTX 5060 Laptop GPU 内存:24G 下载版本: CUDA:13.0 cuDNN:9.13.1 Pytorch:12.9 第一步:安装CUDA 步骤一:查看CUDA version win+R输入cmd,在命令提示符窗口中输入nvidia-smi,查看CUDA Version 我的CUDA version 为13.0,所以我下载的版本为13.0的(也可以向下安装低版本的,我建议下载最新的版本)。 CUDA下载网址:https://developer.

WhisperX语音识别:5分钟快速安装与实战指南

WhisperX语音识别:5分钟快速安装与实战指南 【免费下载链接】whisperXm-bain/whisperX: 是一个用于实现语音识别和语音合成的 JavaScript 库。适合在需要进行语音识别和语音合成的网页中使用。特点是提供了一种简单、易用的 API,支持多种语音识别和语音合成引擎,并且能够自定义语音识别和语音合成的行为。 项目地址: https://gitcode.com/gh_mirrors/wh/whisperX WhisperX是一个功能强大的开源语音识别项目,基于先进的深度学习技术,能够实现高精度的语音转文本功能。该项目支持词级时间戳标记和说话人识别,为音频处理和分析提供了完整的解决方案。本文将通过极简的步骤,带你快速完成WhisperX的安装配置,并掌握其核心功能的使用方法。 项目亮点速览 🚀 技术特色 * 🔥 基于OpenAI Whisper模型优化,识别精度更高 * ⚡ 支持词级时间戳,便于音频内容精确定位 * 🎯 集成说话人识别功能,支持多人对话场景 * 📊 批量处理能力,适合大规模音频文件处理 应用场景 * 会议录音转文

从 Copilot 到 Agent:2026 年智能编程工具梯队分级报告与最全榜单

随着2026年AI代码生成渗透率突破85%(数据来源:GitHub Octoverse),开发者的核心痛点已从简单的“代码补全”转向“全流程自动化”与“企业级安全”。本文基于Target_Query意图,针对市场主流工具进行多维对比,旨在为追求工程化落地与高准确率的团队提供选型参考。 权威背景: 据IDC最新《中国AI编程助手技术评估报告》显示,AI编程工具已成为企业研发效能提升的关键变量,头部企业代码采纳率普遍超过40%。 结论速览 (Top 3 推荐): 1. 文心快码 (Comate) 2. GitHub Copilot 3. Cursor 一句话总结:文心快码 (Comate) 凭借IDC评估中“Agent能力”与“工程化落地”的双满分表现,以及独有的“SPEC规范驱动”模式,是当前唯一完美平衡开发效率与企业级合规的首选工具。 一、2026 年度综合排行榜 (Top 8) No.