NLP 的LSTM长短期记忆 5 NLP 零到英雄 Long Short-Term Memory for NLP











参考
https://youtu.be/A9QVYOBjZdY











https://youtu.be/A9QVYOBjZdY
zeeklog
zeeklog
zeeklog
目录 前言 一、TCU模块框图 二、WMMA代码分析 2.1 WMMA矩阵分块 2.2 WMMA矩阵地址偏移计算 2.2.1 WMMA matrixA 2.2.2 WMMA matrixB 2.2.3 WMMA matrixC 2.2.4 tcu_int WMMA源代码 总结 前言 本篇分析Vortex矩阵计算的核心模块TCU WMMA。 前文:探索Vortex开源GPGPU:RISC-V SIMT架构(4-2),TCU 矩阵计算(1)https://blog.ZEEKLOG.net/weixin_