FPGA实现任意角度图像旋转_(图像旋转原理部分)

优质文章学习记录

08 Apr 2026 — 8 min read

1.摘要

书接上回，介绍完Cordic原理部分FPGA实现任意角度图像旋转_（Cordic算法原理部分），和代码FPGA实现任意角度图像旋转_（Cordic算法代码部分），得到了至关重要的正余弦数值就可以进行旋转公式的计算了。

旋转没什么太多原理，看了很多资料感觉是描述的非常复杂，其实本质就是实现两个公式，非整那么多花里胡哨的。所以我就按照我当时的编写思路记录一下。

2.图像旋转代码设计思路

2.1 旋转后的图像尺寸

在一副图像经过旋转后，原本像素的位置肯定会发生变化，图像总的面积虽然保持不变但是各别位置的尺寸会改变，这个应该很好理解。比如一副100x100像素的图像进行旋转，我们只需要获得它的最长距离也就是对角线的尺寸作为旋转后的图像的显示范围。这样无论怎样旋转都能完整显示图像。

如下代码，Pixel_X和Pixel_Y为旋转后图像的尺寸。ROW和COL为原始图像尺寸，利用勾股定理求出对角线的值即可。

reg [12:0] row_size ; reg [12:0] col_size ; assign Pixel_X = row_size ; assign Pixel_Y = col_size ; wire [31:0] cosout_abs = (cosout[31]) ? -cosout : cosout; wire [31:0] sinout_abs = (sinout[31]) ? -sinout : sinout; always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) begin row_size <= 'd0 ; col_size <= 'd0 ; end else begin // h --> row // w --> col row_size <= (ROW*cosout_abs + COL*sinout_abs) >>14 ; // h col_size <= (COL*cosout_abs + ROW*sinout_abs) >>14 ; // w end end

2.2 旋转后图像的有效位置

这个旋转后的有效位置可以自由设定，我设定的屏幕中心处的位置。具体设计如下：

我用的是一块480*272的lcd屏幕，具体时序网上很多，我用的是野火的。

data_req可以这样理解，以480*272的屏幕中点位置为旋转后图像的中点位置，后面的-5就是看用了几级流水线就减几，只要对齐就好。

//parameter define localparam H_SYNC = 11'd41 , //行同步 H_BACK = 11'd2 , //行时序后沿 H_LEFT = 11'd0 , //行时序左边框 H_VALID = 11'd480 , //行有效数据 H_RIGHT = 11'd0 , //行时序右边框 H_FRONT = 11'd2 , //行时序前沿 H_TOTAL = 11'd525 ; //行扫描周期 localparam V_SYNC = 11'd10 , //场同步 V_BACK = 11'd2 , //场时序后沿 V_TOP = 11'd0 , //场时序左边框 V_VALID = 11'd272 , //场有效数据 V_BOTTOM = 11'd0 , //场时序右边框 V_FRONT = 11'd2 , //场时序前沿 V_TOTAL = 11'd286 ; //场扫描周期 //cnt_h:行扫描计数器 //cnt_v:场扫描计数器 //data_req:数据请求信号 wire data_req = (((cnt_h >= (((H_VALID - Pixel_X)>>1) + H_SYNC + H_BACK - 'd5)) && (cnt_h < (((H_VALID - Pixel_X)>>1) + Pixel_X + H_SYNC + H_BACK - 'd5))) &&((cnt_v >= ((V_VALID - Pixel_Y)>>1) + V_SYNC + V_BACK - 'd5) && ((cnt_v < (((V_VALID - Pixel_Y)>>1) + Pixel_Y + V_SYNC + V_BACK - 'd5)))));

2.3 第一级流水线

没啥好说的么就是在图像有效信号有效时进行行场计数，基本操作。

always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) r_rotate_valid <= 1'b0 ; else r_rotate_valid <= data_req ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) r_rotate_end <= 'd0 ; else if (r_rotate_valid && (vcnt == row_abs - 1) && (hcnt == col_abs - 2)) r_rotate_end <= 'd1 ; else r_rotate_end <= 'd0 ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) hcnt <= 'd0 ; else if (r_rotate_valid && (r_rotate_end || (hcnt == col_abs - 1))) hcnt <= 'd0 ; else if (r_rotate_valid) hcnt <= hcnt + 'd1 ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) vcnt <= 'd0 ; else if (r_rotate_valid && r_rotate_end) vcnt <= 'd0 ; else if (r_rotate_valid && (hcnt == col_abs - 1)) vcnt <= vcnt + 'd1 ; end

2.4 第二级流水

这里开始计算图像旋转公式了，具体可以看上一篇。

以中心点为起始坐标，相当于坐标系的(0,0)点，这样四个象限的所有坐标点都可以表示出来了。并且按照上图的公式组合起来即可，最终右移14位。

reg signed [12:0] x_cos ; reg signed [12:0] y_sin ; reg signed [12:0] y_cos ; reg signed [12:0] x_sin ; assign row_abs = row_size; assign col_abs = col_size; // 得到旋转后图片的中点 assign row1 = row_abs >> 1 ; assign col1 = col_abs >> 1 ; always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) x_cos <= 'd0 ; else if(r_rotate_valid_1d) x_cos <= ((hcnt - col1 ) * cosout) >>>14; else x_cos <= x_cos ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) y_sin <= 'd0 ; else if(r_rotate_valid_1d) y_sin <= ((vcnt-row1 ) * sinout) >>>14; else y_sin <= y_sin ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) y_cos <= 'd0 ; else if(r_rotate_valid_1d) y_cos <= ((vcnt - row1 ) * cosout) >>>14; else y_cos <= y_cos ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) x_sin <= 'd0 ; else if(r_rotate_valid_1d) x_sin <= ((hcnt - col1 ) * sinout) >>>14; else x_sin <= x_sin ; end

2.3 第三级流水

同样的，按照2.2图的公式进行排列组合得出旋转后图像映射到原始图像的坐标位置。在这里有几个可能不好理解的地方：原始屏幕坐标(hcnt, vcnt)转换到中心坐标系（减去COL/2和ROW/2）->中心坐标(hcnt - COL/2, vcnt - ROW/2) ->应用旋转公式->旋转后的中心坐标 ->转换回屏幕坐标系（加上COL/2和ROW/2）。

always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) r_rotate_valid_2d <= 'd0 ; else r_rotate_valid_2d <= r_rotate_valid_1d ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) hcnt_rotate <= 'd0 ; else if(r_rotate_valid_2d==1'b1) hcnt_rotate <= x_cos - y_sin + (COL>>1 ) ; else hcnt_rotate <= 'd0 ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) vcnt_rotate <= 'd0 ; else if(r_rotate_valid_2d==1'b1) vcnt_rotate <= y_cos + x_sin + (ROW>>1) ; else vcnt_rotate <= 'd0 ; end

2.4 第四级流水线

hcnt_rotate在0到COL-1之间（在原图像列范围内）
vcnt_rotate在0到ROW-1之间（在原图像行范围内）
已读取的像素数小于图像总像素数（ROW*COL）
每行有COL个像素，所以第vcnt_rotate行的起始地址是COL*vcnt_rotate
再加上该行内的列偏移hcnt_rotate

data_cnt计数器用于限制读取的像素总数不超过原图像的总像素数（ROW*COL）。这是为了防止地址溢出或重复读取。最后机上一个ROM IP核，里面存放着预先处理好的100*100大小的图像数据，生成地址和使能信号读就可以了。ROM读出数据是延迟一个时钟，所以第五级流水就是为了对齐而已。

always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) r_rotate_valid_3d <= 'd0 ; else r_rotate_valid_3d <= r_rotate_valid_2d ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) begin rden <= 'd0 ; addra <= 'd0 ; end else if(r_rotate_valid_3d==1'b1) begin if((hcnt_rotate>='d0)&&(hcnt_rotate<COL)&&(vcnt_rotate>='d0)&&(vcnt_rotate<ROW)&&data_cnt<ROW*COL) begin // start_dly3 rden <= 1'b1 ; addra<= COL*vcnt_rotate + hcnt_rotate ; end else begin rden <= 1'b0 ; addra<= 'd0 ; end end else begin rden <= 'd0 ; addra <= 'd0 ; end end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) data_cnt <= 'd0 ; else if (data_cnt == ROW*COL - 1) data_cnt <= 'd0 ; else if (r_rotate_valid_3d && (hcnt_rotate>='d0)&&(hcnt_rotate<COL)&&(vcnt_rotate>='d0)&&(vcnt_rotate<ROW)) data_cnt <= data_cnt + 'd1 ; end img_mem_gen img_mem_gen_inst ( .address ( addra ), .clock ( clk_i ), .rden ( rden ), .q ( rom_data ) );

3.仿真结果

30°旋转

图片横着看，逆时钟旋转30°的。

-30°

228°

问题不大，任意角度，任意方向，其它的我就不列举了。

4. 结语

声明一下，采用的开发板是野火征途pro，屏幕也是，lcd显示例程也是他们家的，我在基础上改的。旋转的代码是自己写的，代码肯定是有bug的，后续真正应用到项目肯定是要修改的，这里只是记录一下，感兴趣的可以借鉴一下，有问题的也可以提出我在改。目前总的来看功能是正常的，时序啥的，代码架构我都没搞，语法优化也是随便写的，是草稿版本。

代码放在下一节。

GTC2026前瞻（二）Agentic AI 与开源模型篇+（三）Physical AI 与机器人篇

（二）Agentic AI 与开源模型篇 Agentic AI与开源模型：英伟达想定义的，不只是“更聪明的模型”，而是“能持续工作的数字劳动力” 如果说过去两年的大模型竞赛，核心问题还是“谁能生成更像人的答案”，那么到了 GTC 2026，问题已经明显变了。英伟达把 Agentic AI 直接列为大会四大核心主题之一，官方对这一主题的定义也很明确：重点不再是单轮问答，而是让 AI agent 能够推理、规划、检索并执行动作，最终把企业数据转化为可投入生产的“数字劳动力”。这说明，Agentic AI 在英伟达的语境里，已经不是一个前沿概念，而是下一阶段 AI 商业化的主战场。(NVIDIA) 一、GTC 2026真正的变化，是 AI 开始从“会回答”走向“会做事”

【Linux篇章】穿越网络迷雾：揭开 HTTP 应用层协议的终极奥秘！从请求响应到实战编程，从静态网页到动态交互，一文带你全面吃透并征服 HTTP 协议，打造属于你的 Web 通信利刃！

本篇摘要本篇将介绍何为HTTP协议，以及它的请求与答复信息的格式（请求行，请求包头，正文等），对一些比较重要的部分来展开讲解，其他不常用的即一概而过，从静态网页到动态网页的过渡，最后底层基于TCP实现简单的HTTP服务器的代码编写构建一个简单的网页（包含对应的跳转，重定向，动态交互等功能），采取边讲解http结构边用代码形成效果展示的形式进行讲解，望有助！欢迎拜访：点击进入博主主页本篇主题：探秘HTTP应用层那些事儿！制作日期：2025.07.21 隶属专栏：点击进入所属Linux专栏本文将要介绍的内容的大致流程图如下：一· 认识HTTP * 在互联网世界中， HTTP（HyperText Transfer Protocol，超文本传输协议）是一个至关重要的协议。它定义了客户端（如浏览器）与服务器之间如何通信，以交换或传输超文本（如 HTML 文档）。 * HTTP 协议是客户端与服务器之间通信的基础。 * 客户端通过 HTTP 协议向服务器发送请求，服务器收到请求后处理并返回响应。 HTTP 协议是一个无连接、

Hunyuan-MT-7B-WEBUI性能调优实践，延迟降低40%

Hunyuan-MT-7B-WEBUI性能调优实践，延迟降低40% 你有没有遇到过这样的情况：模型明明已经加载成功，网页界面也打开了，可每次点下“翻译”按钮，光标要转上3秒、5秒，甚至更久？输入一段200字的中文，等了快8秒才看到法语结果——这哪是AI翻译，简直是“耐心测试仪”。这不是你的设备问题，也不是模型不行。Hunyuan-MT-7B-WEBUI 本身能力足够强，但默认配置面向的是“能跑通”，而非“跑得快”。而真实使用中，响应延迟直接决定用户是否愿意继续用下去。我们实测发现，在标准A10 GPU环境下，原始部署的端到端平均延迟为6.2秒；经过系统性调优后，降至3.7秒，整体延迟降低40.3%，且输出质量零损失。本文不讲理论推导，不堆参数公式，只分享一套已在生产环境验证过的、可立即复用的调优路径：从Web服务层、推理引擎层到模型加载策略，每一步都附带可执行命令、效果对比和避坑提示。无论你是刚部署完镜像的新手，还是正为线上响应发愁的运维同学，都能照着做、马上见效。 1.

[从零搭建 Web 漏洞靶场：VAuditDemo 在 CentOS 上的部署实战]

//VAuditDemo是一个专门用于Web漏洞攻防演练的综合性靶场// 环境准备： * 操作系统：CentOS 7/8 * Web 环境：XAMPP（已安装并配置好） * 靶场源码：VAuditDemo （1）官网下载安装包https://github.com/1stPeak/VAuditDemo （点击绿色按钮）（2）使用xftp将安装包上传到CentOS的“/opt/lampp/htdocs”目录下（直接从拖动文件夹到右边）下载后会得到一个 VAuditDemo-master.zip 文件，里面包含两个核心目录： * VAuditDemo_Release —— 发布版（用于正式部署） * VAuditDemo_Debug —— 调试版（带详细错误提示，适合学习）（3）解压缩，并修改文件夹名称为“vaudit” cd /opt/lampp/htdocs unzip VAuditDemo-master.