FPGA实现任意角度图像旋转_(图像旋转原理部分)

1.摘要

        书接上回,介绍完Cordic原理部分FPGA实现任意角度图像旋转_(Cordic算法原理部分),和代码FPGA实现任意角度图像旋转_(Cordic算法代码部分),得到了至关重要的正余弦数值就可以进行旋转公式的计算了。

       旋转没什么太多原理,看了很多资料感觉是描述的非常复杂, 其实本质就是实现两个公式,非整那么多花里胡哨的。所以我就按照我当时的编写思路记录一下。

2.图像旋转代码设计思路

        2.1 旋转后的图像尺寸

                在一副图像经过旋转后,原本像素的位置肯定会发生变化,图像总的面积虽然保持不变但是各别位置的尺寸会改变,这个应该很好理解。比如一副100x100像素的图像进行旋转,我们只需要获得它的最长距离也就是对角线的尺寸作为旋转后的图像的显示范围。这样无论怎样旋转都能完整显示图像。

                如下代码,Pixel_X和Pixel_Y为旋转后图像的尺寸。ROW和COL为原始图像尺寸,利用勾股定理求出对角线的值即可。

reg [12:0] row_size ; reg [12:0] col_size ; assign Pixel_X = row_size ; assign Pixel_Y = col_size ; wire [31:0] cosout_abs = (cosout[31]) ? -cosout : cosout; wire [31:0] sinout_abs = (sinout[31]) ? -sinout : sinout; always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) begin row_size <= 'd0 ; col_size <= 'd0 ; end else begin // h --> row // w --> col row_size <= (ROW*cosout_abs + COL*sinout_abs) >>14 ; // h col_size <= (COL*cosout_abs + ROW*sinout_abs) >>14 ; // w end end 

        2.2 旋转后图像的有效位置

                这个旋转后的有效位置可以自由设定,我设定的屏幕中心处的位置。具体设计如下:

       我用的是一块480*272的lcd屏幕,具体时序网上很多,我用的是野火的。

                data_req可以这样理解,以480*272的屏幕中点位置为旋转后图像的中点位置,后面的-5就是看用了几级流水线就减几,只要对齐就好。

//parameter define localparam H_SYNC = 11'd41 , //行同步 H_BACK = 11'd2 , //行时序后沿 H_LEFT = 11'd0 , //行时序左边框 H_VALID = 11'd480 , //行有效数据 H_RIGHT = 11'd0 , //行时序右边框 H_FRONT = 11'd2 , //行时序前沿 H_TOTAL = 11'd525 ; //行扫描周期 localparam V_SYNC = 11'd10 , //场同步 V_BACK = 11'd2 , //场时序后沿 V_TOP = 11'd0 , //场时序左边框 V_VALID = 11'd272 , //场有效数据 V_BOTTOM = 11'd0 , //场时序右边框 V_FRONT = 11'd2 , //场时序前沿 V_TOTAL = 11'd286 ; //场扫描周期 //cnt_h:行扫描计数器 //cnt_v:场扫描计数器 //data_req:数据请求信号 wire data_req = (((cnt_h >= (((H_VALID - Pixel_X)>>1) + H_SYNC + H_BACK - 'd5)) && (cnt_h < (((H_VALID - Pixel_X)>>1) + Pixel_X + H_SYNC + H_BACK - 'd5))) &&((cnt_v >= ((V_VALID - Pixel_Y)>>1) + V_SYNC + V_BACK - 'd5) && ((cnt_v < (((V_VALID - Pixel_Y)>>1) + Pixel_Y + V_SYNC + V_BACK - 'd5))))); 

        2.3 第一级流水线

                没啥好说的么就是在图像有效信号有效时进行行场计数,基本操作。

always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) r_rotate_valid <= 1'b0 ; else r_rotate_valid <= data_req ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) r_rotate_end <= 'd0 ; else if (r_rotate_valid && (vcnt == row_abs - 1) && (hcnt == col_abs - 2)) r_rotate_end <= 'd1 ; else r_rotate_end <= 'd0 ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) hcnt <= 'd0 ; else if (r_rotate_valid && (r_rotate_end || (hcnt == col_abs - 1))) hcnt <= 'd0 ; else if (r_rotate_valid) hcnt <= hcnt + 'd1 ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) vcnt <= 'd0 ; else if (r_rotate_valid && r_rotate_end) vcnt <= 'd0 ; else if (r_rotate_valid && (hcnt == col_abs - 1)) vcnt <= vcnt + 'd1 ; end 

        2.4 第二级流水

                这里开始计算图像旋转公式了,具体可以看上一篇。

以中心点为起始坐标,相当于坐标系的(0,0)点,这样四个象限的所有坐标点都可以表示出来了。并且按照上图的公式组合起来即可,最终右移14位。        

reg signed [12:0] x_cos ; reg signed [12:0] y_sin ; reg signed [12:0] y_cos ; reg signed [12:0] x_sin ; assign row_abs = row_size; assign col_abs = col_size; // 得到旋转后图片的中点 assign row1 = row_abs >> 1 ; assign col1 = col_abs >> 1 ; always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) x_cos <= 'd0 ; else if(r_rotate_valid_1d) x_cos <= ((hcnt - col1 ) * cosout) >>>14; else x_cos <= x_cos ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) y_sin <= 'd0 ; else if(r_rotate_valid_1d) y_sin <= ((vcnt-row1 ) * sinout) >>>14; else y_sin <= y_sin ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) y_cos <= 'd0 ; else if(r_rotate_valid_1d) y_cos <= ((vcnt - row1 ) * cosout) >>>14; else y_cos <= y_cos ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) x_sin <= 'd0 ; else if(r_rotate_valid_1d) x_sin <= ((hcnt - col1 ) * sinout) >>>14; else x_sin <= x_sin ; end 

        2.3 第三级流水

                同样的,按照2.2图的公式进行排列组合得出旋转后图像映射到原始图像的坐标位置。在这里有几个可能不好理解的地方:原始屏幕坐标(hcnt, vcnt)转换到中心坐标系(减去COL/2和ROW/2)->中心坐标(hcnt - COL/2, vcnt - ROW/2) ->应用旋转公式->旋转后的中心坐标 ->转换回屏幕坐标系(加上COL/2和ROW/2)。

always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) r_rotate_valid_2d <= 'd0 ; else r_rotate_valid_2d <= r_rotate_valid_1d ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) hcnt_rotate <= 'd0 ; else if(r_rotate_valid_2d==1'b1) hcnt_rotate <= x_cos - y_sin + (COL>>1 ) ; else hcnt_rotate <= 'd0 ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) vcnt_rotate <= 'd0 ; else if(r_rotate_valid_2d==1'b1) vcnt_rotate <= y_cos + x_sin + (ROW>>1) ; else vcnt_rotate <= 'd0 ; end

       2.4 第四级流水线

  • hcnt_rotate在0到COL-1之间(在原图像列范围内)
  • vcnt_rotate在0到ROW-1之间(在原图像行范围内)
  • 已读取的像素数小于图像总像素数(ROW*COL)
  • 每行有COL个像素,所以第vcnt_rotate行的起始地址是COL*vcnt_rotate
  • 再加上该行内的列偏移hcnt_rotate

data_cnt计数器用于限制读取的像素总数不超过原图像的总像素数(ROW*COL)。这是为了防止地址溢出或重复读取。最后机上一个ROM IP核,里面存放着预先处理好的100*100大小的图像数据,生成地址和使能信号读就可以了。ROM读出数据是延迟一个时钟,所以第五级流水就是为了对齐而已。

always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) r_rotate_valid_3d <= 'd0 ; else r_rotate_valid_3d <= r_rotate_valid_2d ; end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) begin rden <= 'd0 ; addra <= 'd0 ; end else if(r_rotate_valid_3d==1'b1) begin if((hcnt_rotate>='d0)&&(hcnt_rotate<COL)&&(vcnt_rotate>='d0)&&(vcnt_rotate<ROW)&&data_cnt<ROW*COL) begin // start_dly3 rden <= 1'b1 ; addra<= COL*vcnt_rotate + hcnt_rotate ; end else begin rden <= 1'b0 ; addra<= 'd0 ; end end else begin rden <= 'd0 ; addra <= 'd0 ; end end always @(posedge clk_i, negedge rstn_i) begin if (!rstn_i) data_cnt <= 'd0 ; else if (data_cnt == ROW*COL - 1) data_cnt <= 'd0 ; else if (r_rotate_valid_3d && (hcnt_rotate>='d0)&&(hcnt_rotate<COL)&&(vcnt_rotate>='d0)&&(vcnt_rotate<ROW)) data_cnt <= data_cnt + 'd1 ; end img_mem_gen img_mem_gen_inst ( .address ( addra ), .clock ( clk_i ), .rden ( rden ), .q ( rom_data ) );

3.仿真结果

30°旋转

图片横着看,逆时钟旋转30°的。

-30°

228°

问题不大,任意角度,任意方向,其它的我就不列举了。

4. 结语

        声明一下,采用的开发板是野火征途pro,屏幕也是,lcd显示例程也是他们家的,我在基础上改的。旋转的代码是自己写的,代码肯定是有bug的,后续真正应用到项目肯定是要修改的,这里只是记录一下,感兴趣的可以借鉴一下,有问题的也可以提出我在改。目前总的来看功能是正常的,时序啥的,代码架构我都没搞,语法优化也是随便写的,是草稿版本。

        代码放在下一节。

Read more

解密xxxxxl19d18–19:AI如何自动生成复杂代码结构

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 点击'项目生成'按钮,等待项目生成完整后预览效果 输入框内输入如下内容: 请基于xxxxxl19d18–19这类编码规范,创建一个Python项目框架,要求包含:1.自动生成符合该规范的类结构 2.实现基础CRUD功能 3.集成数据验证模块 4.添加日志记录功能 5.生成API文档框架。使用FastAPI作为后端框架,MongoDB作为数据库,确保代码符合PEP8规范。 最近在开发一个Python项目时,遇到了一个特殊的编码规范要求:xxxxxl19d18–19。这种命名方式看起来有点神秘,但其实它是一种特殊的代码标识规范,用于标识项目中的不同模块和功能。为了快速满足这个需求,我尝试使用了InsCode(快马)平台的AI辅助开发功能,结果让我非常惊喜。 1. 理解xxxxxl19d18–19规范

程序员转行学习AI大模型:位置编码

原理 在前面编码器-解码器介绍中,我们发现,模型并没有记录时序相关信息,即没有感知不同词汇的位置顺序。这会引起一个问题,针对“我喜欢你”这句话,经过前面的 Embedding 处理后,再进入编码器-解码器处理,最后生成的内容,是和输入“你喜欢我”最后生成的内容是一样的,但我们知道,这两句是含义完全不一样的语句。 加入位置编码,可以解决这个问题。位置编码,通过给每个位置添加一个向量,这个向量包含了位置信息,然后把这个向量加到词汇向量上。 例如: 位置1向量:[0.1,0.2,0.3,...] 位置2向量:[0.4,0.5,0.6,...] 位置3向量:[0.7,0.8,0.9,...] “我喜欢你”,添加位置编码后: “我”

2026年最新全球AI大模型深度研究报告

2026年最新全球AI大模型深度研究报告 文章目录 * 2026年最新全球AI大模型深度研究报告 * 摘要 * 第一章 全球AI大模型发展概况 * 1.1 全球AI发展格局:中美双极引领 * 1.2 市场规模与增长趋势 * 1.3 发展阶段特征 * 第二章 核心技术突破分析 * 2.1 主流大模型最新进展 * 2.1.1 美国阵营 * 2.1.2 中国阵营 * 2.2 核心技术突破方向 * 2.2.1 多模态能力 * 2.2.2 长上下文处理 * 2.2.3 推理能力 * 2.2.4 Agent能力 * 2.2.

2026年03月16日全球AI前沿动态

摘要 本文献汇总2026年3月15日AI技术核心动态,聚焦AI Agent(智能代理)、大语言模型(LLM)优化、多模态技术、工具链生态四大核心领域。其中AI Agent相关项目与技能占比超30%,LLM模型迭代聚焦长上下文、多模态融合与效率优化,多模态技术以音视频生成与理解为突破点,工具链围绕开发效率、安全可控构建生态。整体呈现“技术闭环加速、场景落地深化、安全合规凸显”的发展态势,大公司与开源社区双轮驱动,Agent化、模块化、多模态成为技术演进的核心锚点。 总结与洞察 核心主线是什么? “工欲善其事,必先利其器”,本次技术汇总的核心主线是AI Agent的规模化落地与技术栈完善。从基础层的上下文数据库(如OpenViking)、高效模型(如Qwen3.5系列、NVIDIA Nemotron-3 Super),到工具层的浏览器自动化(Lightpanda)、后端开发平台(InsForge),再到应用层的群体智能预测(MiroFish)、代码生成(OmniCoder-9B),形成了“模型-工具-场景”