利用这一事实——设计中的大部分电路都有一定的余度,不需要将所有逻辑置于高性能状态。以Stratix IV FPGA为例,它由逻辑阵列模块(LAB)、TriMatrix存储器和DSP模块构成,利用可编程功耗技术将少量的关键时序逻辑模块设置为高速模式。时序不重要的逻辑模块设置为低功耗模式,能够大大降低低功耗逻辑的泄漏功耗。而且,可编程功耗技术将没有使用的逻辑、TriMatrix存储器以及DSP模块设置为低功耗模式,进一步降低了功耗。
在任何设计中,Quartus II软件能够自动确定设计中每一通路的余量,通过调整晶体管反向偏置电压,把晶体管,同时把逻辑模块设置为合适的模式——高性能或者低功耗。例如,将Stratix IV FPGA内核的n-MOS晶体管设置为这两种模式。
采用同样的方法也能将p-MOS晶体管设置为合适的模式,从而设置LAB、TriMatrix存储器和DSP模块为高性能或者低功耗模式。这样,通过改变晶体管的电气特性,Stratix IV FPGA可编程功耗技术以高速逻辑和低功耗逻辑的最佳组合,实现了最好的性能和最低的功耗。例如,图3所示的Stratix IV EP4SE680 FPGA在85℃时的典型设计,和没有采用可编程功耗技术时相比,静态功耗降低了37%。
图3 可编程功耗技术降低了静态功耗
我们可以精确地控制一个设计达到其性能要求而需要的高速逻辑数量。在每一个逻辑块基础上控制高速和低功耗逻辑的设置(每个逻辑块包括两个LAB,或者一个LAB和DSP模块,或者一个TriMatrix存储器,都含有相关的走线)。例如,在Stratix IV FPGA中,可以分别对5000多个逻辑块进行控制,设置为高速或者低功耗模式,把设计功耗降到最低。Quartus II开发软件能够将逻辑块设置为高速或者低功耗模式,自动对设计进行优化,无须用户的干预。
Quartus II软件每次针对Stratix III FPGA进行设计编译时,自动对设计进行优化,达到规定的时序约束,同时实现最低功耗。得到的编程文件被装入FPGA,包括将每个逻辑块设置为高速或者低功耗配置的信息。在Quartus II软件中完全可以看到逻辑块高速或者低功耗模式的最终设置。
4 DDR3和动态片内匹配
以Stratix IV FPGA为例,其I/O创新技术包括I/O中直接内置读/写调平功能,更迅速方便地与1067Mb/s533MHz) DDR3 DIMM进行接口。从1.8V工作的DDR2过渡到1.5V工作的DDR3,使I/O静态功耗降低了30%。
为进一步降低I/O静态功耗,可在数据传送期间动态接通和关断串联匹配(RS)及并联匹配(RT),这一功能被称为动态片内匹配(DOCT)。在写周期,RS接通,RT关断,以匹配线路阻抗,而在读周期,RS关断,RT接通,实现与总线的远端匹配。在一个典型72位DIMM上,和使用DDR2但不具有DOCT的标准FPGA相比,Stratix IV FPGA在1067Mb/s时I/O静态功耗降低了65% (1.9W)。
5 内置硬核IP和收发器技术
以Stratix IV FPGA为例,它为各种×1、×4、×8 PCI Express Gen1和Gen2应用提供一系列完整的PCI-SIG兼容FPGA解决方案。Stratix IV FPGA新增特性提供4个PCI Express硬核知识产权(IP)模块,嵌有完整的PCI Express协议堆栈(端点和根端口)。这包括收发器模块、PHY MAC、数据链路层和协议层。
和软核IP相比,Stratix IV FGPA中的硬核IP不但节省了逻辑和嵌入式存储器资源,缩短了设计和编译时间,而且大大降低了功耗。表1为Stratix IV FPGA中PCI Express硬核IP内核Gen2的功耗。
7 应变硅
应变硅技术增大了晶体管沟道跨导,从而提高了晶体管的性能,如图4所示。Stratix III和Stratix IV FPGA的所有晶体管中使用了应变硅技术,以提高FPGA的性能。
Quartus II功耗优化
详细的设计实施可以提高性能,减小面积,降低功耗。以前,通过布局布线设计流程,寄存器传送级(RTL)自动在性能和面积上达到均衡。Quartus II PowerPlay优化工具自动在Stratix IV FPGA上继承了这些节省功耗的特性,进一步降低功耗。
Quartus II PowerPlay功耗模型与实际的芯片测量结果密切相关。Altera公司使用了8500多个不同的测试配置来测量Stratix系列器件每一组成的功耗。每一配置专门针对FPGA特定配置下的某一电路组成,例如9×9模式下的DSP、×16模式下的M9k存储器模块,以及特定逻辑配置下的ALM等。
所采用的测试方法简单、精确。对特定配置下FPGA中单个模块进行精确的功耗测量,最好的方法是采用待分析配置状态测量的模块实例来配置FPGA。所有其他逻辑和功能模块配置为低功耗工作模式不被激励。然后,在所有被测模块中运行设计好的、能够重复激励的模式,产生清晰的功耗参数。得到的芯片功耗主要来自于大量被测模块,可以从总功耗中提取出多余功耗。得到的功耗除以配置模块数后,得出该模块在该模式下的精确功耗,如图6所示。
结论
虽然迈向尺寸更小的工艺节点实现了摩尔定律预言的密度和性能优势,但是要在提高性能的同时降低功耗,不但要进行工艺创新,而且也需要在FPGA体系结构上进行创新。可编程功耗技术和支持DOCT的DDR3等独特的技术使Stratix IV FPGA等高端FPGA尽可能将功耗降到最低,同时不会牺牲新一代设计的性能。