首页 | 期刊简介 | 编辑部 | 广告部 | 发行部 | 在线投稿 | 联系我们 | 产品信息索取
2024年11月21日星期四
2011年第01期
 
2010年第12期
 
2010年第11期
2010年第11期
 
2010年第10期
2010年第10期
 
2010年第09期
2010年第09期
 
2010年第09期
2010年第08期
 
2010年第07期
2010年第07期
 
2010年第06期
2010年第06期
 
2010年第05期
2010年第05期
 
2010年第04期
2010年第04期
 
2010年第03期
2010年第03期
 
2010年第02期
2010年第02期
 
2010年第01期
2010年第01期
 
2009年第12期
2009年第12期
 
2009年第11期
2009年第11期
 
2009年第10期
2009年第10期
 
2009年第9期
2009年第9期
 
2009年第8期
2009年第8期
 
2009年第7期
2009年第7期
 
2009年第6期
2009年第6期
 
2009年第5期
2009年第5期
 
2009年第4期
2009年第4期
 
2009年第3期
2009年第3期
 
2009年第2期
2009年第2期
 
2009年第1期
2009年第1期
 
2008年第12期
2008年第12期
 
2008年第11期
2008年第11期
 
2008年第10期
2008年第10期
 
2008年第9期
2008年第9期
 
2008年第8期
2008年第8期
 
2008年第7期
2008年第7期
 
2008年第6期
2008年第6期
 
2008年第5期
2008年第5期
 
2008年第4期
2008年第4期
 
2008年第3期
2008年第3期
 
2008年第2期
2008年第2期
 
2008年第1期
2008年第1期
利用Virtex-5 FPGA实现设计性能

Realize Design Performance with Virtex-5 FPGAs

Xilinx 公司



Virtex-5 FPGA架构

FPGA性能不仅与逻辑架构的最大系统频率有关,而且受到片上内存性能包括时钟和数量的影响,同时也取决于内置的DSP加速能力以及I/O带宽等条件。此外,还需软件的支持,以充分发挥FPGA的性能。

Virtex-5系列(以下简称V5系列)FPGA旨在提供系统级解决方案。其创新包括:采用PLL管理;逻辑结构中采用ExpressFabric技术,包括基于全新互连架构的6输入查找表;第二代Sparse Chevron技术,通过改进I/O布局大大提高了信号完整性;高达1200个I/O,每个I/O都具有Chip-sync功能;速度可达1.25Gbs LVDS或单端800Mbps等。此外,V5还引进了Triple-oxide技术,大大降低了功耗。

新的ExpressFabric逻辑架构

增强的架构包括可配置的逻辑块(CLB),每个CLB包含两个乘法器,每个乘法器使用四个6输入查找表,可以降低如多路器、筒形移位寄存器等结构的逻辑级数。特别地,能减少大的逻辑块的延时,也适用于实现小型片上缓存和基于ROM的编码等。相对于V4,V5系列FPGA的延时性能最高可提高53%。新的进位链结构(如图1所示),可以提高算术函数的性能。CLB的互联采用了对称的对角连线,减少跳连数量,降低了延时,有利于布线速度的提高。

图1 新的CarryChain可以提高运算速度(略)

片上内存的改进

片上内存带宽对芯片的性能影响也至关重要。V5系列产品的每个BlockRAM的时钟频率高达550MHz,并且容量增加一倍,达到36Kbit。同时,简单的双端口模式使BRAM的带宽加倍,更引入了FIFO和64位ECC逻辑。

DSP的改进

相对于V4的18x18位乘法器,V5采用的25x18位乘法器可以极大的提升DSP的动态范围。V5还具有全部可级联的加法器链架构,有利于以更少的DSP片实现更大带宽的滤 波器。

I/O带宽的提升

I/O的带宽决定了系统的性能,通常存储器的I/O带宽要达到2倍的内部数字处理速度, V5的I/O带宽,相对于V4提高了50%~67%。


测试与设计实例

V5性能测试,采用VHDL或Verilog语言及网表,利用Synplify 8.6进行综合,并使用ISE8.2i进行布局布线。图2显示了74个实例的性能提升情况。

图2 性能提升实例(略)

实例A为密码应用,由于V5的大逻辑查找表结构降低了逻辑级数,使得关键路径的延时缩短,令性能提升58%。通过上图,可知对于需要较多逻辑级数、大量乘法器或基于查找表的ROM的设计,V5可以获得超过45%的性能提升,而对于其它设计,性能提升的空间有限,约在15%以内。


提高性能的设计技巧

V5 FPGA的性能平均提高1.1到1.7倍,因此应用一些设计技巧可以很容易地实现高性能设计。最新的ISE8.2i软件提供了物理层综合,可以充分挖掘V5系列FPGA的性能。同时,该软件将各种不同的工具统一界面,更加方便易用,有利于时钟收敛和PCB设计。软件还提供了新的功耗计算表。

具体设计技巧,包括:

1)利用约束和属性控制综合的映射,如图3所示。

2)有效利用软件的特性进行物理层综合。

图3 控制综合的映射(略)

ISE8.2i提供了三种优化选项,即时序重排(ReTiming)、全局优化(Global Opt)及逻辑优化(Logic Opt)。时序重排可以调整关键路径中寄存器的平均分布;全局优化可以对关键路径进行重综合;逻辑优化则可以对关键路径中的某些部分重新综合,加快布局布线后的速度。在使用High Effort或Extra Effort选型不能得到满意结果时,根据不同的应用条件可以使用High Effort with Global Opt或High Effort with Logic Opt选项进行再综合。

此外ISE8.2i还提供了自动的延时收敛计算程序Xplorer,该程序可以自动地对不同的设计约束进行计算,并找到最优化的方法。


总结

V5系列FPGA具有强大的功能,选择合适的硬核与软件工具,将实现最优化性能。

更多详细内容,敬请登陆中电网在线座谈网址:
http://seminar.eccn.com/060824/jchf.asp


问答选编

问:Virtex-5 FPGA 在保护应用设计版权方面有何特色?

答:Virtex-5提供AES比特流加密/保密技术,使用您信 赖的安全性来保护您的知识产权。 基于软件的比 特 流加密和片上比特流解密逻辑使用了专用存储 器 来存储256-bit加密匙,可以使用Xilinx ISE 软件 生成加密匙和加密比特流。

同非易失性加 密匙 存储方法不同,任何取下Virtex-5 F PGA或打开其封装的举动都会导致加密匙和编程 数据的立即丢失。

问:Virtex-5 FPGA的工作速度更高了,那么对电源方面 有 何要求?能否详细介绍,如,推荐的旁路电容、电 源 芯片以及布局布线方面的注意事项等。

答:Virtex-5 FPGA对电源设计方面有严格的约束,例如, 工 作时期的电源纹波要求,供电系统的压降,电源 通 路的等效阻抗设计等参数都是用户要特别留意 的 。建议在做 大设计的时候一定要做电源完整性 仿 真,且要严格满足 设计约束。电源芯片方面,TI 等 电源厂商都有相应的解 决方案,提供众多可选 芯 片。
以下给出一些参考文档:
http://www.xilinx-china.com/bvdocs/userguides/ug072.pdf
http://www.xilinx-china.com/bvdocs/appnotes/xapp623.pdf

问:一些设计如果不做时序约束,综合布线后往往产生 不可预料的结果,那如何有针对性的给出设计的时 序约束?为了满足时序要求,设计上需要注意哪些 方面?

答:时序约束是FPGA设计的基本技能。通常要求:
1.针对每个全局和局部时钟域进行约束;
2.对I/O进行时序约束;
3.对跨时钟域信号约束;
4.局部关键信号采用相对定位或者绝对定位约束;
5.对伪路径进行约束。
具体的技巧包括:
1 . 代码编程习惯的优化,例如,有选择地应用case 语 句和if语句,减少if条件中的信号数目等;
2. 综合、布局布线间的参数设置;
3. 用时序分 析仪分析关键 路 径,对照时序模型找到 产生时序问题的具体原因;
4. 模块化设计和增量设计方法;
5. 在RTL级和物理级进行有针对性的优化,并灵活 使用相对定位和绝对定位约束等。

问:ML403开发板能否外接以太网PHY芯片?

答:M L403开发板含有以太网PHY芯片。如果还需外 接,可以使用板上的扩展排针。

问:在 器件配置方面是否有新的器件与之配合?在线 调试能力有哪些改进?

答:器 件配置方面,可以使用便宜的通用并行或串行 F LASH器件进行配置。在线调试能力大幅增强,简 单列举如下:
1. 增强对高速串行口的调试支持,提供BERT功能;
2. 增强对MicroBlaze及PPC处理器的调试能力,提 供新的GUI简化操作;
3. 利用 Xilinx USB下载 电路,可提升调试速度等。

问:Virtex-5 FPGA 能否用于手持式设备?用于红外图像 处理和可见光实时融合处理时,选用该系列的FPGA 是否具有功耗和成本优势?

答:当然可以。
Xilinx FPGA广泛用于医学图像处理(超声波、X光及 红 外等),以及消费类产品的图像增强及特技效果 等 。由于Xilinx FPGA中的内嵌DSP单元功能强大, 数目多,功耗低,因此是理想的设计平台。

问:什么是XCITE 有源I/O终端技术?它有哪些优点?

答:XCITE 有源I/O终端技术可以减少端接电阻的数量, 利 用少数外接电阻就可以为多个管脚提供端接。 特 别是在高速场合,内部有源端接技 术可以大大改 善信号质量。

问:在FPGA中 LUT的输入宽度越宽,意味着可能引起 的浪费越大,Xilinx在这个方向是怎样考虑的?

答:Xilinx的真6输入查找表(true 6-LUT)技术,提供6个 输 入和2个输出。ISE8.2支持将不相关逻辑映射到 一 个LUT中,也支持物理综合技术,大大减少了浪 费的几率,推荐采用。

问:V5的功耗降低到了什么水平?最坏情况下的功耗如 何确定?是否需要散热器?

答:V5功耗降低近35%。实际功耗方面,根据每个设计 的不同,存在差异。可以用V5配套的电 子表格,以 及 XPOWER工具进行功 耗估算,获得最坏情况和典 型 情况的功耗值。通常,估算工具 是比较准确的, 而 客户对自身设计情况估计的误差 对功耗估算的 准确性影响最大。
是 否需要散热器,与设计产生的热 量、环境散热能 力 等密切相关,请针对具体情况进行 定量分析。

问:设计中采用FPGA实现DDR接口,当需要在运行过 程中 重新配置FPGA时,大容量FPGA的配置时间 往 往 超过几百ms,所以在配置期间,会造成DDR 内 存 中 的中间暂存数据丢失,有没有比较好的解 决办法?

答:可以从以下几方面考虑:

1.可以先将DDR存储器设置成自刷新模式,再更新 FPGA配置;
2 .外加一个CR-II CPLD逻辑进行切换过程的状态控制;
3.采用FPGA部分可重配置技术。

《世界电子元器件》2007.5
         
版权所有《世界电子元器件》杂志社
地址:北京市海淀区上地东路35号颐泉汇 邮编:100085
电话:010-62985649
E-mail:dongmei@eccn.com