DIY编程器网

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 400|回复: 0
打印 上一主题 下一主题

基于FPGA的控制平面/数据平面视频处理

[复制链接]
跳转到指定楼层
楼主
发表于 2011-4-25 09:10:12 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
嵌入式设计人员面临的最大挑战之一就是界定系统的性能需求。用以确定实际性能需求所需的信息要么无法获取,要么难以获得。最精确的估算有时也会因无法预料的计算负荷而失效。分析通常会指出,对于数据处理需求而言嵌入式处理系统的成本效益太低。因此,系统设计人员高度渴望拥有可扩展的能够适应性能需求潜在变化以及能够执行高性能数据处理的架构。而在FPGA内部实施的控制平面/数据平面处理架构就能够有效满足上述要求。
  什么是控制平面/数据平面处理?为什么您的下一代嵌入式系统可能会需要它?
  在无法用软件完成所有处理工作的系统中,设计人员可以通过多种途径来获得其他性能。他们可以采用对称或者非对称处理配置的多处理器;使用硬件协处理器;或者将数据处理任务拆分给一个或多个专用处理单元——就像在控制平面/数据平面内进行处理一样。
  在这种编程方式下,数据处理被分成两个不同的平面。控制平面代表着对性能影响不大的算法元素,比如管理性任务、用户界面和操作系统功能。同时,数据平面代表着数据在系统中的流动,例如视频流或音频流及其处理。在数据平面上,设计人员采用诸如流水线这样的技术来增强数据吞吐能力。控制平面/数据平面处理的典型应用包括流视频、网络包处理以及高速信号处理。
  让我们来近距离观察一个涉及流数据实时处理的控制平面/数据平面应用。我们将面临高清视频流特有模式的识别。该实要求混合使用高性能数据处理和包含嵌入式微处理器的控制功能的多种应用的典型代表。
  720p/60Hz的HD视频流的像素频率为74.25MHz。这就要求222.75MB每秒的处理速率。假定采用2.5GHz的双核双指令处理器来处理该数据,最佳的指令率为10G指令每秒。这样的处理器可针对所处理数据的每一字节执行22.4条指令。对某些应用而言这已经足够了,但22.4条指令表明所能处理的数据非常有限。复杂的视频处理功能,比如内核卷积(kernelconvolution)、噪音消减和其他过滤功能需要更高的指令执行效率。本文的解决方案准备在数据平面上创建并行或流水线处理单元。
  HD视频处理是一种可以把问题划分为控制平面和数据平面予以高效处理的常见的现实应用。作为一种高度并行处理单元,FPGA在本例中负责视频处理,同时由FPGA内部的中等性能处理器负责视频处理流水线。该处理器可专用于单个应用,也可以运行诸如Linux这样的操作系统。最终形成的硬软件混合实施方案可以把处理交付给能够进行最佳处理的部分,实现低成本、高性能数据处理解决方案。图1显示的是典型的控制平面/数据平面系统。
  





  图2:向导启动屏幕截图和已完成的系统。
  第二种方法是调整现有的参考设计。FPGA参考设计不断发展并已成为市场的焦点。在我们的案例研究中使用的参考设计具有完整的微处理器系统、存储器、外设和720pHD数字信号处理流水线。因此,该系统相当于一款完整的控制平面/数据平面解决方案。在该参考设计中,由处理器控制增益和流水线中的FIR滤波器。使用C-to-FPGA工具创建目标探测和高亮显示模块,让整个系统具备功能所化的时间不到20个小时。
  该处理器可以使用板卡支持包(BSP)提供的补充驱动程序来控制数据流水线。目前已有面向Linux的驱动程序,可以让处理器直接控制数据处理流水线。Linux调用包括从Linux应用中打开I/O器件,然后针对该器件进行读出或者写入。
  HD视频识别系统案例研究
  目标检测和识别广泛应用于监控、医学成像和工厂自动化等行业。图像的分辨率越高,目标识别的准确度越高。因此,对HD摄影机和相关的HD视频流处理功能的需求较为强劲。我们的案例研究从这个问题(受一部著名的动画电影启发)出发:我们能否检测并高亮显示720pHD视频流中的小丑鱼?
  该设计需要16位色谱,以便识别小丑鱼的条纹图案。一旦识别,小丑鱼在屏幕上将被移动的聚光灯并高亮显示。此外,聚光灯的大小经设计后可以随匹配的似然性而调整(实际上,系统降低了聚光灯外的其他区域的图像亮度)。聚光灯的尺寸变化和形状计算以及为在每个像素位置搜索克隆鱼所进行的比较,将需要大量的计算以使其工作于74.25MHz的时钟周期。显然,这样的处理要求大大超出了一般嵌入式处理器的能力。
  在这种情况下,最好的解决办法是把流数据处理转移到协处理器上。在FPGA内部实施协处理器能够以最低成本灵活构建能够满足性能要求的解决方案。因此,基于FPGA的控制平面/数据平面架构就是最佳的选择。FPGA嵌入式处理可以通过总线接口控制负责接收视频数据、探测小丑鱼、高亮显示小丑鱼并输出供显示之用的视频数据的数字信号处理流水线。
  因此,在本目标检测和高亮显示案例中,我们选择50MHz的MicroBlaze嵌入式处理器来管理和控制74.25MHz的数据处理流水线,同时管理用户界面。在免除了实际执行视频处理的责任后,处理器可以处理许多其他的功能,比如托管以太网数据通信、管理图形用户界面、对数据处理流水线进行精细控制(例如,逐帧增益控制)等。
  诸如Linux这样的操作系统是提供多任务功能、网络协议栈和用户界面语言支持的理想选择。图3显示了所实施系统的方框图。该解决方案可以在高数据处理带宽需求和用软件控制数据处理方式之间实现理想的平衡。
  




  图3:小丑鱼探测器控制平面/数据平面系统。
  采用C-to-FPGA工具实现软硬件协同设计
  C-to-FPGA编译器可以让开发人员使用新的开发工具集和新技术解决软件/硬件开发问题。开发人员可以先在软件中进行算法编码。经验告诉我们,在软件中开发算法较在硬件中开发算法的效率更高。具体原因如下:首先,诸如C语言能够让编程人员在高级软件语言的层面上开发算法,而这是使用Verilog或者VHDL硬件描述语言所不能达到的;其次,与同类的硬件开发工具相比,针对C语言的调试和测试工具运行速度更快、效率更高,通常也更易于使用。相当于硬件算法,C语言算法可以在目标处理器上全速运行,而硬件算法需要先在仿真程序上完成测试和调拭;最后,C语言开发工具较同类硬件开发工具的成本要低得多。因此,工程人员一般倾向于在C语言或者类似的高级语言中开发算法。
  一旦使用C语言这样的软件语言完成对某个算法的验证,设计人员必须测量其性能,并确定该算法是否能够完全在嵌入式处理器或是完全在硬件上运行、或者硬软件混合协处理实施方案是否为最佳选择。在这种判断过程中可以采用性能分析工具。如果代码必须被转到硬件上,则设计人员必须手工转换算法,或者使用C-to-FPGA工具。
  C-to-FPGA工具可以让开发人员迅速把算法转换成HDL代码,优化生成的硬件处理器,并执行假设场景平衡性能和FPGA资源。该工具还能够让软件工程师使用FPGA内部的高性能数据处理逻辑,从而变身为硬件工程师。
  使用Linux把处理器连接到FPGA
  与FPGA制造商合作的Linux供应商已经开发完成了可让处理器与FPGA通信并对其进行控制的驱动程序。首先,您必须针对该I/O器件配置Linux。配置步骤由两个步骤组成。首先,把定制的驱动程序加载到Linux内核中:
  




  随后,将驱动程序注册到特定的器件号码(比如253):
  




  通信是通过开启该I/O器件、然后对该器件进行读写而完成的,示例代码段如下所示:
  




  




  FPGA的优势
  信号处理器系统的数据带宽要求往往会超过通用处理器能经济地获得的水平。在这种情况下,设计人员一般会把他们的数据处理系统划分为两个处理功能:使用通用处理器进行控制处理,另外使用诸如FPGA等硬件加速器进行数据处理。这样就构成了一个控制平面/数据平面处理系统。
  FPGA非常适用于同时实施控制平面和数据平面功能。一个FPGA可以包含一个或者多个像MicroBlaze这样软处理器,和/或像PowerPC这样的硬处理器。将它们集成到FPGA中可以实现控制平面处理器和数据平面处理系统之间的低时延、高带宽通信。
  借助向导和预先构建的参考设计,针对嵌入式和数据处理功能的系统编译简单明了。通过把在C语言中构建的算法原型转换到高性能硬件处理单元,C-to-FPGA工具有助于优化这一进程。最后,可以利用现在可用的Linux驱动程序方便地完成处理器和FPGA信号处理流水线之间的通信及控制编码。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏 分享分享 支持支持 反对反对
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|文字版|手机版|DIY编程器网 ( 桂ICP备14005565号-1 )

GMT+8, 2025-8-8 18:49 , 耗时 0.082272 秒, 18 个查询请求 , Gzip 开启.

各位嘉宾言论仅代表个人观点,非属DIY编程器网立场。

桂公网安备 45031202000115号

DIY编程器群(超员):41210778 DIY编程器

DIY编程器群1(满员):3044634 DIY编程器1

diy编程器群2:551025008 diy编程器群2

QQ:28000622;Email:libyoufer@sina.com

本站由桂林市临桂区技兴电子商务经营部独家赞助。旨在技术交流,请自觉遵守国家法律法规,一旦发现将做封号删号处理。

快速回复 返回顶部 返回列表