借助 reVISION 加速安防监控系统设计

发布时间:2017-07-18 阅读量:1758 来源: 我爱方案网 作者: candytang

监控系统严重依靠嵌入式视觉系统提供的功能加速在广泛市场和系统中的部署。这些监控系统的用途非常广泛,包括事件和流量监控、安全与安防用途、ISR 和商业智能。用途的多样性也带来了几大挑战,需要系统设计人员在解决方案中加以解决。它们是:


• 多摄像头视觉 – 能够连接多个同类或异类传感器类型。
• 计算机视觉技术 - 能够使用高级库和框架(例如 OpenCV 和 OpenVX)进行开发。 
• 机器学习技术 – 能够使用框架(例如 Caffe)来实现机器学习推断引擎。
• 提高分辨率和帧率 – 提高每个图像帧所需的数据处理。


根据用途,监控系统会实现相应算法(例如光流法)以检测图像内的运动。立体视觉提供图像内的深度知觉,也使用机器学习技术来检测和分类图像中的对象。
  



图 1 - 实例应用(上:面部检测与分类,下:光流)


异构系统器件,例如 All Programmable Zynq®-7000 和 Zynq® Ultrascale+™ MPSoC,正越来越多地应用于监控系统的开发。这些器件是可编程逻辑(PL)架构与高性能 ARM® 内核处理器系统(PS)的完美结合。


与传统方案相比,PL 与 PS 的紧密耦合使得创建的系统具有更强的响应能力、可重配置能力以及更高的能效。基于 CPU/GPU 的传统 SoC 需要使用系统存储器将图像从一个处理阶段传送到下个阶段。这会降低确定性并增大功耗和系统响应时延,因为多个资源需要访问同一个存储器,造成处理算法瓶颈。该瓶颈随帧率和图像分辨率增加而加重。


当解决方案采用 Zynq-7000 或 Zynq UltraScale+ MPSoC 器件实现时,就会打破这个瓶颈。这些器件允许设计人员在器件的 PL 中实现图像处理流水线。在 PL 中创建真正的并行图像流水线,其中一个阶段的输出被传送到另一个阶段的输入。这样能获得确定的响应时间,缩短时延,实现功耗最佳解决方案。


利用 PL 实现图像处理流水线,还能获得比传统 CPU/GPU SoC 方案更宽的接口能力,而后者只能获得固定接口。PL IO 接口的灵活特性允许任意连接,支持 MIPI、Camera Link、HDMI 等行业标准接口。这种灵活特性还能实现定制传统接口,而且能进行升级以支持最新接口标准。利用 PL,还可以让系统并行连接多个摄像头。


不过,最关键的是实现应用算法,而且无需用硬件描述语言(例如 Verilog 或 VHDL)重新编写所有高级算法。这正是 reVISION™ 堆栈的用武之地。


 
图 2 - 传统 CPU/GPU 方案与 Zynq-7000/Zynq UltraScale+ MPSoC 的对比


reVISION 堆栈


reVISION 堆栈使开发人员能够实现计算机视觉和机器学习技术。在这里,针对 Zynq-7000 和 Zynq UltraScale+ MPSoC 的高级框架和库同样适用。为此,reVISION 将支持平台、应用和算法开发的多种资源完美结合在一起。该堆栈分为三个不同等级:


1. 平台开发 - 这是堆栈的最底层,是剩余堆栈层的构建基础。该层为 SDSoC™ 工具提供平台定义。

2. 算法开发 – 这是堆栈的中间层,为所需算法的实现提供支持。该层有助于图像处理和机器学习推断引擎加快向可编程逻辑中转移。

3. 应用开发 – 这是堆栈的最高层,可提供行业标准框架支持。该层用来开发应用,以便利用平台开发和算法开发层。


堆栈的算法和应用层支持传统图像处理流程和机器学习流程。在算法层中,支持用 OpenCV 库开发图像处理算法。这包括:能将多种 OpenCV 功能(包括 OpenVX 内核子集)加速放在可编程逻辑中实现。为支持机器学习,算法开发层提供几种可以放在 PL 中用以实现机器学习推断引擎的预定义硬件功能。然后,由应用开发层访问这些图像处理算法和机器学习推断引擎,用以创建最终应用,并为 OpenVX 和 Caffe 等高级框架提供支持。
 


图 3 - reVISION 堆栈


reVISION 堆栈能提供所有必要元素,用以实现高性能监控系统所需的算法。


在 reVISION 中加速 OpenCV


算法开发层的最重要优势之一是能够加速多种 OpenCV 功能。该层中,可加速的 OpenCV 功能被分成四个高级类别。


1. 计算 – 包括的功能有:两个帧的绝对偏差、像素运算(加、减和乘)、梯度和积分运算。
2. 输入处理 – 支持位深度转换、通道运算、直方图均衡化、重新映射和尺寸重调整。
3. 滤波 - 支持多种滤波器,包括 Sobel、自定义卷积和高斯滤波器。
4. 其他 – 提供多种功能,包括 Canny/Fast/Harris 边缘检测、阀值以及 SVM 和 HoG 分级器。


这些功能构成了 OpenVX 子集的核心功能,能够针对 OpenVX 与应用开发层紧密集成。开发团队可利用这些功能在可编程逻辑中创建算法流水线。以此方式在逻辑中实现这些功能,这样能显著提高算法实现性能。


reVISION 中的机器学习


reVISION 提供与 Caffe 的集成,能够实现机器学习推断引擎。与 Caffe 的集成发生在算法开发层和应用开发层。Caffe 框架在 C++ 库中为开发人员提供大量函数库、模型和预训练的权重,以及 Python™ 和 MATLAB® 捆绑程序。该框架使用户能够创建和训练网络,以执行所需的运算,无需重新开始。为便于模型重用,Caffe 用户可通过模型库(model zoo)共享模型;库中提供多个网络模型,用户可针对专门的任务实现和更新网络模型。在 prototxt 文件中定义这些网络和权重,当在机器学习环境中部署时,使用该文件来定义推断引擎。


reVISION 提供 Caffe 集成功能,使机器学习推断引擎的实现非常简单,只需提供 prototxt 文件即可;剩下的工作由框架来完成。然后,使用这个 prototxt 文件来配置处理系统以及可编程逻辑中的硬件优化库。可编程逻辑用来实现推断引擎,并包含 Conv、ReLu、Pooling 等功能。

 


图 4 - Caffe 流程集成


机器学习推断引擎中的数字表达对性能也起到重要作用。机器学习越来越多地使用更为高效、降低精度的定点数字系统,例如 INT8 表达法。与传统的浮点 32 (FP32)方法相比,定点降精度数字系统不会造成较大精度损失。与浮点相比,定点运算更易于实现,因此改用 INT8 后能实现更高效、快速的解决方案。可编程逻辑解决方案最适合使用定点数字,reVISION 能在 PL 中使用 INT8 表达法。采用 INT8 表达法后,可在 PL 中使用专用 DSP 模块。有了这些 DSP 模块的架构,当使用相同的内核权重时,可同时执行两个 INT8 乘法累积运算。这样不仅能获得高性能实现方案,而且可以降低功耗。凭借可编程逻辑的灵活特性,也可以轻松实现精度更低的定点数字表达形式。


结论


reVISION 使开发人员能够利用 Zynq-7000 和 Zynq UltraScale+ MPSoC 器件所提供的功能。而且,即使不是专家也能利用可编程逻辑来实现算法。这些算法和机器学习应用可通过高级的行业标准框架来实现,从而缩短系统开发时间。这使开发人员能够提供响应性和可重配置能力更强而且功耗更加优化的系统。

相关资讯
继电器的选型要点与技术趋势

继电器是指当电路中输入参量(如电、磁、光、热、声等参量)达到某一规定值时,能使电路输出参量发生预定阶跃变化的一种自动通断的控制元器件。在电路中,继电器主要起控制、保护、调节和传递信息的作用。作为电气控制系统中的关键元件,其应用领域和产品结构正在发生全面深刻的变革。传统应用领域如电力、通信、家电等行业的需求逐渐减弱,而新兴应用领域如新能源汽车、智能家居、工业自动化等对继电器的需求迅速增长。这促使继电器产业不断优化产品结构,提升产品性能。

重磅!华为最新芯片麒麟9010亮相新机!

华为新机Pura 70 Ultra将搭载最新芯片麒麟9010

低成本、低功耗电子血压计实战应用方案与设计要点

电子血压计具有低成本、低功耗、小型化和智能化程度高的优点,在使用上有便携和易操作的特点,已经成为一种重要的居家智能终端,具有很好的推广性和发展空间。它通过传感器和电路系统来获取和处理血压信号,并将结果显示给用户。因此,电路设计对于电子血压计的性能和可靠性至关重要。快包分析师将介绍一些电子血压计电路设计的要求和注意事项。同时,推荐基于小华HC32L136的电子血压计主控方案和润石科技的电子血压计解决方案以供参考。

兼具高可靠性与低功耗的汽车电动尾门主控方案

在汽车“四化”趋势影响下,下一代汽车电子架构的复杂度与集成性持续攀升,各域之间的安全、实时控制与通信是车规级MCU的关键任务。针对严苛的车用市场需求,设计出具备防夹、自动开关与脚踢感应开门等多功能的汽车电动尾门系统,可以很好地弥补原有汽车尾门开合过程的缺陷,从而达到用户对汽车使用便捷性的需要。快包分析师介绍了汽车电动尾门系统的核心模块,同时也推荐3种不同的汽车电动尾门主控方案供工程师朋友们参考。

SEMI-e深圳国际半导体展6月袭来 规模再升级 参展企业超800家 ​

半导体被称为制造业皇冠上的“明珠”,目前已成为全球创新最为活跃的领域