高级CNN加速器IP

专为卷积神经网络优化

莱迪思半导体高级CNN加速器IP核是一个定点权重的深度神经网络计算引擎。它通过执行一系列由莱迪思sensAI™神经网络编译器生成的包含权重值的固件代码来计算神经网络的各个层,包括卷积层、池化层、批量归一化层和全连接层。该引擎针对卷积神经网络进行了优化,因此可用于各类视觉应用,例如分类或目标检测和跟踪。该IP核不需要额外的处理器;它可以自行执行所有必需的计算。

更高的吞吐量——用于Avant的64位数据通路引擎,以及用于Avant和CPNX FPGA的32位数据通路引擎。

更快的运行时间——Vector ALU用于增强像素操作,强化的前/后ML图像处理算法。

更强的性能——支持1-4个卷积引擎。

特性

  • 支持卷积层、最大池化层、全局平均池化层、批量归一化层、全连接层
  • AXI4外部存储器接口
  • 可配置存储器块数量,可以在资源和性能之间进行权衡
  • 支持卷积和全连接层后的基于查找表的激活功能
  • 支持Vector ALU中的全新Filter模块,用于min/max/median等专用内核

跳转到

框图

资源使用情况

配置 FPGA clk, aclk (MHz) 寄存器 LUT LRAM EBR DSP MULT (18x18 MULT)
VE_TYPE = “VE64” (64b engine)
LRAM_NUM : 8
SPD_NUM : 8
CONV_NUM : 1
CONV_M4 : 1
EN_VE : 0
EN_VE_FILT : 0
EN_CONV5 : 1
EN_CONV7 : 1
EN_ARGMAX_POOL : 0
EN_MAXPOOL_S1 : 0
(Both Scale and FC LUT activations disabled)
Avant-E-500 200, 100 50512 46039 (Avant无LRAM,故ML SPD由EBR组成) 407 282 (使用DOT PROD DSP原语)
VE_TYPE = “VE32” (32b engine)
LRAM_NUM : 8
SPD_NUM : 8
CONV_NUM : 1
CONV_M4 : 1
EN_VE : 0
EN_VE_FILT : 0
EN_CONV5 : 1
EN_CONV7 : 1
EN_ARGMAX_POOL : 0
EN_MAXPOOL_S1 : 0
(Both Scale and FC LUT activations disabled)
Avant-E-500 200, 100 27393 25574 (Avant无LRAM,故ML SPD由EBR组成) 271 74 (使用DOT PROD DSP原语)
VE_TYPE = “VE32” (32b engine)
LRAM_NUM : 7
SPD_NUM : 8
CONV_NUM : 1
CONV_M4 : 0
EN_VE : 1
EN_VE_FILT:0
EN_CONV5 : 1
EN_CONV7 : 1
EN_ARGMAX_POOL : 1
EN_MAXPOOL_S1 : 1
(Both Scale and FC LUT activations disabled)
LFCPNX-100 96, 96 36546 50006 7 174 91

1. 使用不同的软件版本、不同的器件密度或速度等级时,性能可能有所不同。
2. clk和sclk的数量来自sensAI 6.0 ML演示和参考设计的时序收敛。

订购信息

器件系列 订购编号
多站点永久许可 单机器年度许可
Avant-AT-E CNNADV-ACCEL-AVE-UT CNNADV-ACCEL-AVE-US
CertusPro-NX CNNADV-ACCEL-CPNX-UT CNNADV-ACCEL-CPNX-US

文档

快速参考
标题 编号 版本 日期 格式 文件大小
选择全部
Advanced CNN Accelerator IP Core - User Guide
FPGA-IPUG-02224 2.0 1/9/2024 PDF 615.2 KB