莱迪思半导体CNN Plus加速器IP核是用于定点权重深度神经网络的计算引擎。它通过执行莱迪思sensAI™神经网络编译器生成的具有权重值的序列代码来计算神经网络的各层,包括卷积层、池化层、批量归一化层和全连接层。该引擎针对卷积神经网络进行了优化,因此可用于各类视觉应用,例如分类或目标检测和追踪。IP核不需要额外的处理器,它可以自行执行所有必需的计算。
CNN Plus加速器IP核提供三种类型的实现方式:紧凑型CNN资源利用较少,适用于小型FPGA;优化型CNN可以并行执行四个卷积计算,适用于高速应用;扩展型CNN提供与优化型CNN相同的功能,另外还支持max argument的最大池化/反池化。
客制化卷积神经网络(CNN)IP —— CNN Plus IP是一种灵活的加速器IP,通过莱迪思FPGA的并行处理能力、分布式存储器和DSP资源,轻松实现超低功耗AI。
可配置的使用模式 —— 提供两种实现模式:低能耗(Compact)和高性能。低能耗模式是使用FPGA本地存储器的低功耗处理模式。 而高性能模式专为较大的网络实现而优化。
易于实现 —— 采用TensorFlow等常见的机器学习框架训练出来的模型可使用莱迪思神经网络编译器工具进行编译,然后通过CNN Plus加速器IP在硬件上实现。