利用FPGA的并行处理能力实现轻量化CNN,包括二值化的BNN版本。该IP能让您在莱迪思iCE40 UltraPlus FPGA上实现CNN,功耗仅为毫瓦级。
该IP使用iCE40 UltraPlus器件的片上DSP资源来实现CNN。加速引擎使用了11个嵌入式块存储器作为(EBR)工作存储器。用户可选择EBR或更大的单端口存储器(SPRAM)来存储引擎所使用的权重和指令。
该加速器IP与莱迪思神经网络编译器工具配合使用。编译器针对在常见的神经网络训练工具中开发的网络,编译成可由加速器IP运行的指令。