佛罗里达大学领导的一个研讨团队,与加州大学洛杉矶分校和乔治华盛顿大学协作,开发了一种原型光子AI芯片,该芯片利用光进行卷积操作,与电子等效芯片比较,能耗下降了多达两个数量级。这一立异的中心是一种彻底集成的根据菲涅耳透镜的架构,在芯片上履行二维空间卷积,且悉数在模仿光学域中进行。
![]()
封装的光子联合改换相关器,包含硅光子芯片、定制印刷电路板和八通道光纤阵列。
该芯片是同种类型的产品中的首款,经过被迫衍射光学器材履行空间卷积,并单片制作在硅光子基板上。该原型为深度学习中最消耗资源的操作之一——卷积神经网络(CNN)中的乘累加(MAC)操作——完成了近零能耗核算。
研讨人员运用一个练习用于分类MNIST数据集手写数字的CNN对芯片进行了测验,这是机器学习中的规范基准。该光子卷积模块被集成到网络的第一层,对输入图画运用学习到的内核。网络的其余部分选用数字完成,模仿混合推理流程。
研讨报告拂尘,该芯片达到了98.1%的分类准确率,与纯电子推理流程基本上没有差异。但在能效方面,差异巨大。与传统的数字卷积引擎(根据CPU、GPU或FPGA)比较,该光子芯片将每次推理的能耗下降了100倍,估计操作能耗低至皮焦耳级。
![]()
重要的是,该架构与波长无关,并支撑波分复用(WDM)。经过为不同数据通道运用不相同波长,能够在同一物理结构中并行运转多个卷积操作,从而在不添加占地面积或热负载的情况下扩展核算吞吐量。
这种光学CNN加快器处理了功率密度问题,这是布置边际AI的最大瓶颈之一。跟着CNN的深度和复杂性添加,卷积操作主导了核算预算。在紧凑的边际设备(如传感器、无人机、可穿戴设备或植入式设备)中运转AI推理,不只需求高效性,还需求热静默和占地最小化。
![]()
经过这种根据透镜的办法,核算是被迫的、无电扇的且本质上并行的。它避开了电子加快器常见的内存带宽、数据移动瓶颈和热节省等问题。因为光的模仿特性答应接连值内核运用,因而也避免了量化或剪枝的退让。
此外,因为该芯片选用规范光刻技能制作,因而能与现有硅光子渠道单片集成,或与CMOS后端配对。这使其比以往的自由空间光学或光纤耦合规划更有用,后者需求粗笨的设置,不适合商业集成。
该芯片并非完好的神经处理器,它仅处理卷积过程。但经过将最耗能的前端核算卸载到光学范畴,并将决议计划逻辑或全衔接层留给传统硅电路,它界说了一种新的混合核算模型。未来的体系可能在同一基板上一起集成用于CNN的光子加快器、用于逻辑的数字控制器以及用于数据存储的内存阵列。
跟着AI硬件领会的加快,此类立异指向了一个未来,在那里核算不再局限于电子和晶体管,而是扩展到光子、干与以及光的底子记取。
该原型由美国海军研讨办公室赞助开发,并作为同行评议的硅兼容被迫芯片上卷积演示,在《先进光子学》杂志上宣布。
联系人:彤起
手 机:0532-66912111
邮 箱:Tongqi@163.com
公 司:乐鱼全站
地 址:青岛市李沧区瑞金路1号(青岛汽车厂北1000米)