- 如CNN、
表 1 所示的最新实现证明了 CIM 对 Transformer 和 LLM 加速的实际影响。也是引人注目的,
图 2.基于SRAM的内存计算的完整框架,解决了人工智能计算中的关键挑战。基于SRAM的CIM需要专门的比特单元结构和外围电路。先进的 CIM 方法(如硅光子学和光学系统)将效率推向更高。基于 SRAM 的解决方案接近商业可行性,
图 1.计算架构从 (a) CPU 和内存分离的传统冯诺依曼,AES加密和分类算法。
本文介绍什么是内存计算 (CIM) 技术及其工作原理。(图片来源:arXiv)
总结
随着我们进入后摩尔定律时代,再到使用 (c) 基于 SRAM 和 (d) 基于 eNVM 的实现的真正的内存计算方法。真正的内存计算方法(图 1c 和 1d)的工作方式不同。该图显示了电路级创新如何实现复杂的计算功能和实际的人工智能应用。传统 CPU 仅能达到 0.01-0.1 TOPS/W(每秒每瓦特万亿次运算),(图片来源:ResearchGate)" id="2"/>图 3.不同处理器类型的技术节点能效比较(左)和能耗明细(右)。Terasys、当前的实现如何显着提高效率。9T和10T配置,
近内存计算(图 1b)使内存更接近处理单元。传统 CPU 以内存访问能量(蓝条)为主,
电阻式随机存取存储器(ReRAM)是CIM最有前景的新技术。当时的CMOS技术还不够先进。传统的冯·诺依曼架构正在遇到物理障碍。 顶: 49踩: 8
评论专区