来源:乐晴智库精选 过去的二十年里,人工智能和云计算取得了飞速发展,但面对计算中心的数据洪流,算力增长速度远超存储能力,导致“存储墙”和“功耗墙”成为两大障碍,限制了数据计算的发展。 在传统的冯·诺依曼架构中,存储器和处理器是物理上分离的,数据处理需要经过数据总线交换数据,存储器的访问速度往往跟不上处理器的处理速度,制约了处理器的性能和效率,导致了“存储墙”问题。 存算一体架构的出现解决了计算和存储之间的界限,将计算直接嵌入到存储器中,使计算和存储相互融合。 存算一体的优势在于能够大大提高算力超过1000TOPS,提高能效超过10-100TOPS/W,同时有效降低成本,提高计算效率,从而实现计算能效的数量级提升。 存算一体适用于人工智能的各个场景,包括穿戴设备、移动终端、智能驾驶、数据中心等,可满足AI发展中的多样性需求。 随着大型模型的横空出世,其参数已达到上亿级别,存算一体架构有望成为AI算力的下一极,可能成为继CPU和GPU之后的第三种算力架构。 当前AI算力需求的不断增长,存算一体技术已经接近大规模量产的节点,随着技术成熟度的提高以及大规模商用落地,其市场空间有望超过千亿美元。 01 存算一体行业概览存算一体技术是一种以数据为中心的新型计算架构,将计算和存储功能融合在一起,使存储单元和计算单元紧密结合,从而降低了功耗并提高了计算效率。 存算一体架构被誉为AI芯片的“全能战士”,被认为是最具有潜力的技术之一。 其核心是将存储和计算完全融合,利用存储单元进行数据处理,不需要再进行数据传输,提高了计算效率。 存算一体的优势包括具有更大的算力、更高的能效、可以降低成本和提高效率等。 据量子位报道,存算一体产业发展将经历技术探索期、局部小规模量产、普遍小规模量产以及未来的大规模量产四个阶段。 02 存算一体技术路径存算一体技术的底层特征包括减少数据搬运,降低能耗至十分之一到百分之一,实现存储单元具备计算能力,等效于在面积不变的情况下规模化增加计算核心数或提升工艺代,以及单个存算单元替代计算逻辑和寄存器更小更快。 这些底层特征共同实现了存算一体技术的优势,使其成为极具潜力的新型计算架构。 虽然学术界和产业界尚未就存算一体技术的分类达成共识,但目前已经发展出多种技术路径,包括近内存计算(NMC)、存储级内存(SCM)、近存储计算(NSC)和存内计算(IMC)等。这些技术路径各有特点,适用于不同的应用场景。 目前,Flash、SRAM、DRAM等成熟的存储介质已经被广泛用于存算一体技术,同时ReRAM、MRAM等新型存储介质也在不断发展。 NorFlash是一种非易失性存储介质,但其在工艺制程上存在明显瓶颈,因此适用于小规模的数据存储。 DRAM的成本低、容量大,但速度较慢,需要不断刷新以保持数据存储。 SRAM在速度和能效比方面具有优势,特别是在存内逻辑技术发展起来之后具有高能效和高精度的特点。 HBM(高带宽内存)方案是近存计算的典型技术,可以解决存算分离导致的“存储墙”问题,包括存储单元的带宽问题和存储单元与计算单元之间键数据传输的能效问题。HBM方案中存储Die的垂直堆叠也增大了容量,因此HBM技术完美契合当前GPU对更多内存和更高带宽的刚性需求。 HBM结构: 2016年,来自美国加州大学的研究团队提出了使用RRAM构建存算一体架构的深度学习神经网络(PRIME)。相较于传统的冯诺伊曼架构方案,PRIME可以实现约20倍的功耗降低和约50倍的速度提升。 但是,虽然RRAM具有高速和结构简单的优点,但其距离工艺成熟还需要2-5年,且材料稳定性有待提高。 长期来看,RRAM仍然有望成为未来发展最快的新型存储器,并成为下一代主流研究方向。 03 存算一体市场格局梳理存算一体技术起源于国外,其产业化进程比国内要早3-5年左右。 目前,国外已有一些企业走在商业化前列,其中以SST、Syntiant和Mythic为代表。其中,SST在IP授权方面处于领先地位,且已经有很多芯片大厂愿意购买其产品。 不过,由于存算一体技术的配套工具尚处于探索阶段,缺乏成熟的配套工具,因此基于存算一体技术的产品在短期内(5年左右)主要以小规模量产为主。 从存算一体发展历程来看,自2017年起,英伟达、微软、三星等大厂提出了存算一体原型,同年国内存算一体芯片企业开始涌现。 大厂对存算一体架构的需求是实用且落地快,而作为最接近工程落地的技术,近存计算成为大厂们的首选。诸如特斯拉、三星、阿里巴巴等拥有丰富生态的大厂以及英特尔、IBM等传统芯片大厂都在布局近存计算。 从方案落地情况来看,英特尔选择了基于SRAM的可配置存储器,而三星则选择在DRAM的DRISA架构上进行存算一体解决方案。 国内初创企业则聚焦于无需考虑先进制程技术的存内计算。其中,知存科技、亿铸科技、智芯科、九天睿芯等初创公司都在押注“存”与“算”更亲密的存算一体技术路线。 亿铸科技、千芯科技、阿里达摩院等专注于大模型计算、自动驾驶等AI大算力场景;闪易、新忆科技、苹芯科技、知存科技等则专注于物联网、可穿戴设备、智能家居等边缘小算力场景。 此外,包括恒烁股份、杭州柯林、中科微至、润欣科技和罗普特等在介质和技术上具备先发优势。 产业链各环节头部厂商还包括中科曙光、拓维信息、神州数码、浪潮信息、寒武纪、海光信息、龙芯中科、景嘉微等算力厂商;东芯股份、兆易创新、北京君正、澜起科技聚辰股份普冉股份等存储芯片厂商,以及江波龙、佰维存储、德明利等存储模组厂商。 存算一体技术代表了未来AI计算芯片的主流架构。随着全球数据产生量的快速增长,数据产生量呈现爆发式增长。特别是在人工智能、云计算、物联网等领域的快速发展下,市场对数据的收集、存储、处理要求将不断提高。存算一体技术在此背景下具有非常广阔的应用前景。 |