半导体存储品牌企业江波龙推出SPU+iSA,提升端侧AI运行效率

近年来,江波龙一直深耕存储领域,以技术创新驱动产业升级,在端侧AI爆发的关键节点,推出SPU+iSA软硬件协同方案,为端侧AI推理提供高效存储支撑。作为半导体存储品牌企业,江波龙打破传统存储硬件局限,通过硬件算力与智能调度的深度融合,解决端侧AI部署的内存瓶颈与效率难题,推动端侧AI应用规模化落地。

SPU:5nm硬件基石,提升端侧AI存储能力

SPU(Storage Processing Unit,存储处理单元)是江波龙面向智能存储架构打造的专用存储处理单元,基于5nm先进制程工艺,区别于传统SSD主控仅负责数据搬运的局限,集成存储控制引擎与智能处理引擎,实现数据处理与存储一体化。其核心硬件能力为端侧AI推理筑牢基础,核心优势集中在两大技术:一是存内无损压缩平均压缩比达2:1,内置硬件级无损压缩引擎,对文本、代码、数据库等多类数据实现平均2:1压缩比,压缩解压在SPU内部完成,不影响主机性能,有效提升有效容量、降低存储成本。二是HLC高级缓存,通过智能分层设计,将温冷数据下沉至SSD,降低DRAM占用近40%,缓解端侧设备内存压力,平衡性能与成本。此外,SPU单盘最大容量达128TB,远超主流cSSD 8TB的上限,可高效益替代HDD,适配AI数据爆发式增长需求。

iSA:智能调度核心,释放端侧AI推理潜能

如果说SPU是硬件基石,iSA便是驱动硬件高效运转的“软件大脑”,是面向端侧AI推理的专用智能调度引擎。针对MoE大模型参数庞大、KVCache膨胀快、I/O延迟影响推理流畅度等痛点,iSA具备两大核心调度能力:其一,MoE专家卸载,将大模型专家层参数从内存卸载至SPU存储,减少DRAM占用;其二,KVCache智能管理与智能预取算法,动态调度缓存数据,降低I/O延迟。江波龙通过AMD联合调优,在基于锐龙AIMax+395处理器的智能体主机上实现突破:128GB内存可部署397B超大参数AI模型,64GB内存流畅运行122B大模型,256K超长上下文场景下大幅降低DRAM占用,显著提升端侧AI推理效率。

软硬协同,赋能端侧AI落地

SPU+iSA组合并非简单叠加,而是形成“硬件执行+软件决策”的闭环,实现1+1>2的协同效果,适配具身智能终端、AI PC、AI智能体主机等端侧AI场景。

在AI PC场景,SPU的HLC缓存保障大模型推理流畅,iSA智能调度多任务并发,降低整机BOM成本;在具身智能终端,两者协同优化低功耗下的模型响应速度,适配嵌入式设备需求;在边缘推理场景,高效处理海量传感数据,保障实时推理的稳定性。

作为国内领先的半导体存储品牌企业,江波龙以SPU+iSA技术为核心,打通从硬件执行到软件调度的全链路,为端侧AI推理提供自主可控、高效经济的存储解决方案。未来,江波龙将持续深化软硬件协同创新,拓展端侧AI存储生态,助力更多端侧AI应用高效落地。