查看: 23|回复: 0

内存涨价逼出奇招:Meta自研Vistara芯片让新服务器捡旧DDR4用,已部署数百万台

[复制链接]
发表于 前天 02:37 来自手机 | 显示全部楼层 |阅读模式
最近逛ISCA 2026的相关资讯,看到Meta分享的一个挺有意思的降本方案。简单来说,就是内存涨价缺货的大背景下,Meta没选择硬扛成本,而是自己动手搞了套Vistara定制芯片,让新服务器直接把旧机器拆下来的DDR4内存条接着用。这个思路听起来有点"凑合",但看完技术细节之后,我觉得这其实是大型数据中心在供应链压力下的务实解法。

为什么非要这么干?旧内存比服务器更能熬

Meta的数据挺实在:他们自家服务器的预期使用寿命大概3到5年,但拆下来的DDR4内存条还能稳定跑7到10年。也就是说,服务器已经到换代周期了,内存其实还正值壮年。更头疼的是,他们大约有40%的服务器存在内存容量瓶颈,数百万台机器因为内存不够,没法正常处理部分工作负载。

现在内存什么行情大家也知道,DDR5价格居高不下,市面上现成的CXL扩展方案又有个硬伤——不支持复用旧的DDR4模块。这就导致一个尴尬局面:机房里堆着大量还能用的DDR4,新服务器却只能干看着,要么花高价买新内存,要么机器性能受限。Meta算完账之后决定,与其等供应商,不如自己造一座桥。

Vistara ASIC:给DDR4和DDR5搭一座桥

Meta的解法不复杂,但实现起来需要自研芯片打底。他们从退役服务器里拆出DDR4内存,装进原本只认DDR5的新服务器,然后通过自研的Vistara ASIC芯片,把新老内存统一成一个共享内存池来管理。

Vistara ASIC走的是PCIe Gen5 x16接口,每个芯片集成了两个独立的72-bit DDR4通道,能跑到3200 MT/s,单芯片最大可以支持256GB的DDR4容量。在硬件部署上,Meta把这些芯片放进了名为MemServer的专用设备里,单台MemServer配的是AMD Turin处理器(158核、316线程),本地先上768GB DDR5,再通过Vistara ASIC外挂256GB的旧DDR4。

软件层面的调度也做了适配。系统会把这256GB DDR4识别成一个独立的NUMA节点,优先调用本地DDR4来处理任务,不够的时候再向CXL扩展内存伸手。这种分层调度的思路,本质上是用旧内存扛住常规负载,把更贵的CXL扩展资源留给真正需要的场景。

已经在数百万台服务器上跑起来了

这套方案不是PPT。按Meta披露的信息,Vistara目前已经部署在他们数百万台服务器里,实际跑机器学习推理、大数据处理这些业务。论文里的数据也验证了效果:分离式推理场景下,所需服务器数量最多能减少25%;分布式缓存的平均延迟降低了29%。

对于Meta这种体量的公司来说,省下的不只是内存采购成本,还有因为内存不足而被迫闲置的算力资源。毕竟数据中心的每一台机器,只要因为内存瓶颈跑不满,都是在浪费电费和机架空间。

一点看法:大厂的自研芯片开始解决"过日子"的问题了

以前聊Meta自研芯片,大家更多关注的是AI训练卡或者推理加速器。Vistara这个项目让我感觉不一样,它解决的不是"怎么跑得更快",而是"怎么在内存涨价周期里把日子过下去"。这种从实际运营痛点出发的芯片设计,可能比单纯堆算力更有现实意义。

当然,这个方案对普通玩家或者中小公司参考价值有限。你没有数百万台服务器,也没有自研ASIC的能力,旧DDR4该吃灰还是吃灰。但它至少说明一件事:在半导体供应链波动的时候,有技术储备的大厂确实能通过架构创新来对冲成本压力。至于这套方案能不能被更多云厂商借鉴,或者推动CXL生态对旧内存的支持,值得后面继续观察。

scaled_1000132021.webp
万狸温馨提示:理性消费
1.数码选品:先定用途,再比参数,拒绝 “加点钱更好” 的超支诱惑。
2.购车决策:看平台生命周期,算长期使用成本,刚需比潮流更重要。
3.重点提醒:多查真实评价,少信首发噱头,买得对远比买得新划算。
4.交流准则:聊产品讲实际体验,不抬杠不诋毁品牌,友善分享。
5.氛围维护:遇到分歧先理性沟通,不贴“粉黑”标签,温馨交流。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注QQ群
手机版|小黑屋|万狸社区-免费活跃数码论坛,手机/电脑/汽车+旅游美食游戏兴趣社区

相关侵权、举报、投诉及建议等,请发 E-mail:admin@discuz.vip

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|桂ICP备16003785号

在本版发帖
联系客服
QQ客服返回顶部