10月18日|在韓國首爾舉辦的第31屆操作系統原理研討會(SOSP)上,阿里雲發佈的“Aegaeon”的計算池化解決方案研究成果成功入選,可解決AI模型服務中普遍存在的GPU資源浪費問題。在阿里雲模型市場進行的為期超過三個月的Beta測試中,Aegaeon系統展現了卓越的效能。測試數據顯示,服務數十個參數量高達720億的大模型,所需的英偉達H20 GPU數量從1192個成功減少至213個,數量削減高達82%。