<匯港通訊> 據內地媒體報道,美團(03690)開源了「龍貓」大模型(LongCat-Flash),性能上亦追平了 DeepSeek V3.1 等模型。龍貓是一個擁有5600億參數的混合專家(MoE)模型,最創新是其「零計算」專家機制,即模型可判斷輸入內容中不同部份的重要性,並將計算量較小任務分配給「零計算」專家,從而令模型處理每個詞元(token)時,僅需動態啟動186億至313億參數,實現性能與效率的平衡。 (BC)
#美團 #龍貓 #DeepSeek V3.1
新聞來源 (不包括新聞圖片): 滙港資訊