應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

摩爾線程夸娥智算中心擴展至萬卡規(guī)模,具備萬 P 級浮點運算能力

2024-07-04 08:50 IT之家
關(guān)鍵詞:摩爾線程智算中心

導(dǎo)讀:摩爾線程宣布,其 AI 旗艦產(chǎn)品夸娥(KUAE)智算集群解決方案從當(dāng)前的千卡級別擴展至萬卡規(guī)模。

  7 月 3 日消息,摩爾線程宣布,其 AI 旗艦產(chǎn)品夸娥(KUAE)智算集群解決方案從當(dāng)前的千卡級別擴展至萬卡規(guī)模。

  摩爾線程夸娥萬卡智算集群,以全功能 GPU 為底座,打造能夠承載萬卡規(guī)模、具備萬 P 級浮點運算能力的國產(chǎn)通用加速計算平臺,專為萬億參數(shù)級別的復(fù)雜大模型訓(xùn)練而設(shè)計。

  夸娥萬卡智算解決方案具備以下核心特性:

  萬卡萬 P:夸娥智算集群實現(xiàn)單集群規(guī)模超萬卡,浮點運算能力達(dá)到 10Exa-Flops,達(dá)到 PB 級的超大顯存總?cè)萘?、每?PB 級的超高速卡間互聯(lián)總帶寬和每秒 PB 級超高速節(jié)點互聯(lián)總帶寬。

  長穩(wěn)訓(xùn)練:摩爾線程夸娥萬卡集群平均無故障運行時間超過 15 天,最長可實現(xiàn)大模型穩(wěn)定訓(xùn)練 30 天以上,周均訓(xùn)練有效率在 99% 以上,遠(yuǎn)超行業(yè)平均水平。

  高 MFU:夸娥萬卡集群在系統(tǒng)軟件、框架、算法等層面一系列優(yōu)化,實現(xiàn)大模型的高效率訓(xùn)練,MFU(評估大模型訓(xùn)練效率的通用指標(biāo))最高可達(dá)到 60%。

  生態(tài)友好:可加速 LLM、MoE、多模態(tài)、Mamba 等不同架構(gòu)、不同模態(tài)的大模型。基于 MUSA 編程語言、完整兼容 CUDA 能力和自動化遷移工具 Musify,加速新模型“Day0”級遷移。

  IT之家獲悉,摩爾線程將開展三個萬卡集群項目,分別為青海零碳產(chǎn)業(yè)園萬卡集群項目、青海高原夸娥萬卡集群項目、廣西東盟萬卡集群項目。