Day-0支持|摩爾線程率先完成MiniMax M2.7大模型適配
關(guān)鍵詞: 摩爾線程 MTT S5000 MiniMax AI大模型適配 GPU
4月12日,摩爾線程旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000已完成對(duì)新一代大模型MiniMax M2.7的Day-0極速適配,再次驗(yàn)證了國(guó)產(chǎn)全功能GPU對(duì)前沿AI大模型的快速響應(yīng)與穩(wěn)定支撐能力。
MiniMax M2.7是業(yè)界首個(gè)具備深度自我進(jìn)化能力的大模型,能夠自主構(gòu)建Agent Harness,通過(guò)Agent Teams協(xié)作、復(fù)雜Skills調(diào)用及Tool Search Tool等能力完成復(fù)雜生產(chǎn)力任務(wù),甚至深度參與自身迭代。在軟件工程領(lǐng)域,M2.7支持端到端完整項(xiàng)目交付、日志分析排障、代碼安全審查及機(jī)器學(xué)習(xí)任務(wù);在專業(yè)辦公場(chǎng)景,其Excel/PPT/Word高保真編輯與多輪修改能力顯著提升,即使在超長(zhǎng)上下文復(fù)雜任務(wù)中仍保持穩(wěn)定的高水平skills遵循率。與此同時(shí),該模型對(duì)長(zhǎng)上下文處理、復(fù)雜Agent任務(wù)調(diào)度及高保真編輯等場(chǎng)景提出了極高的計(jì)算效率要求。

針對(duì)上述挑戰(zhàn),摩爾線程技術(shù)團(tuán)隊(duì)基于MUSA架構(gòu)完成深度調(diào)優(yōu),成功在MTT S5000上實(shí)現(xiàn)M2.7大模型的高性能推理,核心技術(shù)優(yōu)勢(shì)包括:
超長(zhǎng)上下文高吞吐:依托MTT S5000的80GB大容量顯存、1.6TB/s高帶寬及PD分離架構(gòu),配合高效KV Cache管理,支撐MiniMax M2.7長(zhǎng)時(shí)間、多步驟任務(wù)的穩(wěn)定執(zhí)行。
全精度端到端支持:MTT S5000原生支持FP8至FP64全精度計(jì)算,可滿足代碼生成、金融建模等場(chǎng)景對(duì)混合精度及高精度計(jì)算的要求,確保決策精準(zhǔn)可靠。 高算力低延遲推理:MTT S5000單卡可提供1000 TFLOPS稠密算力,結(jié)合vLLM-MUSA定制化調(diào)優(yōu),實(shí)現(xiàn)復(fù)雜Agent Harness與高頻工具調(diào)用場(chǎng)景下的低延遲響應(yīng)。 強(qiáng)大生態(tài)兼容性:深度兼容PyTorch、vLLM、SGLang、Triton等主流生態(tài),通過(guò)MUSA C++、Triton-MUSA、TileLang-MUSA等抽象層實(shí)現(xiàn)新算子“零成本遷移”,確保前沿模型發(fā)布當(dāng)日完成極速適配。 此次Day-0適配是摩爾線程常態(tài)化技術(shù)響應(yīng)能力的再次體現(xiàn)。依托 MUSA 架構(gòu)對(duì)主流AI生態(tài)的深度兼容與持續(xù)演進(jìn),國(guó)產(chǎn)全功能GPU算力底座已形成覆蓋前沿模型“極速適配-高效部署”的全鏈路支撐體系,幫助開(kāi)發(fā)者以更快響應(yīng)、更穩(wěn)運(yùn)行、更低遷移成本第一時(shí)間接入最新模型能力,加速大模型創(chuàng)新落地與規(guī)模化應(yīng)用。 開(kāi)發(fā)者可下載鏡像進(jìn)行開(kāi)箱體驗(yàn):
- 華勤技術(shù)港股上市首日漲17% 實(shí)現(xiàn)“A+H”雙資本平臺(tái)布局04-23
- SpaceX計(jì)劃自研GPU,IPO前警告大額支出04-23
- 2026 年一季度中國(guó) GDP 同比增長(zhǎng) 5.0% 國(guó)民經(jīng)濟(jì)實(shí)現(xiàn)良好開(kāi)局04-23
- 足產(chǎn)業(yè)核心,擘畫(huà)未來(lái)新篇:華強(qiáng)電子網(wǎng)喬遷新址03-02
- 硅谷機(jī)器人明星公司K-Scale Labs猝死,融資600多萬(wàn)美元一年燒光!11-14
- 荷蘭高級(jí)代表團(tuán)下周訪華,共商安世半導(dǎo)體問(wèn)題解決方案11-14