根據XM外匯官網(wǎng)APP的模型消息,9月29日,正式深度求索推出了DeepSeek-V3.2-Exp模型,發(fā)布方大幅下這是并開(kāi)一個(gè)實(shí)驗版本。該模型采用了稀疏注意力架構,源官專(zhuān)注于優(yōu)化長(cháng)文本的價(jià)格訓練和推理效率。DeepSeek-V3.2-Exp已在官方App、模型網(wǎng)頁(yè)端和小程序上同步更新,正式并且API價(jià)格大幅降低,發(fā)布方大幅下使開(kāi)發(fā)者調用其API的并開(kāi)成本顯著(zhù)減少。
DeepSeek表示,源官V3.2-Exp作為新一代架構的價(jià)格中間步驟,在V3.1-Terminus的模型基礎上引入了DeepSeek Sparse Attention (DSA)機制。此機制在幾乎不影響模型輸出效果的正式情況下,顯著(zhù)提升了長(cháng)文本訓練和推理的發(fā)布方大幅下效率。
該模型已在華為云大模型服務(wù)平臺MaaS上架,華為云繼續采用大EP并行方案進(jìn)行部署。該方案基于稀疏注意力結構,增強了對長(cháng)序列的上下文并行處理,同時(shí)兼顧了模型延遲和吞吐量性能。
為了準確評估稀疏注意力的影響,DeepSeek團隊嚴格對齊了DeepSeek-V3.2-Exp和V3.1-Terminus的訓練設置。在多個(gè)領(lǐng)域的公開(kāi)評測集上,DeepSeek-V3.2-Exp的表現與V3.1-Terminus基本相當。
受到新模型服務(wù)成本大幅降低的影響,官方API價(jià)格已顯著(zhù)下調,新的價(jià)格政策立即生效,使開(kāi)發(fā)者調用DeepSeek API的成本降低超過(guò)50%。