每日經(jīng)濟新聞 2025-04-30 22:19:26
4月30日,DeepSeek在AI開源社區(qū)Hugging Face上發(fā)布了新模型DeepSeek-Prover-V2-671B。該模型采用DeepSeek-V3架構(gòu),參數(shù)規(guī)模高達6710億,使用MoE模式,并具備61層Transformer層和7168維隱藏層。同日,美股開盤后,英偉達股價下跌3.9%,市值蒸發(fā)1037億美元(約合人民幣7541億元)。此次DeepSeek新模型的發(fā)布,展示了其在AI領(lǐng)域的持續(xù)創(chuàng)新,而英偉達股價的變動也引起了市場的廣泛關(guān)注。
每經(jīng)編輯 張錦河
4月30日,DeepSeek今日于AI開源社區(qū)Hugging Face上發(fā)布了一個名為DeepSeek-Prover-V2-671B的新模型。新模型是專注于數(shù)學定理證明的大語言模型,專門針對形式化數(shù)學證明任務進行優(yōu)化。
DeepSeek-Prover-V2-671B使用了DeepSeek-V3架構(gòu),參數(shù)高達6710億,采用MoE(混合專家)模式,具有61層Transformer層,7168維隱藏層。更令人驚嘆的是,其最大位置嵌入達到了16.38萬,這意味著它能夠處理極其復雜的數(shù)學證明問題。
值得注意的是,3月發(fā)布的V3-0324版本已被業(yè)內(nèi)視為未來R2的基礎模型。這一版本通過6850億參數(shù)的MoE架構(gòu)升級,代碼能力獲得顯著增強。
值得注意的是,4月30日晚美股開盤,英偉達股價下跌3.9%,市值蒸發(fā)1037億美元(約合人民幣7541億元)。
每日經(jīng)濟新聞綜合自公開信息
免責聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請核實。據(jù)此操作,風險自擔。
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP