亚洲人成日本片,国产精品偷窥女精品视频,欧美老妇人在线一区二区三区,国产午夜福利不卡在线观看视频

<s id="2ymhs"></s>

<acronym id="2ymhs"></acronym>

<ol id="2ymhs"></ol>

<s id="2ymhs"></s>

每日經(jīng)濟(jì)新聞

要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

不只是“小升級(jí)”！DeepSeek-R1新版獲海外盛贊，每經(jīng)記者親測挑戰(zhàn)三大編程任務(wù)

每日經(jīng)濟(jì)新聞 2025-05-29 18:44:32

5月29日凌晨，DeepSeek-R1-0528在Hugging Face平臺(tái)開源。此次更新的R1版本在性能上媲美OpenAI的o3模型高版本。每經(jīng)記者通過俄羅斯方塊游戲開發(fā)、太陽系模擬與交互展示，以及根據(jù)英偉達(dá)最新財(cái)報(bào)內(nèi)容設(shè)計(jì)網(wǎng)頁這三項(xiàng)任務(wù)對(duì)R1新版本進(jìn)行了實(shí)測，發(fā)現(xiàn)其編程能力強(qiáng)大，對(duì)物理世界理解和文本提取準(zhǔn)確。

每經(jīng)記者｜宋欣悅每經(jīng)編輯｜蘭素英

5月29日凌晨，DeepSeek-R1-0528正式在Hugging Face平臺(tái)開源。此前一日（5月28日），DeepSeek官方宣布DeepSeek-R1模型已完成小版本試升級(jí)，用戶可通過官方網(wǎng)頁、App、小程序進(jìn)行測試（打開深度思考），API接口和使用方式保持不變。

在此次更新中，模型代碼能力的提升最為顯著。知名代碼測試平臺(tái)LiveCodeBench顯示，更新后的R1性能可以媲美OpenAI o3模型的高版本。

除代碼能力外，R1新版本模型的文本理解與推理能力亦實(shí)現(xiàn)跨越式升級(jí)。其上下文長度拓展至128k，長文本提取的準(zhǔn)確率也有顯著提升。

《每日經(jīng)濟(jì)新聞》記者（以下簡稱“每經(jīng)記者”）通過俄羅斯方塊游戲開發(fā)、太陽系模擬與交互展示，以及設(shè)計(jì)英偉達(dá)最新財(cái)報(bào)網(wǎng)頁這三項(xiàng)任務(wù)對(duì)R1新版本進(jìn)行了實(shí)測，發(fā)現(xiàn)DeepSeek-R1-0528的編程能力確實(shí)強(qiáng)大，對(duì)物理世界的理解以及文本的提取都相當(dāng)準(zhǔn)確。

知名AI評(píng)論人Haider在社交媒體上評(píng)價(jià)稱，這是開源的一大勝利。

瑞士IT咨詢公司CTOL Digital Solutions首席執(zhí)行官M(fèi)ax Zhang則表示，在這一“小”進(jìn)步之后，我們確實(shí)可以期待更大突破（DeepSeek-R2）的到來。

圖片來源：Hugging Face

“小升級(jí)”實(shí)現(xiàn)“大跨越”：升級(jí)后的R1性能媲美o3模型高版本

DeepSeek延續(xù)了其一貫的低調(diào)風(fēng)格，此次升級(jí)率先在微信群進(jìn)行官宣，并輕描淡寫地將其定義為“小版本升級(jí)”。

然而，眾多開發(fā)者實(shí)測后發(fā)現(xiàn)，此次的“小”升級(jí)，并不小。升級(jí)后的DeepSeek-R1，模型能力可以說實(shí)現(xiàn)了跨越式提升。

圖片來源：DeepSeek官方微信群截圖

編碼能力方面，代碼測試平臺(tái)LiveCodeBench顯示，更新后的DeepSeek-R1性能接近OpenAI在4月中旬發(fā)布的o4-mini和o3模型高版本。

據(jù)測試者反饋，DeepSeek-R1-0528能夠一次性生成超千行無Bug代碼，且在HTML/CSS/JS動(dòng)態(tài)交互實(shí)現(xiàn)（如天氣卡片動(dòng)畫、數(shù)據(jù)可視化）中更加精準(zhǔn)。

圖片來源：代碼測試平臺(tái)LiveCodeBench

除代碼能力外，新版本模型的文本理解與推理能力亦實(shí)現(xiàn)跨越式升級(jí)。其上下文長度拓展至128k，長文本提取的準(zhǔn)確率也有顯著提升。

在Extended NYT Connections基準(zhǔn)測試中，相比于前一代DeepSeek-R1，最新的0528版本的提升非常明顯，得分從38.6%大幅升至49.8%。

圖片來源：X

目前，ChatBot Arena也已經(jīng)“上架”了最新版本的DeepSeek-R1，但還沒有任何的測試結(jié)果。

圖片來源：X

記者實(shí)測編程能力

為了更全面地測試DeepSeek-R1-0528的編程能力，每經(jīng)記者設(shè)計(jì)了三項(xiàng)不同難度和類型的編程任務(wù)，包括網(wǎng)頁游戲制作、物理世界模擬、財(cái)報(bào)可視化，來檢驗(yàn)其在實(shí)際場景中的表現(xiàn)。

任務(wù)一：俄羅斯方塊游戲開發(fā)

作為一款經(jīng)典的休閑游戲，俄羅斯方塊游戲的開發(fā)涉及圖形繪制、游戲邏輯處理、用戶交互等多個(gè)方面，能夠很好地考察模型對(duì)于綜合編程知識(shí)的掌握和運(yùn)用能力。

每經(jīng)記者首先向DeepSeek-R1提出需求：“請幫我開發(fā)一個(gè)網(wǎng)頁端俄羅斯方塊小游戲，要求包含游戲分?jǐn)?shù)、彩色方塊及多個(gè)關(guān)卡。”

DeepSeek僅思考了7秒，就開始輸出代碼。然而，初步生成的游戲無法正常運(yùn)作，雖有預(yù)設(shè)的分?jǐn)?shù)與關(guān)卡顯示，但游戲區(qū)域內(nèi)并沒有俄羅斯方塊。

圖片來源：由DeepSeek生成

隨后，記者調(diào)整提示詞，僅提了最基礎(chǔ)的要求，“請幫我寫個(gè)俄羅斯方塊游戲（網(wǎng)頁端），直接可以上手玩。”

簡潔的指令似乎對(duì)DeepSeek-R1-0528更加奏效。這次R1思考9秒，用時(shí)約3分30秒便生成了代碼。

圖片來源：由DeepSeek生成

從游戲頁面來看，色彩搭配鮮明且協(xié)調(diào)，不同顏色的方塊在深色背景下十分醒目，游戲區(qū)域布局合理，操作說明也清晰明了。

在游戲邏輯方面，方塊的下落、移動(dòng)和旋轉(zhuǎn)都很流暢，沒有出現(xiàn)延遲或卡頓現(xiàn)象。

可以說，已經(jīng)具備了一個(gè)成熟俄羅斯方塊游戲應(yīng)有的功能和體驗(yàn)。

任務(wù)二：太陽系模擬與交互展示

接下來，難度升級(jí)。對(duì)于大模型而言，對(duì)物理世界進(jìn)行準(zhǔn)確模擬長期以來都是一項(xiàng)極具挑戰(zhàn)性的任務(wù)。

此次，記者特意選取“行星軌道運(yùn)動(dòng)的物理模擬”這一任務(wù)，在考察其編碼能力的同時(shí)，也考察DeepSeek-R1-0528對(duì)物理世界的理解能力。

記者向R1提出要求——寫一個(gè)太陽系模擬網(wǎng)頁，并且網(wǎng)頁可交互展示。

因?yàn)槿蝿?wù)更復(fù)雜，R1思考時(shí)間也相應(yīng)變長，耗時(shí)54秒后開始輸出代碼。

圖片來源：由DeepSeek生成

可以看出，R1的整體完成度極高，完全可以作為中小學(xué)科普動(dòng)畫的原型演示。

從界面呈現(xiàn)看，太陽居于中心，八大行星依照各自軌道有序排布，色彩搭配也符合人們對(duì)天體的認(rèn)知。此外，行星的大小比例、相對(duì)位置都比較精準(zhǔn)。

在交互功能方面，右側(cè)控制面板設(shè)計(jì)簡潔且功能豐富。

同時(shí)，頁面“行星信息”板塊還以簡潔明了的文字介紹了太陽及各大行星的關(guān)鍵特征，如太陽的質(zhì)量、直徑，水星的公轉(zhuǎn)周期、表面溫度等，兼具科普性與趣味性。

任務(wù)三：設(shè)計(jì)英偉達(dá)最新財(cái)報(bào)網(wǎng)頁

最后，每經(jīng)記者上傳了英偉達(dá)2026財(cái)年第一財(cái)季財(cái)報(bào)的文檔，要求R1根據(jù)財(cái)報(bào)中的內(nèi)容，制作一個(gè)可交互的網(wǎng)頁。

財(cái)報(bào)中數(shù)據(jù)繁雜，文本較長，非?？疾炷Ｐ蜏?zhǔn)確提取文本的能力。

圖片來源：由DeepSeek生成

DeepSeek-R1生成的網(wǎng)頁令人眼前一亮。在視覺呈現(xiàn)上，網(wǎng)頁采用了標(biāo)志性的“英偉達(dá)綠”，顏色搭配協(xié)調(diào)。

數(shù)據(jù)方面，基本做到了準(zhǔn)確無誤，很少出現(xiàn)“幻覺”情況。此外，模型還繪制了柱狀圖、餅圖等圖表，讓復(fù)雜的數(shù)據(jù)變得一目了然。

盡管可能還存在一些細(xì)微的提升空間。比如，在漲跌幅的顏色上，我們通常用紅色表示上漲，綠色表示下跌。但可能由于記者投喂的是美股公司財(cái)報(bào)（美股一般用綠色表示上漲，紅色表示下跌），R1用了與之對(duì)應(yīng)的顏色來展示漲跌幅。

整體來看，R1已充分彰顯其在復(fù)雜任務(wù)處理上的卓越潛力。

“全球AI競賽關(guān)鍵節(jié)點(diǎn)”！DeepSeek-R1新版獲海外盛贊

DeepSeek最新發(fā)布的R1模型升級(jí)版在全球AI領(lǐng)域掀起熱議，多位國際主流科技大佬及行業(yè)高管紛紛發(fā)聲，盛贊其技術(shù)突破。

機(jī)器學(xué)習(xí)研究者kalomaze實(shí)測后贊嘆道，“DeepSeek太出色了。”

Hyperbolic Labs聯(lián)合創(chuàng)始人兼首席技術(shù)官Yuchen Jin表示，新版R1似乎是唯一能回答9.9減9.11等于幾的模型。

知名AI評(píng)論人Haider直呼，這是開源的一大勝利。“DeepSeek王者歸來了。新版本的DeepSeek-R1在編程方面簡直令人難以置信，這是我測試過的最佳模型。”

AI撰稿人喬治·霍普金（George Hopkin）表示，DeepSeek的R1模型更新后，推理和輸出能力大幅提升，標(biāo)志著中國在全球AI競賽中的影響力日益增強(qiáng)。

瑞士IT咨詢公司CTOL Digital Solutions首席執(zhí)行官M(fèi)ax Zhang指出，DeepSeek的最新版R1模型，正悄然成為谷歌Gemini 2.5 Pro的強(qiáng)勁競爭對(duì)手。“這一發(fā)展不僅僅是技術(shù)進(jìn)步，更是全球AI競賽中的一個(gè)關(guān)鍵節(jié)點(diǎn)。該模型憑借其雙倍輸出能力和增強(qiáng)的數(shù)學(xué)推理能力，展示了中國在AI領(lǐng)域的快速崛起。”

DeepSeek此次更新的亮眼表現(xiàn)，為DeepSeek的下一代模型R2注入更多想象空間。Max Zhang表示，在這一“小”進(jìn)步之后，我們確實(shí)可以期待更大突破的到來。

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

DeepSeek 模型 Ai 編程 DeepSeek-R1

上一篇文章

保變電氣：5月29日召開董事會(huì)會(huì)議

返回每經(jīng)網(wǎng)首頁

下一篇文章

國防部回應(yīng)“殲-10CE擊落多架戰(zhàn)機(jī)，首次取得實(shí)戰(zhàn)戰(zhàn)果”！殲-10CE模型在國外被火爆圍觀！“A鎖B射C導(dǎo)”大揭秘

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

關(guān)注我們
辟謠專區(qū)

加入我們
招聘專頁

Copyright ? 2025 每日經(jīng)濟(jì)新聞報(bào)社版權(quán)所有，未經(jīng)許可不得轉(zhuǎn)載使用，違者必究。

廣告熱線? 北京: 010-57613265，?上海: 021-61283008，?廣州: 020-84201861，?深圳: 0755-83520159，?成都: 028-86512112

網(wǎng)絡(luò)社會(huì)征信網(wǎng)

兒童色情信息舉報(bào)專區(qū)

成都市互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

四川省互聯(lián)網(wǎng)舉報(bào)中心

中國互聯(lián)網(wǎng)舉報(bào)中心

每日經(jīng)濟(jì)新聞互聯(lián)網(wǎng)不良與違法信息舉報(bào)中心

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：51120190017 網(wǎng)站備案號(hào)：蜀ICP備19004508號(hào)-3 川公網(wǎng)安備 51019002002026號(hào)

新聞職業(yè)道德監(jiān)督熱線：400 889 0008 郵箱：zbb@nbd.com.cn

<object id="brsni"></object>

<menu id="brsni"></menu>

<span id="brsni"><font id="brsni"></font></span>

<dfn id="brsni"><var id="brsni"></var></dfn>