每日經(jīng)濟新聞 2025-04-18 14:07:47
北京大學北京國際數(shù)學研究中心教授董彬接受專訪,探討AI輔助數(shù)學研究的進展。董彬表示,正尋找解開數(shù)學研究隱藏密碼的“萬能鑰匙”,預計今明兩年部分數(shù)學猜想或?qū)⒃贏I輔助下完成。董彬認為,數(shù)學不會因AI發(fā)展走到盡頭,學生學數(shù)學重在培養(yǎng)邏輯思維與推理能力,這些能力在未來仍至關重要。
每經(jīng)記者|丁舟洋 畢媛媛 每經(jīng)編輯|楊夏
在北京大學數(shù)學學院籃球場,曾有司職小前鋒的球員,上籃愛用“數(shù)學思維”規(guī)劃最佳路徑。他是昔日學生隊隊長董彬,也是如今回歸北京大學的“80后”數(shù)學家。
董彬現(xiàn)任北京大學北京國際數(shù)學研究中心教授,兼任北京大學機器學習研究中心副主任,國家生物醫(yī)學影像中心、大數(shù)據(jù)分析與應用國家工程實驗室研究員,北京中關村學院常務副院長,用數(shù)學縱橫應用領域是他的興趣與擅長。他和團隊針對腫瘤診療問題研發(fā)系列新的定量和定性分析算法和工具,在三甲醫(yī)院推廣,部分成果已轉(zhuǎn)化。
近日,《每日經(jīng)濟新聞》記者專訪董彬,探討他在AI輔助數(shù)學研究的最新進展。董彬表示,正在尋找一把“萬能鑰匙”,解開數(shù)學研究中的隱藏密碼。
數(shù)學的每一步跨越都在重塑人類文明演進的底層代碼。正如黎曼幾何奠定廣義相對論基礎,進而催生全球?qū)Ш较到y(tǒng)、天體觀測技術、航天軌道設計??大量未驗證的數(shù)學猜想吸引著全球數(shù)學家攀登,而如果它們能被AI(人工智能)自主破解,這場認知革命的意義遠超技術突破本身。
“我預測,在全球范圍內(nèi),今年或明年就會有一些數(shù)學猜想,在AI的輔助下完成,甚至由AI獨立完成。”董彬說,這也正是他主導的AI for Mathematics(簡稱AI4M)致力于突破的方向。在這場中美激烈角逐的全球數(shù)學智能競賽中,董彬團隊正以中國方案沖擊AI數(shù)學推理的“無人區(qū)”。
董彬所設想的未來充滿挑戰(zhàn),來自事情本身,也來自人。
“2023年我剛開始做時,很多人都覺得我在talking crazy(說瘋話)。”在他看來,若是“學界大佬們”看后斷言此事為天方夜譚,他反倒覺得值得全力以赴。“哪怕會撞到南墻,也要自己撞上去,看看到底是一面石頭做的墻,還是紙糊的墻?而我內(nèi)心堅信此事可行。”
“新基石研究員項目”是一項聚焦原始創(chuàng)新、鼓勵自由探索、公益屬性的新型基礎研究資助項目。2022年,騰訊公司宣布10年內(nèi)出資100億元人民幣,支持富有創(chuàng)造力的科學家開展探索性與風險性強的基礎研究,實現(xiàn)“從0到1”的原始創(chuàng)新。董彬入選了第二期“新基石研究員”。
NBD:您本碩博都學數(shù)學專業(yè),后來轉(zhuǎn)向機器學習和人工智能(AI),投身AI4M,為何有這樣的轉(zhuǎn)變?
董彬:從讀博起,我就參與生物醫(yī)學影像和多個醫(yī)學成像與圖像分析項目。2014年回到北大后,繼續(xù)從事圖像重建、處理,以及基于圖像的診斷與輔助治療等工作。期間深度學習快速發(fā)展,從起步到爆發(fā),再到基礎模型出現(xiàn),讓我思考:借助強大的AI工具,是否突破計算成像領域瓶頸,實現(xiàn)范式革新。
基礎模型能統(tǒng)一處理不同任務、挖掘潛在關聯(lián),受此啟發(fā),我想探索構建統(tǒng)一的計算成像模型或算法。經(jīng)研究發(fā)現(xiàn),各種成像方法在基本原理上,都可歸結為波與物質(zhì)的相互作用。而想打通不同成像模態(tài),關鍵在于構建基于微分方程求解的基礎模型,這也是我在新基石項目中聚焦解決的核心問題之一。
NBD:一把解所有微積分的“萬能鑰匙”會帶來什么?
董彬:若能構建為各類微分方程提供初始解的模型,其影響將遠超出計算成像領域。于是我們著手研究偏微分方程(PDE)基礎模型。有了一維模型雛形后,我發(fā)現(xiàn)工業(yè)仿真、制造業(yè)等諸多領域在實際中都面臨相似難題——亟需通用的微分方程求解工具。這些領域研究者對微積分方程求解的精度要求不高,卻十分看重求解速度,畢竟他們更關心如何利用求解結果解決實際問題,推動領域發(fā)展。因此,他們更需要精度適中、求解極快的微分方程求解器。
就像現(xiàn)在AI能寫很多代碼,但替代不了頂級的架構師。數(shù)學家也是一樣,能提出有意義數(shù)學問題、建立一套理論體系的數(shù)學家,AI會如虎添翼。
NBD:如果有了這把“萬能鑰匙”,AI可以做哪些數(shù)學工作?
董彬:AI能助力數(shù)學家,承擔枯燥繁瑣的驗證工作,未來甚至有望助力證明重要猜想。但這要求數(shù)學家精準把握AI能力,熟練運用AI工具。雖難確切預知這一天何時來臨,但預計未來一兩年會有初步成果。例如,今明兩年,部分數(shù)學猜想或許能借助人工智能完成,形式可能是AI獨立完成,也可能是在數(shù)學家協(xié)作下實現(xiàn)。?
NBD:現(xiàn)在大語言模型也能回答出很多數(shù)學題,這和您研究的AI4M有何不同?
董彬:北京大學的AI評測組會定期測試市面上優(yōu)秀的AI大模型。雖然部分測試題目可能被AI接觸過,經(jīng)過我們評估,當前頂尖語言模型在數(shù)學專業(yè)領域已達到研究生水平。這令人驚訝,但發(fā)揮極不穩(wěn)定,比如我認為它不應該做對的題它能做對,我認為不應該犯錯的題目,它會“陰溝里翻船”。
我希望AI具備比肩頂級數(shù)學家的推理能力,以有效輔助數(shù)學家進行前沿探索,推理能力是AI發(fā)展的“皇冠上的明珠”AI4M不僅是AI賦能數(shù)學,更是雙向賦能。我們希望通過解析數(shù)學家的推理過程,將其應用于AI研究,提升AI的推理能力,同時讓數(shù)學推理能力遷移到其他需要推理的非數(shù)學領域。
NBD:您如何訓練AI的數(shù)學推理能力?
董彬:數(shù)學證明類似“搜索”,每一步都要尋找、嘗試數(shù)學技巧,簡化問題或靠近結論。定理證明可抽象成一個馬爾可夫決策過程,AI需在各狀態(tài)下選最“靠譜”操作,快速構建嚴密證明。數(shù)學家證明時也在探索,但受自身能力和知識局限,單位時間考慮的路徑、運用的技巧遠不如計算機高效全面。這正是AI用于數(shù)學推理的巨大優(yōu)勢:解構數(shù)學家思維,發(fā)揮計算機大規(guī)模搜索和快速計算的長處,能讓AI短時間內(nèi)擁有類似頂級數(shù)學家的推理、證明能力。
數(shù)學對推動人工智能發(fā)展極為關鍵,但目前AI領域工程推進快于理論研究,原因之一是數(shù)學理論研究效率較低,沒有數(shù)學家能精通所有數(shù)學工具。但如果類似鋼鐵俠的人工智能管家——賈維斯,AI全面掌握數(shù)學理論知識,數(shù)學家提供想法與直覺,就能大幅提升效率,縮小理論與實踐間的鴻溝。
董彬期望人工智能不只是智能導航工具,更要成為智能領航員和真正的伙伴。他認為:“一些數(shù)學家在思想、直覺和前瞻性方面具有獨到之處,但在證明技巧和部分工具運用上存在短板,而AI正好可以彌補這一不足。這樣的配合無疑是理想的。”
NBD:怎樣才能確認是AI自身的能力,而非基于數(shù)據(jù)檢索得到的結果呢??
董彬:分清AI是自主思考還是檢索現(xiàn)成答案并非易事。畢竟人類證明時調(diào)取記憶經(jīng)驗,也類似“搜索”。關鍵要看AI能否構建自身數(shù)學知識體系,依據(jù)當下情境自行推導下一步,而非簡單輸出存儲答案。若AI遇到面對新問題能提出全新證明思路,或推導步驟邏輯連貫合理,并非拼湊已知結果,那就說明它在真正“思考”,借此可更好判斷它是否具備自主推理能力。
NBD:若未來舉辦人類和AI的數(shù)學“刷題大賽”,人類還有機會勝出嗎?
董彬:人類和AI培養(yǎng)邏輯推理都需要大量“刷題”,但AI刷題速度遠超過人類。人類解一道題的時間,AI能解千上萬道。數(shù)學對錯標準明確,這種效率差距更突出。這類似圍棋比賽,起初人們認為計算機難敵頂級高手,可AI憑計算和訓練速度優(yōu)勢最終獲勝。數(shù)學領域也如此,AI訓練效率提升幾個量級后,極短時間就能達到極高推理水平,在“刷題大賽”中碾壓人類。因此,從效率和題量看,人類幾乎沒機會在這類比賽中勝出。這并非人類邏輯思維不行,而是AI在解題速度和規(guī)模上優(yōu)勢巨大。?
NBD:您希望培養(yǎng)頂級AI數(shù)學家,還是為數(shù)學家打造個頂級AI工具??
董彬:AI與頂級數(shù)學家應相輔相成,能力需接近他們,就像數(shù)學家傾向挑選資質(zhì)出眾的學生。服務頂級數(shù)學家的AI,自身能力必須與數(shù)學家相當。從人類視角,創(chuàng)新源于知識和推理能力結合。如今模型已積累海量知識,若再有頂尖人類的推理能力,就能開啟真正創(chuàng)新,畢竟人類創(chuàng)新依賴這兩種能力融合。?
學生要加入AI4M這個持久戰(zhàn),難免會因短期難發(fā)論文有所顧慮。董彬理解他們的壓力,同時也積極引導:不是不發(fā)論文,而是要提升論文質(zhì)量。“學生能發(fā)四五篇那種看摘要就知道研究套路、只是表述出彩的論文。我允許我的博士在畢業(yè)時只發(fā)一兩篇論文,但這些論文一定要讓人看了眼前一亮,會驚嘆:這件事居然還能這么做!”
NBD:您擔心數(shù)學會發(fā)展到盡頭嗎?或“吞并”所有學科?數(shù)學會走到盡頭嗎
董彬:數(shù)學永遠不會因為某些重大猜想被AI解決而走到盡頭。數(shù)學是一種語言,即使現(xiàn)有表述內(nèi)容被攻克,還能創(chuàng)造新詞匯、概念,來描述自然界機制。把數(shù)學領域看作球體,其存在代表未完善部分的孔洞。過往數(shù)學家致力于填補孔洞、架起橋梁、完善內(nèi)部結構。通用人工智能出現(xiàn)后,孔洞可能自動被修補,促使數(shù)學家將精力轉(zhuǎn)向拓展球體邊界,即擴充數(shù)學知識邊界。
NBD:與全球開展同類研究的團隊相比,你們研究進展速度如何?
董彬:谷歌DeepMind團隊是我們最大的競爭對手。2024年,我又喜又憂:喜的是發(fā)現(xiàn)DeepMind技術路徑與我們不謀而合,證明方向前景廣闊;憂的是,因為谷歌算力遠超我們,這促使我們調(diào)整目標和技術路徑,避免正面算力競爭。
評估DeepMind的內(nèi)部研究進展非常困難。盡管在解決當前研究難題(尤其是獲取高質(zhì)量數(shù)據(jù))方面,DeepMind并沒有明顯的優(yōu)勢,但在算力等資源方面卻具備一定優(yōu)勢,因此整體競爭態(tài)勢難以判斷。
另一方面,中國也擁有獨特的優(yōu)勢。廣泛且深厚的數(shù)學教育為我們的研究打下了堅實的基礎,團隊中聚集了頂級的基礎數(shù)學家,在領域知識和理論深度上表現(xiàn)突出,我們在關鍵環(huán)節(jié)上有獨到的視角和方法,這使得我們有望在競爭中取得突破。
NBD:若不久后AI能解所有數(shù)學題,現(xiàn)在學生學數(shù)學是學什么?
董彬:即使未來AI可解決所有數(shù)學題,學生學數(shù)學仍意義重大。數(shù)學核心是培養(yǎng)邏輯思維與推理能力,這些能力在各領域都至關重要。現(xiàn)在大模型訓練推理能力,也不只為解數(shù)學題,而是希望應用于其他學科。這和各專業(yè)學生都要學數(shù)學同理:無論技術多先進,嚴謹思考、系統(tǒng)分析問題的能力始終不可或缺。
(文中圖片除標注外,均為受訪者供圖)
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP