本屆人工智能大會的論壇有點不一樣。
7月26日,2025世界人工智能大會在滬開幕。為了讓大會論壇更具思辨性,本屆大會特意設(shè)置了“AI三問”系列論壇,將學界與業(yè)界的專家聚焦起來,一同探討AI在數(shù)學、科學、模型領(lǐng)域最關(guān)鍵的行業(yè)問題。
大會開幕兩日來,系列論壇上嘉賓們的觀點層出不窮,問題形形色色,但共通點在于,大家都談到了AI技術(shù)快速發(fā)展,正在為自身行業(yè)帶來范式性的變革。當AI浪潮不斷奔涌,關(guān)鍵學科正站在發(fā)展的十字路口。
數(shù)學之問
MathforAI還是AIforMath?
當前,人工智能與數(shù)學的邊界逐漸模糊。一方面,大模型參數(shù)突破萬億,傳統(tǒng)基于經(jīng)驗的調(diào)參方法陷入瓶頸,模型的泛化能力、安全性、能耗控制等核心問題,亟待數(shù)學理論的系統(tǒng)性支撐;另一方面,AI對數(shù)學的反哺效應(yīng)越發(fā)顯著,DeepMind開發(fā)的AI系統(tǒng)AlphaGeometry,在證明歐幾里得平面幾何定理方面超越國際數(shù)學奧林匹克競賽參賽者平均水平,改寫數(shù)學研究范式。
所以,數(shù)學與人工智能的關(guān)系是什么?到底是MathforAI還是AIforMath?這種雙向需求的碰撞,讓“數(shù)學之問”成為2025WAIC“AI三問”的起點——在2025WAIC“人工智能的數(shù)學邊界與基礎(chǔ)重構(gòu)”論壇現(xiàn)場,科學家們試圖求解。
有學者站在MathforAI一方。
菲爾茲數(shù)學科學研究院可持續(xù)發(fā)展中心主席路易斯·塞科認為,人工智能的誕生基于積累幾千年的數(shù)學智慧,故而其未來的進步也將依賴于數(shù)學未來的發(fā)展。
中國科學院院士徐宗本也認為,發(fā)展人工智能必須從基礎(chǔ)研究、原始創(chuàng)新抓起,這才是正確之路。
而另一方,AI現(xiàn)場自證實力——著名數(shù)學家、首位華人菲爾茲獎獲得者丘成桐現(xiàn)場出題,上海人工智能實驗室、商湯科技、階躍星辰、MiniMax四個基礎(chǔ)大模型現(xiàn)場解題并展示推理過程。
上海人工智能實驗室拿到的是2025國際數(shù)學奧林匹克競賽的一道幾何題;階躍星辰拿到的是不等式極值求解題;MiniMax拿到的是概率遞歸題,需要給N對襪子配對;商湯科技拿到的是平面幾何題。
這場數(shù)學競賽結(jié)果是,上海AI實驗室的Intern-IMO成功破解題目,獲官方認可;商湯“日日新”整個解答邏輯清晰,層層遞進,展現(xiàn)多路徑推理能力;階躍星辰在不等式證明中調(diào)用工具修正錯誤,最終完成形式化驗證;而MiniMax的M1不僅解出原題,還正確地回答了“條件減弱后,結(jié)論是否成立”。
MathforAI還是AIforMath?并沒有絕對的答案。但是2025WAIC釋放出一個強烈信號:人工智能的發(fā)展,必須夯實數(shù)學基礎(chǔ)理論、發(fā)展原始創(chuàng)新?!皵?shù)學界非常重視數(shù)學與AI模型的協(xié)同,目前國內(nèi)已形成三、四支核心研究力量。這是個好現(xiàn)象,上海開了一個很好的頭?!毙熳诒菊f。
2025世界人工智能大會。新華社照片
科學之問
AI是否會引發(fā)學科融合和科研范式變革?
在27日的一場思辨會上,一位年輕研究員提問:“現(xiàn)在大家都很肯定科學基礎(chǔ)大模型,但大模型需要涵蓋不同的學科,如何兼容各學科的廣度和深度呢?”
這個年輕人的疑惑,也是近年來困擾科學界的一個關(guān)鍵問題。大模型爆火后,科學界就一直在關(guān)注,是否能開發(fā)用于科研的科學基礎(chǔ)大模型。但在本屆人工智能大會上,記者了解到,由于跨學科難度大,對不同學科數(shù)據(jù)要求不一樣,科學基礎(chǔ)大模型的開發(fā)應(yīng)用面臨諸多挑戰(zhàn)。
當場不少科學家嘗試回答年輕人的問題?!拔覀儸F(xiàn)在的科學基礎(chǔ)大模型,就像三十年前的電腦操作系統(tǒng),能做的事很有限,能加載的應(yīng)用程序也很有限。我們需要先把這個底座打好,再反復迭代,之后才能支持各個專業(yè)學科進行更深層次的拓展和創(chuàng)新?!敝袊茖W院自動化研究所副所長曾大軍說。
盡管科學基礎(chǔ)大模型目前還處于“打地基”階段,但科學界對于學科融合的大方向是十分堅定的。在場幾乎所有科學家都認同,AI將推動科學界學科融合,并引發(fā)科研范式的變革,“我們?nèi)擞芯窒扌裕刻熘挥?4小時還要睡覺和休息,但人工智能可以克服這些,只要有算力支撐,再加上算法優(yōu)化,機器一定能做到跨學科知識的融合。”
有人拿多模態(tài)大模型舉例,最開始,文字大模型和圖像大模型是并行的,現(xiàn)在慢慢融合,所以基礎(chǔ)科學大模型也可能如此,開始時各學科各自獨立,最后會融合到一起。
如何加速推進跨學科的基礎(chǔ)科學大模型建構(gòu)?答案可能是“開放”。中國工程院院士,之江實驗室主任王堅表示:“AI重構(gòu)的科研范式是開放的科學范式,不僅僅是賦能科學家,甚至是人人都可能成為科學家,我們傳統(tǒng)認識中的科學,也正在發(fā)生變化?!?/p>
他舉例說明,就在兩個月前,一位美國高中生利用NASA公開在網(wǎng)上的NEOWISE望遠鏡的觀測數(shù)據(jù),通過人工智能技術(shù)發(fā)現(xiàn)了150萬個新天體,并且作為唯一作者,在天文學頂級期刊上發(fā)表了研究成果。而他發(fā)明的算法,被其他團隊用來進行天體研究,同樣也產(chǎn)出了不錯的成果。王堅說:“開放科學范式的構(gòu)建,在今天顯得前所未有的重要?!?/p>
2025世界人工智能大會。新華社照片
模型之問
模型泛化能力不足是否源于架構(gòu)局限?
大模型產(chǎn)業(yè)同樣在經(jīng)歷范式變革。在過去這大半年的時間里,主流的大模型訓練模式,從原來的由OpenAI所開創(chuàng)的,以預訓練為主、監(jiān)督學習為輔的范式,逐漸轉(zhuǎn)移到了注重提升推理能力的強化學習范式。
這一變化與人類對大模型性能要求的提高有關(guān)。隨著近年來大模型的應(yīng)用不斷深入,人們發(fā)現(xiàn),一些大模型在特定數(shù)據(jù)集上準確率達到99%,卻會在現(xiàn)實場景中頻繁翻車。業(yè)界開始反思,模型的泛化能力不足,是否是因為架構(gòu)設(shè)計本身出了問題。
也就是在這個時候,DeepSeek橫空出世,讓人們見識到強化學習的優(yōu)勢。傳統(tǒng)預訓練模式,通過海量文本數(shù)據(jù)的學習,讓大模型掌握語法、語義以及常識性知識,從而能夠在多種任務(wù)上做出回應(yīng)。強化學習模式,是通過讓大模型不斷試錯,在與環(huán)境的交互中逐漸改進性能。這種方法彌補了數(shù)據(jù)不足帶來的限制,還能讓模型在復雜任務(wù)中表現(xiàn)得更加智能。
“傳統(tǒng)的訓練范式在面對復雜的選擇時,也無法給出決策。強化學習最了不起的地方在于,大模型能夠自推理,找到一條邏輯自洽的因果鏈達成目標,這就能顯著提升大模型的性能?!彪A躍星辰首席科學家張祥雨說。
但強化學習模式也有其弊端之處。商湯科技聯(lián)合創(chuàng)始人、首席科學家林達華表示,使用強化學習訓練模式的大模型幻覺現(xiàn)象會更加明顯,思考過程較為冗長。
業(yè)界認為,強化學習并不是“終點”,范式的變革仍將繼續(xù)。上海人工智能實驗室青年領(lǐng)軍科學家、書生大模型負責人陳愷認為,只能接受確定性的、數(shù)學代碼式的反饋,是強化學習當前面臨的瓶頸問題,未來強化學習還需解決“如何接受自然場景非確定性答案”。
原標題:《2025世界人工智能大會:有關(guān)AI的三個“靈魂之問”》
欄目主編:孟群舒
來源:作者:解放日報吳丹璐俱鶴飛
使用HTML5和CSS3設(shè)計響應(yīng)式網(wǎng)頁
前端必學 40個精選案例實戰(zhàn) 一課吃透HTML5+CSS3+JS
2022年適合大學生和自學者的web前端學習路線