封面新聞?dòng)浾唛Z雯雯實(shí)習(xí)生劉依依
第66屆國(guó)際數(shù)學(xué)奧林匹克(IMO)于2025年7月10—20日在澳大利亞陽(yáng)光海岸舉行,中國(guó)代表隊(duì)奔赴澳大利亞參加比賽,以全體選手獲得金牌的成績(jī),取得團(tuán)隊(duì)第一名的好成績(jī)。本次比賽共有110個(gè)國(guó)家和地區(qū)共計(jì)630名選手參加了比賽。
除了人類(lèi)選手之外,還有兩名AI選手——谷歌的Gemini以及OpenAI的實(shí)驗(yàn)性推理模型兩位“特殊參賽者”參與。最終,這兩名選手都拿到了35分的金牌分?jǐn)?shù)。
奧數(shù)賽場(chǎng)上的“超級(jí)新秀”:AI首次摸到金牌線
谷歌的Gemini此次交出了亮眼答卷,成功解答了六道題中的五道,以35分(滿分42分)達(dá)到金牌線。國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽主席GregorDolinar證實(shí),其解題方法“清晰、精確,大多數(shù)易于理解”,在諸多方面“令人驚嘆”。相較于去年,在英國(guó)巴斯的國(guó)際數(shù)學(xué)奧林匹克比賽中,花費(fèi)2-3天時(shí)間僅解出4道題,獲得銀牌的分?jǐn)?shù),今年的Gemini不僅成績(jī)提升,更在4.5小時(shí)內(nèi)完成解題,效率大幅提升。
OpenAI的實(shí)驗(yàn)性推理模型同樣表現(xiàn)不俗,也獲得了35分的金牌分?jǐn)?shù)。OpenAI的一名研究員表示,該模型在與人類(lèi)完全相同的規(guī)則下進(jìn)行測(cè)試,不借助任何外部工具或網(wǎng)絡(luò),僅憑對(duì)題目的理解,用自然語(yǔ)言寫(xiě)下完整證明過(guò)程,最終由三位前國(guó)際數(shù)學(xué)奧林匹克獎(jiǎng)牌得主嚴(yán)格評(píng)分,確認(rèn)了其金牌水平。
不過(guò)人類(lèi)選手也毫不遜色,在本次競(jìng)賽中,有5位少年獲得了42分的滿分,約10%的人類(lèi)參賽者獲得金牌,表明人類(lèi)在頂級(jí)數(shù)學(xué)思維靈活性上,目前依舊占據(jù)領(lǐng)先地位。其中,中國(guó)代表隊(duì)延續(xù)了傳統(tǒng)優(yōu)勢(shì),6名隊(duì)員全部摘得金牌,團(tuán)體總分排名第一。
從棋盤(pán)到考場(chǎng):AI的“升級(jí)”之路
其實(shí)AI挑戰(zhàn)人類(lèi)智慧的戲碼,早就不是新鮮事了。
1997年,IBM的“深藍(lán)”戰(zhàn)勝國(guó)際象棋棋王卡斯帕羅夫,讓人們初次見(jiàn)識(shí)到AI的潛力;2016年,谷歌Deepmind團(tuán)隊(duì)的AlphaGo擊敗圍棋大師李世石,更是引發(fā)全球轟動(dòng)。從那時(shí)起,AI在棋類(lèi)競(jìng)技中的表現(xiàn)就一路開(kāi)掛,不斷突破人們的想象。
這次在國(guó)際數(shù)學(xué)奧林匹克的成功,是AI發(fā)展的又一重要里程碑。以前的AI解題多靠“暴力計(jì)算”,比如“深藍(lán)”每秒能算2億步棋;現(xiàn)在的AI則學(xué)會(huì)了“巧思”——就像這次解奧數(shù)題,它們能像人類(lèi)一樣講邏輯、寫(xiě)證明,不再是單純的公式堆砌。
人類(lèi)還能“穩(wěn)贏”多久?
AI在國(guó)際數(shù)學(xué)奧林匹克的出色表現(xiàn),不禁讓大家好奇:未來(lái)人類(lèi)智慧還能穩(wěn)坐“寶座”嗎?谷歌DeepMind公司的CEO哈薩比斯大膽預(yù)測(cè),未來(lái)10年AI不僅能解難題,甚至可能擁有想象力。這聽(tīng)起來(lái)有點(diǎn)科幻,但看看AI的發(fā)展速度,似乎也并非天方夜譚。
延伸閱讀:與 人類(lèi)還能:贏多;久 的相關(guān)文章