機(jī)器之心報(bào)道
機(jī)器之心編輯部
就在一夜之間,用AI幫忙搞科研,不是再只是想想了。
最近,科研圈里越來越多的人在討論一種叫SciMaster的「AI科學(xué)助手」,有讓它做實(shí)驗(yàn)的,有讓他幫忙開題的,還有跟他聊科幻的。
仿佛有一個(gè)AI大模型加持的助手就可以包打天下了。
這個(gè)SciMaster是上周在世界人工智能大會(huì)WAIC上,由上海交通大學(xué)、深勢科技與上海算法創(chuàng)新院聯(lián)合發(fā)布的,號(hào)稱全球首個(gè)真正意義的通用科研智能體
發(fā)布之后異?;鸨?,人們都在尋找測試機(jī)會(huì),邀請碼已經(jīng)被炒到近千元。到底是怎樣的AI產(chǎn)品才能讓賣家有如此底氣?
一番努力后,我們獲得了一個(gè)邀請碼,發(fā)現(xiàn)它的水平果然不一樣,可能AI社區(qū)熱炒的「AI科學(xué)家」概念終于有了一個(gè)可實(shí)際應(yīng)用的雛形。簡單來說,它集成了頂尖的思維鏈(CoT)能力,可以自動(dòng)搜索分析文獻(xiàn)、搞理論計(jì)算、做實(shí)驗(yàn)、寫論文以及與人協(xié)作進(jìn)行科研。
SciMaster已經(jīng)超出了此前AI大模型工具的范疇。通過自動(dòng)完成科研流程中最繁瑣的一些環(huán)節(jié),它可以極大提升科研效率。對于全球數(shù)千萬必須在文獻(xiàn)和實(shí)驗(yàn)數(shù)據(jù)上耗費(fèi)大量時(shí)間的科研人員而言,這簡直就是對科研流程的「降維打擊」。
從煉丹到AI科學(xué)家的范式革命
要理解SciMaster的意義,首先須得了解當(dāng)前AI領(lǐng)域的宏觀趨勢。在當(dāng)今這個(gè)被一些觀察者認(rèn)為即將進(jìn)入「AI下半場」的時(shí)代,AI的前沿正從基于海量數(shù)據(jù)和算力的「煉丹」轉(zhuǎn)向「如何將強(qiáng)大的AI能力轉(zhuǎn)變成應(yīng)用」,也即著名數(shù)學(xué)家陶哲軒所說的AI現(xiàn)在應(yīng)該從技術(shù)質(zhì)變走向應(yīng)用量變。
而AI科學(xué)家,正站在這一宏觀趨勢的最前沿。但遺憾的是,雖然我們此前已經(jīng)見證了能自動(dòng)搜索人工生命、發(fā)現(xiàn)新的蛋白質(zhì)或模型架構(gòu)的自動(dòng)研究模型的誕生,但還未有一個(gè)真正可用且實(shí)用的AI科研助手。
SciMaster填補(bǔ)了這一空白。
整體而言,SciMaster的目標(biāo)是成為一個(gè)覆蓋讀、算、做、寫全流程的通用科研AI智能體,是目前AI領(lǐng)域多智能體化的全新探索。
首先是「讀」,SciMaster以玻爾科研空間站為支撐,這是一個(gè)擁有1.7億科研文獻(xiàn)的龐大數(shù)據(jù)庫。當(dāng)用戶提問時(shí),SciMaster會(huì)直接從這個(gè)文獻(xiàn)庫中尋找信息,進(jìn)而把問題自動(dòng)拆分成一系列子任務(wù)(讀、算、做、寫)執(zhí)行,最終生成完整可靠的研究報(bào)告。
與此同時(shí),SciMaster也會(huì)基于互聯(lián)網(wǎng)上的信息,為用戶查詢提供更全面以及更有時(shí)效性的結(jié)果。
機(jī)器之心獲悉,在數(shù)據(jù)檢索和整合過程中,SciMaster的大模型幻覺趨近于零,因?yàn)榇鸢钢忻總€(gè)論斷都可以追溯到源文獻(xiàn)。
其次是「算」。我們知道,智能體系統(tǒng)會(huì)在理解任務(wù)之后進(jìn)行拆分執(zhí)行,SciMaster也是一樣,它會(huì)對任務(wù)拆分出的子問題分別調(diào)用工具,并行執(zhí)行多個(gè)子任務(wù)。如果輸入的問題涉及計(jì)算,它除了會(huì)進(jìn)行搜索、內(nèi)容整合之外還會(huì)調(diào)用各類AIforScience的計(jì)算工具。
SciMaster未來也可以「做」實(shí)驗(yàn)。如果你提出的需求涉及后續(xù)實(shí)驗(yàn)驗(yàn)證,SciMaster可以直接調(diào)用Uni-Lab提供的MCP服務(wù),從而連接自動(dòng)化實(shí)驗(yàn)室系統(tǒng),進(jìn)行濕實(shí)驗(yàn)。最后,數(shù)據(jù)會(huì)返回到科研報(bào)告中。
最后是「寫」,根據(jù)收集到的相關(guān)信息與文獻(xiàn)內(nèi)容,SciMaster的核心模塊之一InfoMaster會(huì)生成深度調(diào)研報(bào)告,支持一鍵導(dǎo)出PDF和鏈接分享。
SciMaster的特點(diǎn)不僅在于自動(dòng)進(jìn)行的科研,也包含一定的人機(jī)協(xié)作機(jī)制。在SciMaster進(jìn)行深度思考、規(guī)劃任務(wù)時(shí),我們可以點(diǎn)擊暫停,在「深度思考」框內(nèi)對任務(wù)邏輯、內(nèi)容進(jìn)行修改,實(shí)時(shí)指揮AI調(diào)整策略,這樣就能讓SciMaster更準(zhǔn)確地響應(yīng)用戶的需求。
看起來一個(gè)既能幫你尋找idea,又能幫你實(shí)現(xiàn)的科研AI出現(xiàn)了,或許這會(huì)成為未來人與AI共同進(jìn)行科學(xué)探索的范式。
SciMaster是這樣煉成的
再仔細(xì)搜索網(wǎng)絡(luò)上的信息,我們發(fā)現(xiàn)其實(shí)在本月初,上海交大、深勢科技就在一篇論文中介紹了SciMaster的工作流程、機(jī)制和能力。該研究在X等社交平臺(tái)上也引發(fā)了關(guān)注。
論文標(biāo)題:SciMaster:TowardsGeneral-PurposeScientificAIAgents論文鏈接:https://arxiv.org/abs/2507.05241
作為SciMaster系列研究成果的PartI,這篇論文關(guān)注的重點(diǎn)是SciMaster智能體所使用的基礎(chǔ)架構(gòu)X-Master
具體來說,如下圖所示,X-Master是深勢科技開發(fā)的一套工具增強(qiáng)型推理智能體:給定一個(gè)用戶查詢,該智能體首先會(huì)開始思考過程。在此過程中,工具調(diào)用等與環(huán)境的交互是通過生成Python代碼片段實(shí)現(xiàn)的。執(zhí)行所得到的結(jié)果將被附加到智能體的上下文中,進(jìn)而豐富其理解并為其后續(xù)思考提供信息。
AI自動(dòng)使用Python代碼來表示交互意圖,意味著其實(shí)現(xiàn)的功能具備通用性、準(zhǔn)確性以及較高的兼容性,讓科研智能體的指令遵循能力大大加強(qiáng)。
X-Master是一款工具增強(qiáng)推理智能體。
在上圖這個(gè)具體案例中,X-Master智能體進(jìn)行三次交互(搜索以獲取GitHub鏈接,解析以獲取arXiv論文鏈接,然后再次解析以獲取所屬機(jī)構(gòu)),然后得出了最終答案。
工作流程上,X-Master采用了一種名為scattered-and-stacked(分散-堆疊)的智能體工作流程。
該工作流程是讓X-Master扮演不同角色,以在推理時(shí)提高解答的質(zhì)量。其中包括:(1)求解器(Solver)生成五個(gè)初始解答;(2)批評器(Critic)對初始解答進(jìn)行細(xì)化;(3)重寫器(Rewriter)綜合所有五個(gè)解答并生成五個(gè)新解答;(4)選擇器(Selector)挑選最佳解答。
X-Masters在高難度的Humanity'sLastExam(HLE,人類最后考試)基準(zhǔn)上創(chuàng)造了新的SOTA記錄,得分達(dá)到32.1%,超過了OpenAI和谷歌的DeepResearch(分別為26.6%和26.9%),在2025年六月底,成為了首個(gè)突破HLE30%大關(guān)的方案。
基于X-Master的配置,大模型可以基于靈活的內(nèi)部推理和工具使用來模擬人類的問題解決方式,基于開源模型就能在HLE等具有挑戰(zhàn)性的基準(zhǔn)上達(dá)到極高的性能,無需大量再訓(xùn)練即可增強(qiáng)LLM能力。
我們可以期待一下SciMaster系列研究的后續(xù)Part了。
在SciMaster幫助下搞科研
我們實(shí)測了一下
那么,SciMaster的實(shí)際表現(xiàn)如何呢?
在玻爾科研空間站(Bohrium)中打開SciMaster,首先映入眼簾的其預(yù)置的兩大能力:通用助手深度調(diào)研
鏈接:https://scimaster.bohrium.com
其中,通用助手更適用于科研日常中遇到的一般問題查詢,比如檢索基本概念、查詢實(shí)驗(yàn)流程、甚至提出《十萬個(gè)為什么》那樣的基礎(chǔ)科普問題。
深度調(diào)研則是一個(gè)具備DeepResearch能力的「科研專家」。當(dāng)研究者提出一個(gè)科學(xué)問題時(shí),SciMaster會(huì)對問題進(jìn)行評估分析,將問題拆分成多個(gè)子任務(wù),并靈活調(diào)用WebSearch、WebParse、PaperSearch三種檢索方式,檢索全域互聯(lián)網(wǎng)、全量文獻(xiàn),收集領(lǐng)域相關(guān)的資訊、數(shù)據(jù)、論文、專利等資料。最后經(jīng)過整理,SciMaster會(huì)向交付用戶一份翔實(shí)可靠的調(diào)研報(bào)告。
接下來,我們就通過一些實(shí)際任務(wù)來看看SciMaster究竟能做到什么程度?
首先,為了直觀地展示SciMaster的能力,我們向其通用助手提出了一個(gè)經(jīng)典的科普問題:「為什么細(xì)胞是球形的?」
可以看到,SciMaster首先會(huì)進(jìn)行深度思考,對問題進(jìn)行初步的分析,然后確定所要使用的工具,包括使用web_search來獲取一些基礎(chǔ)知識(shí)以及再使用science_navigator查找是否有相關(guān)論文討論細(xì)胞形態(tài)的物理原理。
之后,SciMaster便會(huì)開始編寫一些Python腳本并實(shí)際執(zhí)行這些工具,如果代碼執(zhí)行出錯(cuò),SciMaster還會(huì)進(jìn)行反思,并對出錯(cuò)的部分進(jìn)行修正。而如果工具返回的結(jié)果不理想,它可能還會(huì)更換關(guān)鍵詞再次搜索。這種探索+嘗試的方式極大地模擬了人類專家解決問題的思路。
上圖右側(cè),我們可以看到其第一次成功執(zhí)行web_search后所檢索到的部分結(jié)果。在上面,我們也可以切換瀏覽不同工具執(zhí)行后得到的結(jié)果。
而當(dāng)需要更專業(yè)的生物物理學(xué)解釋時(shí),SciMaster會(huì)通過science_navigator工具查詢專業(yè)文獻(xiàn),從而確保結(jié)果準(zhǔn)確,避免幻覺。整個(gè)過程完整透明。
經(jīng)過一系列的探索和信息整合,SciMaster最終會(huì)給出一個(gè)綜合答案。可以看到,SciMaster不僅從物理和生物學(xué)角度解釋了細(xì)胞為球形的優(yōu)勢,同時(shí)還點(diǎn)明了我們提問中一個(gè)預(yù)設(shè)的錯(cuò)誤前提——「細(xì)胞是球形的」。實(shí)際上,SciMaster指出,并非所有細(xì)胞都趨于球形,比如神經(jīng)元和肌肉細(xì)胞分別呈現(xiàn)星形分支和長纖維狀。
下圖展示了SciMaster解答這個(gè)問題的全過程。
與此同時(shí),SciMaster還提供了便捷的分享功能,可以一鍵生成分享整個(gè)解答過程的鏈接,將所得到的結(jié)果分享出去,從而可以共享優(yōu)質(zhì)成果,避免重復(fù)計(jì)算,實(shí)現(xiàn)更加有效的溝通。比如,你可在此處查看上述查詢和解答:
https://scimaster.bohrium.com/chat/share/86c2ef04aef7477b8df3c7bdba3cc2cb
再來一個(gè)更有爭議的問題:「轉(zhuǎn)基因食物是否有害健康?」
同樣,SciMaster依然首先是簡單分析問題,然后使用web_search工具,以形成對問題本身的初步了解。在通過互聯(lián)網(wǎng)獲得了來自權(quán)威機(jī)構(gòu)的信息之后,SciMaster也并未盲信,依然繼續(xù)進(jìn)行了專業(yè)檢索,最終得出了結(jié)論:「通過安全評價(jià)的轉(zhuǎn)基因食品與傳統(tǒng)食品同等安全,無證據(jù)表明其危害人類健康?!?/p>
而在此基礎(chǔ)上,為了做到概念明確,我們還可以繼續(xù)追問:「什么是通過安全評估的轉(zhuǎn)基因食品?」而這一次,SciMaster的思考就更加深度了。不僅引述了多個(gè)權(quán)威的定義標(biāo)準(zhǔn),還給出了一些典型案例、政策以及依舊存在的爭議現(xiàn)狀。
接下來,該讓SciMaster深度調(diào)研上場炫技了:「為CRISPR基因編輯寫一份綜述報(bào)告」。
可以看到,與通用助手類似,SciMaster同樣第一步是分析問題;不同的是這一次其分析的深度和廣度都有明顯提升,另一個(gè)非常明顯的區(qū)別是在使用深度調(diào)研時(shí),SciMaster的工作語言會(huì)切換成英語,如此能夠針對專業(yè)術(shù)語等進(jìn)行更加深度的搜索,避免了專業(yè)文獻(xiàn)在翻譯過程中可能出現(xiàn)的錯(cuò)漏和幻覺問題。
然后,它會(huì)制定更加詳細(xì)的計(jì)劃,包括綜述報(bào)告的內(nèi)容規(guī)劃、所要用到的工具以及具體將要執(zhí)行的研究步驟。
實(shí)際上,這個(gè)過程背后,正是其論文中提到的分散-堆疊的智能體工作流程在發(fā)揮作用。多個(gè)智能體分別扮演求解器、批評器、重寫器和選擇器,通過層層探索和優(yōu)化,以確保報(bào)告的深度和廣度。
接下來,SciMaster便會(huì)按照自己的計(jì)劃逐步執(zhí)行,并最終生成一份內(nèi)容詳情且?guī)в胸S富參考資料的報(bào)告——不用擔(dān)心,如果你使用的是中文頁面,那么生成的最終報(bào)告也會(huì)是中文版。
當(dāng)然,SciMaster也支持將最終報(bào)告下載成PDF文件,你可以在這里查看和下載:
https://scimaster.bohrium.com/chat/share/4925c3b83b1244c685bd247af21e9573
整體實(shí)測下來,我們的最大感受是:強(qiáng)大可靠透明
SciMaster的強(qiáng)大之處在于能在短短半小時(shí)內(nèi)完成原本人類研究者需要花費(fèi)數(shù)小時(shí)乃至數(shù)天時(shí)間完成的深度調(diào)研課題。而說它可靠,是因?yàn)樗苡行б种拼笳Z言模型(LLM)司空見慣的幻覺問題;通過強(qiáng)制性的文獻(xiàn)溯源和交叉驗(yàn)證,SciMaster提供的每一個(gè)關(guān)鍵信息都有據(jù)可查,這對于嚴(yán)謹(jǐn)?shù)目蒲泄ぷ髦陵P(guān)重要。最后,它的透明體現(xiàn)在會(huì)將自己的思考過程完全開放給用戶;我們可以非常明晰地了解它為了解決問題究竟采用了怎樣的方法和工具。
可以說,對科研工作者而言,SciMaster的價(jià)值遠(yuǎn)不僅僅是一個(gè)搜索引擎或?qū)懽鞴ぞ?,更是一個(gè)不知疲倦、知識(shí)淵博的科研助手。不知當(dāng)SciMaster再進(jìn)一步進(jìn)化,真正做到「讀算做寫」四項(xiàng)全能時(shí),我們又將見證怎樣的驚喜。
AIforScience的浪潮
才剛剛開始
用AI搞科研,如今已不再是遙遠(yuǎn)的想象,而是人人都可實(shí)踐的現(xiàn)實(shí)。
前幾天,馬斯克在發(fā)布Grok4時(shí)曾說過,如果在今年底之前AI不能完成新的科學(xué)發(fā)現(xiàn),他會(huì)很驚訝。Grok4展示出來的科學(xué)探索能力已經(jīng)給我們留下了很深的印象,不過它畢竟是通用大模型,真正要落到科研上,我們還需要更加專業(yè)的工具。實(shí)際上,我們已經(jīng)在AI領(lǐng)域看到了利用AI來發(fā)現(xiàn)新模型架構(gòu)的研究正在涌現(xiàn)。
在AI與生命科學(xué)、醫(yī)藥、新材料等交叉的垂直領(lǐng)域中,同樣不斷涌現(xiàn)的新技術(shù)正在吸引著我們的眼球。在去年10月諾貝爾獎(jiǎng)的評選中,來自DeepMind的AI蛋白質(zhì)結(jié)構(gòu)預(yù)測方法獲得化學(xué)獎(jiǎng),成功為生物學(xué)領(lǐng)域的AI輔助研究正名。
而在更廣泛的科研領(lǐng)域上,我們也在看到希望,SciMaster就是一個(gè)很好的開始。
這不得不讓我們再次對于國內(nèi)的AI刮目相看。自DeepSeek-R1開源以來,世界已經(jīng)再次刷新了對于中國AI技術(shù)的認(rèn)知,國內(nèi)科技公司正不斷以創(chuàng)新的方法、更低成本、高效率的方法席卷全球市場。其實(shí)在AIforScience的賽道上,中國科技公司投入得更早,布局得更快,可以說早早領(lǐng)先了身位。未來,AI科學(xué)家的落地可能會(huì)持續(xù)推動(dòng)科學(xué)技術(shù)前沿的發(fā)展。SciMaster的問世,正是這一前瞻性布局的集中體現(xiàn)。
正如其技術(shù)報(bào)告中寫到的那樣,SciMaster并非一個(gè)孤立的產(chǎn)品,而是一個(gè)宏大系列研究的開篇。深勢科技表示,SciMaster未來也將覆蓋更加廣泛科學(xué)知識(shí)的訴求,目標(biāo)是開發(fā)出通用的科研AI智能體。一個(gè)由AI驅(qū)動(dòng)的、人人皆可參與的科研新時(shí)代,或許真的不遠(yuǎn)了。
特別推薦良心小說《農(nóng)家俏媳婦:養(yǎng)夫帶娃種田忙》,甜的別致愛的...
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。