機(jī)器之心報(bào)道
機(jī)器之心編輯部
就在一夜之間,用AI幫忙搞科研,不是再只是想想了。
最近,科研圈里越來(lái)越多的人在討論一種叫SciMaster的「AI科學(xué)助手」,有讓它做實(shí)驗(yàn)的,有讓他幫忙開(kāi)題的,還有跟他聊科幻的。
仿佛有一個(gè)AI大模型加持的助手就可以包打天下了。
這個(gè)SciMaster是上周在世界人工智能大會(huì)WAIC上,由上海交通大學(xué)、深勢(shì)科技與上海算法創(chuàng)新院聯(lián)合發(fā)布的,號(hào)稱全球首個(gè)真正意義的通用科研智能體
發(fā)布之后異常火爆,人們都在尋找測(cè)試機(jī)會(huì),邀請(qǐng)碼已經(jīng)被炒到近千元。到底是怎樣的AI產(chǎn)品才能讓賣家有如此底氣?
一番努力后,我們獲得了一個(gè)邀請(qǐng)碼,發(fā)現(xiàn)它的水平果然不一樣,可能AI社區(qū)熱炒的「AI科學(xué)家」概念終于有了一個(gè)可實(shí)際應(yīng)用的雛形。簡(jiǎn)單來(lái)說(shuō),它集成了頂尖的思維鏈(CoT)能力,可以自動(dòng)搜索分析文獻(xiàn)、搞理論計(jì)算、做實(shí)驗(yàn)、寫論文以及與人協(xié)作進(jìn)行科研。
SciMaster已經(jīng)超出了此前AI大模型工具的范疇。通過(guò)自動(dòng)完成科研流程中最繁瑣的一些環(huán)節(jié),它可以極大提升科研效率。對(duì)于全球數(shù)千萬(wàn)必須在文獻(xiàn)和實(shí)驗(yàn)數(shù)據(jù)上耗費(fèi)大量時(shí)間的科研人員而言,這簡(jiǎn)直就是對(duì)科研流程的「降維打擊」。
從煉丹到AI科學(xué)家的范式革命
要理解SciMaster的意義,首先須得了解當(dāng)前AI領(lǐng)域的宏觀趨勢(shì)。在當(dāng)今這個(gè)被一些觀察者認(rèn)為即將進(jìn)入「AI下半場(chǎng)」的時(shí)代,AI的前沿正從基于海量數(shù)據(jù)和算力的「煉丹」轉(zhuǎn)向「如何將強(qiáng)大的AI能力轉(zhuǎn)變成應(yīng)用」,也即著名數(shù)學(xué)家陶哲軒所說(shuō)的AI現(xiàn)在應(yīng)該從技術(shù)質(zhì)變走向應(yīng)用量變。
而AI科學(xué)家,正站在這一宏觀趨勢(shì)的最前沿。但遺憾的是,雖然我們此前已經(jīng)見(jiàn)證了能自動(dòng)搜索人工生命、發(fā)現(xiàn)新的蛋白質(zhì)或模型架構(gòu)的自動(dòng)研究模型的誕生,但還未有一個(gè)真正可用且實(shí)用的AI科研助手。
SciMaster填補(bǔ)了這一空白。
整體而言,SciMaster的目標(biāo)是成為一個(gè)覆蓋讀、算、做、寫全流程的通用科研AI智能體,是目前AI領(lǐng)域多智能體化的全新探索。
首先是「讀」,SciMaster以玻爾科研空間站為支撐,這是一個(gè)擁有1.7億科研文獻(xiàn)的龐大數(shù)據(jù)庫(kù)。當(dāng)用戶提問(wèn)時(shí),SciMaster會(huì)直接從這個(gè)文獻(xiàn)庫(kù)中尋找信息,進(jìn)而把問(wèn)題自動(dòng)拆分成一系列子任務(wù)(讀、算、做、寫)執(zhí)行,最終生成完整可靠的研究報(bào)告。
與此同時(shí),SciMaster也會(huì)基于互聯(lián)網(wǎng)上的信息,為用戶查詢提供更全面以及更有時(shí)效性的結(jié)果。
機(jī)器之心獲悉,在數(shù)據(jù)檢索和整合過(guò)程中,SciMaster的大模型幻覺(jué)趨近于零,因?yàn)榇鸢钢忻總€(gè)論斷都可以追溯到源文獻(xiàn)。
其次是「算」。我們知道,智能體系統(tǒng)會(huì)在理解任務(wù)之后進(jìn)行拆分執(zhí)行,SciMaster也是一樣,它會(huì)對(duì)任務(wù)拆分出的子問(wèn)題分別調(diào)用工具,并行執(zhí)行多個(gè)子任務(wù)。如果輸入的問(wèn)題涉及計(jì)算,它除了會(huì)進(jìn)行搜索、內(nèi)容整合之外還會(huì)調(diào)用各類AIforScience的計(jì)算工具。
SciMaster未來(lái)也可以「做」實(shí)驗(yàn)。如果你提出的需求涉及后續(xù)實(shí)驗(yàn)驗(yàn)證,SciMaster可以直接調(diào)用Uni-Lab提供的MCP服務(wù),從而連接自動(dòng)化實(shí)驗(yàn)室系統(tǒng),進(jìn)行濕實(shí)驗(yàn)。最后,數(shù)據(jù)會(huì)返回到科研報(bào)告中。
最后是「寫」,根據(jù)收集到的相關(guān)信息與文獻(xiàn)內(nèi)容,SciMaster的核心模塊之一InfoMaster會(huì)生成深度調(diào)研報(bào)告,支持一鍵導(dǎo)出PDF和鏈接分享。
SciMaster的特點(diǎn)不僅在于自動(dòng)進(jìn)行的科研,也包含一定的人機(jī)協(xié)作機(jī)制。在SciMaster進(jìn)行深度思考、規(guī)劃任務(wù)時(shí),我們可以點(diǎn)擊暫停,在「深度思考」框內(nèi)對(duì)任務(wù)邏輯、內(nèi)容進(jìn)行修改,實(shí)時(shí)指揮AI調(diào)整策略,這樣就能讓SciMaster更準(zhǔn)確地響應(yīng)用戶的需求。
看起來(lái)一個(gè)既能幫你尋找idea,又能幫你實(shí)現(xiàn)的科研AI出現(xiàn)了,或許這會(huì)成為未來(lái)人與AI共同進(jìn)行科學(xué)探索的范式。
SciMaster是這樣煉成的
再仔細(xì)搜索網(wǎng)絡(luò)上的信息,我們發(fā)現(xiàn)其實(shí)在本月初,上海交大、深勢(shì)科技就在一篇論文中介紹了SciMaster的工作流程、機(jī)制和能力。該研究在X等社交平臺(tái)上也引發(fā)了關(guān)注。
論文標(biāo)題:SciMaster:TowardsGeneral-PurposeScientificAIAgents論文鏈接:https://arxiv.org/abs/2507.05241
作為SciMaster系列研究成果的PartI,這篇論文關(guān)注的重點(diǎn)是SciMaster智能體所使用的基礎(chǔ)架構(gòu)X-Master
具體來(lái)說(shuō),如下圖所示,X-Master是深勢(shì)科技開(kāi)發(fā)的一套工具增強(qiáng)型推理智能體:給定一個(gè)用戶查詢,該智能體首先會(huì)開(kāi)始思考過(guò)程。在此過(guò)程中,工具調(diào)用等與環(huán)境的交互是通過(guò)生成Python代碼片段實(shí)現(xiàn)的。執(zhí)行所得到的結(jié)果將被附加到智能體的上下文中,進(jìn)而豐富其理解并為其后續(xù)思考提供信息。
AI自動(dòng)使用Python代碼來(lái)表示交互意圖,意味著其實(shí)現(xiàn)的功能具備通用性、準(zhǔn)確性以及較高的兼容性,讓科研智能體的指令遵循能力大大加強(qiáng)。
X-Master是一款工具增強(qiáng)推理智能體。
在上圖這個(gè)具體案例中,X-Master智能體進(jìn)行三次交互(搜索以獲取GitHub鏈接,解析以獲取arXiv論文鏈接,然后再次解析以獲取所屬機(jī)構(gòu)),然后得出了最終答案。
工作流程上,X-Master采用了一種名為scattered-and-stacked(分散-堆疊)的智能體工作流程。
該工作流程是讓X-Master扮演不同角色,以在推理時(shí)提高解答的質(zhì)量。其中包括:(1)求解器(Solver)生成五個(gè)初始解答;(2)批評(píng)器(Critic)對(duì)初始解答進(jìn)行細(xì)化;(3)重寫器(Rewriter)綜合所有五個(gè)解答并生成五個(gè)新解答;(4)選擇器(Selector)挑選最佳解答。
X-Masters在高難度的Humanity'sLastExam(HLE,人類最后考試)基準(zhǔn)上創(chuàng)造了新的SOTA記錄,得分達(dá)到32.1%,超過(guò)了OpenAI和谷歌的DeepResearch(分別為26.6%和26.9%),在2025年六月底,成為了首個(gè)突破HLE30%大關(guān)的方案。
基于X-Master的配置,大模型可以基于靈活的內(nèi)部推理和工具使用來(lái)模擬人類的問(wèn)題解決方式,基于開(kāi)源模型就能在HLE等具有挑戰(zhàn)性的基準(zhǔn)上達(dá)到極高的性能,無(wú)需大量再訓(xùn)練即可增強(qiáng)LLM能力。
我們可以期待一下SciMaster系列研究的后續(xù)Part了。
在SciMaster幫助下搞科研
我們實(shí)測(cè)了一下
那么,SciMaster的實(shí)際表現(xiàn)如何呢?
在玻爾科研空間站(Bohrium)中打開(kāi)SciMaster,首先映入眼簾的其預(yù)置的兩大能力:通用助手深度調(diào)研
鏈接:https://scimaster.bohrium.com
其中,通用助手更適用于科研日常中遇到的一般問(wèn)題查詢,比如檢索基本概念、查詢實(shí)驗(yàn)流程、甚至提出《十萬(wàn)個(gè)為什么》那樣的基礎(chǔ)科普問(wèn)題。
深度調(diào)研則是一個(gè)具備DeepResearch能力的「科研專家」。當(dāng)研究者提出一個(gè)科學(xué)問(wèn)題時(shí),SciMaster會(huì)對(duì)問(wèn)題進(jìn)行評(píng)估分析,將問(wèn)題拆分成多個(gè)子任務(wù),并靈活調(diào)用WebSearch、WebParse、PaperSearch三種檢索方式,檢索全域互聯(lián)網(wǎng)、全量文獻(xiàn),收集領(lǐng)域相關(guān)的資訊、數(shù)據(jù)、論文、專利等資料。最后經(jīng)過(guò)整理,SciMaster會(huì)向交付用戶一份翔實(shí)可靠的調(diào)研報(bào)告。
接下來(lái),我們就通過(guò)一些實(shí)際任務(wù)來(lái)看看SciMaster究竟能做到什么程度?
首先,為了直觀地展示SciMaster的能力,我們向其通用助手提出了一個(gè)經(jīng)典的科普問(wèn)題:「為什么細(xì)胞是球形的?」
可以看到,SciMaster首先會(huì)進(jìn)行深度思考,對(duì)問(wèn)題進(jìn)行初步的分析,然后確定所要使用的工具,包括使用web_search來(lái)獲取一些基礎(chǔ)知識(shí)以及再使用science_navigator查找是否有相關(guān)論文討論細(xì)胞形態(tài)的物理原理。
之后,SciMaster便會(huì)開(kāi)始編寫一些Python腳本并實(shí)際執(zhí)行這些工具,如果代碼執(zhí)行出錯(cuò),SciMaster還會(huì)進(jìn)行反思,并對(duì)出錯(cuò)的部分進(jìn)行修正。而如果工具返回的結(jié)果不理想,它可能還會(huì)更換關(guān)鍵詞再次搜索。這種探索+嘗試的方式極大地模擬了人類專家解決問(wèn)題的思路。
上圖右側(cè),我們可以看到其第一次成功執(zhí)行web_search后所檢索到的部分結(jié)果。在上面,我們也可以切換瀏覽不同工具執(zhí)行后得到的結(jié)果。
而當(dāng)需要更專業(yè)的生物物理學(xué)解釋時(shí),SciMaster會(huì)通過(guò)science_navigator工具查詢專業(yè)文獻(xiàn),從而確保結(jié)果準(zhǔn)確,避免幻覺(jué)。整個(gè)過(guò)程完整透明。
經(jīng)過(guò)一系列的探索和信息整合,SciMaster最終會(huì)給出一個(gè)綜合答案??梢钥吹?,SciMaster不僅從物理和生物學(xué)角度解釋了細(xì)胞為球形的優(yōu)勢(shì),同時(shí)還點(diǎn)明了我們提問(wèn)中一個(gè)預(yù)設(shè)的錯(cuò)誤前提——「細(xì)胞是球形的」。實(shí)際上,SciMaster指出,并非所有細(xì)胞都趨于球形,比如神經(jīng)元和肌肉細(xì)胞分別呈現(xiàn)星形分支和長(zhǎng)纖維狀。
下圖展示了SciMaster解答這個(gè)問(wèn)題的全過(guò)程。
與此同時(shí),SciMaster還提供了便捷的分享功能,可以一鍵生成分享整個(gè)解答過(guò)程的鏈接,將所得到的結(jié)果分享出去,從而可以共享優(yōu)質(zhì)成果,避免重復(fù)計(jì)算,實(shí)現(xiàn)更加有效的溝通。比如,你可在此處查看上述查詢和解答:
https://scimaster.bohrium.com/chat/share/86c2ef04aef7477b8df3c7bdba3cc2cb
再來(lái)一個(gè)更有爭(zhēng)議的問(wèn)題:「轉(zhuǎn)基因食物是否有害健康?」
同樣,SciMaster依然首先是簡(jiǎn)單分析問(wèn)題,然后使用web_search工具,以形成對(duì)問(wèn)題本身的初步了解。在通過(guò)互聯(lián)網(wǎng)獲得了來(lái)自權(quán)威機(jī)構(gòu)的信息之后,SciMaster也并未盲信,依然繼續(xù)進(jìn)行了專業(yè)檢索,最終得出了結(jié)論:「通過(guò)安全評(píng)價(jià)的轉(zhuǎn)基因食品與傳統(tǒng)食品同等安全,無(wú)證據(jù)表明其危害人類健康?!?/p>
而在此基礎(chǔ)上,為了做到概念明確,我們還可以繼續(xù)追問(wèn):「什么是通過(guò)安全評(píng)估的轉(zhuǎn)基因食品?」而這一次,SciMaster的思考就更加深度了。不僅引述了多個(gè)權(quán)威的定義標(biāo)準(zhǔn),還給出了一些典型案例、政策以及依舊存在的爭(zhēng)議現(xiàn)狀。
接下來(lái),該讓SciMaster深度調(diào)研上場(chǎng)炫技了:「為CRISPR基因編輯寫一份綜述報(bào)告」。
可以看到,與通用助手類似,SciMaster同樣第一步是分析問(wèn)題;不同的是這一次其分析的深度和廣度都有明顯提升,另一個(gè)非常明顯的區(qū)別是在使用深度調(diào)研時(shí),SciMaster的工作語(yǔ)言會(huì)切換成英語(yǔ),如此能夠針對(duì)專業(yè)術(shù)語(yǔ)等進(jìn)行更加深度的搜索,避免了專業(yè)文獻(xiàn)在翻譯過(guò)程中可能出現(xiàn)的錯(cuò)漏和幻覺(jué)問(wèn)題。
然后,它會(huì)制定更加詳細(xì)的計(jì)劃,包括綜述報(bào)告的內(nèi)容規(guī)劃、所要用到的工具以及具體將要執(zhí)行的研究步驟。
實(shí)際上,這個(gè)過(guò)程背后,正是其論文中提到的分散-堆疊的智能體工作流程在發(fā)揮作用。多個(gè)智能體分別扮演求解器、批評(píng)器、重寫器和選擇器,通過(guò)層層探索和優(yōu)化,以確保報(bào)告的深度和廣度。
接下來(lái),SciMaster便會(huì)按照自己的計(jì)劃逐步執(zhí)行,并最終生成一份內(nèi)容詳情且?guī)в胸S富參考資料的報(bào)告——不用擔(dān)心,如果你使用的是中文頁(yè)面,那么生成的最終報(bào)告也會(huì)是中文版。
當(dāng)然,SciMaster也支持將最終報(bào)告下載成PDF文件,你可以在這里查看和下載:
https://scimaster.bohrium.com/chat/share/4925c3b83b1244c685bd247af21e9573
整體實(shí)測(cè)下來(lái),我們的最大感受是:強(qiáng)大可靠透明
SciMaster的強(qiáng)大之處在于能在短短半小時(shí)內(nèi)完成原本人類研究者需要花費(fèi)數(shù)小時(shí)乃至數(shù)天時(shí)間完成的深度調(diào)研課題。而說(shuō)它可靠,是因?yàn)樗苡行б种拼笳Z(yǔ)言模型(LLM)司空見(jiàn)慣的幻覺(jué)問(wèn)題;通過(guò)強(qiáng)制性的文獻(xiàn)溯源和交叉驗(yàn)證,SciMaster提供的每一個(gè)關(guān)鍵信息都有據(jù)可查,這對(duì)于嚴(yán)謹(jǐn)?shù)目蒲泄ぷ髦陵P(guān)重要。最后,它的透明體現(xiàn)在會(huì)將自己的思考過(guò)程完全開(kāi)放給用戶;我們可以非常明晰地了解它為了解決問(wèn)題究竟采用了怎樣的方法和工具。
可以說(shuō),對(duì)科研工作者而言,SciMaster的價(jià)值遠(yuǎn)不僅僅是一個(gè)搜索引擎或?qū)懽鞴ぞ?,更是一個(gè)不知疲倦、知識(shí)淵博的科研助手。不知當(dāng)SciMaster再進(jìn)一步進(jìn)化,真正做到「讀算做寫」四項(xiàng)全能時(shí),我們又將見(jiàn)證怎樣的驚喜。
AIforScience的浪潮
才剛剛開(kāi)始
用AI搞科研,如今已不再是遙遠(yuǎn)的想象,而是人人都可實(shí)踐的現(xiàn)實(shí)。
前幾天,馬斯克在發(fā)布Grok4時(shí)曾說(shuō)過(guò),如果在今年底之前AI不能完成新的科學(xué)發(fā)現(xiàn),他會(huì)很驚訝。Grok4展示出來(lái)的科學(xué)探索能力已經(jīng)給我們留下了很深的印象,不過(guò)它畢竟是通用大模型,真正要落到科研上,我們還需要更加專業(yè)的工具。實(shí)際上,我們已經(jīng)在AI領(lǐng)域看到了利用AI來(lái)發(fā)現(xiàn)新模型架構(gòu)的研究正在涌現(xiàn)。
在AI與生命科學(xué)、醫(yī)藥、新材料等交叉的垂直領(lǐng)域中,同樣不斷涌現(xiàn)的新技術(shù)正在吸引著我們的眼球。在去年10月諾貝爾獎(jiǎng)的評(píng)選中,來(lái)自DeepMind的AI蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法獲得化學(xué)獎(jiǎng),成功為生物學(xué)領(lǐng)域的AI輔助研究正名。
而在更廣泛的科研領(lǐng)域上,我們也在看到希望,SciMaster就是一個(gè)很好的開(kāi)始。
這不得不讓我們?cè)俅螌?duì)于國(guó)內(nèi)的AI刮目相看。自DeepSeek-R1開(kāi)源以來(lái),世界已經(jīng)再次刷新了對(duì)于中國(guó)AI技術(shù)的認(rèn)知,國(guó)內(nèi)科技公司正不斷以創(chuàng)新的方法、更低成本、高效率的方法席卷全球市場(chǎng)。其實(shí)在AIforScience的賽道上,中國(guó)科技公司投入得更早,布局得更快,可以說(shuō)早早領(lǐng)先了身位。未來(lái),AI科學(xué)家的落地可能會(huì)持續(xù)推動(dòng)科學(xué)技術(shù)前沿的發(fā)展。SciMaster的問(wèn)世,正是這一前瞻性布局的集中體現(xiàn)。
正如其技術(shù)報(bào)告中寫到的那樣,SciMaster并非一個(gè)孤立的產(chǎn)品,而是一個(gè)宏大系列研究的開(kāi)篇。深勢(shì)科技表示,SciMaster未來(lái)也將覆蓋更加廣泛科學(xué)知識(shí)的訴求,目標(biāo)是開(kāi)發(fā)出通用的科研AI智能體。一個(gè)由AI驅(qū)動(dòng)的、人人皆可參與的科研新時(shí)代,或許真的不遠(yuǎn)了。
小說(shuō):廢柴飛月遭雷劫,砸出男神變掌門,仙界稱霸路開(kāi)啟
廢柴飛月渡劫被砸,卻得破落仙門,逆襲稱霸仙界
15本已完結(jié)精品幕后流小說(shuō),萬(wàn)古我為尊,天地為棋盤,眾生為棋子