機器之心報道
機器之心編輯部
就在一夜之間,用AI幫忙搞科研,不是再只是想想了。
最近,科研圈里越來越多的人在討論一種叫SciMaster的「AI科學(xué)助手」,有讓它做實驗的,有讓他幫忙開題的,還有跟他聊科幻的。
仿佛有一個AI大模型加持的助手就可以包打天下了。
這個SciMaster是上周在世界人工智能大會WAIC上,由上海交通大學(xué)、深勢科技與上海算法創(chuàng)新院聯(lián)合發(fā)布的,號稱全球首個真正意義的通用科研智能體
發(fā)布之后異?;鸨藗兌荚趯ふ覝y試機會,邀請碼已經(jīng)被炒到近千元。到底是怎樣的AI產(chǎn)品才能讓賣家有如此底氣?
一番努力后,我們獲得了一個邀請碼,發(fā)現(xiàn)它的水平果然不一樣,可能AI社區(qū)熱炒的「AI科學(xué)家」概念終于有了一個可實際應(yīng)用的雛形。簡單來說,它集成了頂尖的思維鏈(CoT)能力,可以自動搜索分析文獻、搞理論計算、做實驗、寫論文以及與人協(xié)作進行科研。
SciMaster已經(jīng)超出了此前AI大模型工具的范疇。通過自動完成科研流程中最繁瑣的一些環(huán)節(jié),它可以極大提升科研效率。對于全球數(shù)千萬必須在文獻和實驗數(shù)據(jù)上耗費大量時間的科研人員而言,這簡直就是對科研流程的「降維打擊」。
從煉丹到AI科學(xué)家的范式革命
要理解SciMaster的意義,首先須得了解當前AI領(lǐng)域的宏觀趨勢。在當今這個被一些觀察者認為即將進入「AI下半場」的時代,AI的前沿正從基于海量數(shù)據(jù)和算力的「煉丹」轉(zhuǎn)向「如何將強大的AI能力轉(zhuǎn)變成應(yīng)用」,也即著名數(shù)學(xué)家陶哲軒所說的AI現(xiàn)在應(yīng)該從技術(shù)質(zhì)變走向應(yīng)用量變。
而AI科學(xué)家,正站在這一宏觀趨勢的最前沿。但遺憾的是,雖然我們此前已經(jīng)見證了能自動搜索人工生命、發(fā)現(xiàn)新的蛋白質(zhì)或模型架構(gòu)的自動研究模型的誕生,但還未有一個真正可用且實用的AI科研助手。
SciMaster填補了這一空白。
整體而言,SciMaster的目標是成為一個覆蓋讀、算、做、寫全流程的通用科研AI智能體,是目前AI領(lǐng)域多智能體化的全新探索。
首先是「讀」,SciMaster以玻爾科研空間站為支撐,這是一個擁有1.7億科研文獻的龐大數(shù)據(jù)庫。當用戶提問時,SciMaster會直接從這個文獻庫中尋找信息,進而把問題自動拆分成一系列子任務(wù)(讀、算、做、寫)執(zhí)行,最終生成完整可靠的研究報告。
與此同時,SciMaster也會基于互聯(lián)網(wǎng)上的信息,為用戶查詢提供更全面以及更有時效性的結(jié)果。
機器之心獲悉,在數(shù)據(jù)檢索和整合過程中,SciMaster的大模型幻覺趨近于零,因為答案中每個論斷都可以追溯到源文獻。
其次是「算」。我們知道,智能體系統(tǒng)會在理解任務(wù)之后進行拆分執(zhí)行,SciMaster也是一樣,它會對任務(wù)拆分出的子問題分別調(diào)用工具,并行執(zhí)行多個子任務(wù)。如果輸入的問題涉及計算,它除了會進行搜索、內(nèi)容整合之外還會調(diào)用各類AIforScience的計算工具。
SciMaster未來也可以「做」實驗。如果你提出的需求涉及后續(xù)實驗驗證,SciMaster可以直接調(diào)用Uni-Lab提供的MCP服務(wù),從而連接自動化實驗室系統(tǒng),進行濕實驗。最后,數(shù)據(jù)會返回到科研報告中。
最后是「寫」,根據(jù)收集到的相關(guān)信息與文獻內(nèi)容,SciMaster的核心模塊之一InfoMaster會生成深度調(diào)研報告,支持一鍵導(dǎo)出PDF和鏈接分享。
SciMaster的特點不僅在于自動進行的科研,也包含一定的人機協(xié)作機制。在SciMaster進行深度思考、規(guī)劃任務(wù)時,我們可以點擊暫停,在「深度思考」框內(nèi)對任務(wù)邏輯、內(nèi)容進行修改,實時指揮AI調(diào)整策略,這樣就能讓SciMaster更準確地響應(yīng)用戶的需求。
看起來一個既能幫你尋找idea,又能幫你實現(xiàn)的科研AI出現(xiàn)了,或許這會成為未來人與AI共同進行科學(xué)探索的范式。
SciMaster是這樣煉成的
再仔細搜索網(wǎng)絡(luò)上的信息,我們發(fā)現(xiàn)其實在本月初,上海交大、深勢科技就在一篇論文中介紹了SciMaster的工作流程、機制和能力。該研究在X等社交平臺上也引發(fā)了關(guān)注。
論文標題:SciMaster:TowardsGeneral-PurposeScientificAIAgents論文鏈接:https://arxiv.org/abs/2507.05241
作為SciMaster系列研究成果的PartI,這篇論文關(guān)注的重點是SciMaster智能體所使用的基礎(chǔ)架構(gòu)X-Master
具體來說,如下圖所示,X-Master是深勢科技開發(fā)的一套工具增強型推理智能體:給定一個用戶查詢,該智能體首先會開始思考過程。在此過程中,工具調(diào)用等與環(huán)境的交互是通過生成Python代碼片段實現(xiàn)的。執(zhí)行所得到的結(jié)果將被附加到智能體的上下文中,進而豐富其理解并為其后續(xù)思考提供信息。
AI自動使用Python代碼來表示交互意圖,意味著其實現(xiàn)的功能具備通用性、準確性以及較高的兼容性,讓科研智能體的指令遵循能力大大加強。
X-Master是一款工具增強推理智能體。
在上圖這個具體案例中,X-Master智能體進行三次交互(搜索以獲取GitHub鏈接,解析以獲取arXiv論文鏈接,然后再次解析以獲取所屬機構(gòu)),然后得出了最終答案。
工作流程上,X-Master采用了一種名為scattered-and-stacked(分散-堆疊)的智能體工作流程。
該工作流程是讓X-Master扮演不同角色,以在推理時提高解答的質(zhì)量。其中包括:(1)求解器(Solver)生成五個初始解答;(2)批評器(Critic)對初始解答進行細化;(3)重寫器(Rewriter)綜合所有五個解答并生成五個新解答;(4)選擇器(Selector)挑選最佳解答。
X-Masters在高難度的Humanity'sLastExam(HLE,人類最后考試)基準上創(chuàng)造了新的SOTA記錄,得分達到32.1%,超過了OpenAI和谷歌的DeepResearch(分別為26.6%和26.9%),在2025年六月底,成為了首個突破HLE30%大關(guān)的方案。
基于X-Master的配置,大模型可以基于靈活的內(nèi)部推理和工具使用來模擬人類的問題解決方式,基于開源模型就能在HLE等具有挑戰(zhàn)性的基準上達到極高的性能,無需大量再訓(xùn)練即可增強LLM能力。
我們可以期待一下SciMaster系列研究的后續(xù)Part了。
在SciMaster幫助下搞科研
我們實測了一下
那么,SciMaster的實際表現(xiàn)如何呢?
在玻爾科研空間站(Bohrium)中打開SciMaster,首先映入眼簾的其預(yù)置的兩大能力:通用助手深度調(diào)研
鏈接:https://scimaster.bohrium.com
其中,通用助手更適用于科研日常中遇到的一般問題查詢,比如檢索基本概念、查詢實驗流程、甚至提出《十萬個為什么》那樣的基礎(chǔ)科普問題。
深度調(diào)研則是一個具備DeepResearch能力的「科研專家」。當研究者提出一個科學(xué)問題時,SciMaster會對問題進行評估分析,將問題拆分成多個子任務(wù),并靈活調(diào)用WebSearch、WebParse、PaperSearch三種檢索方式,檢索全域互聯(lián)網(wǎng)、全量文獻,收集領(lǐng)域相關(guān)的資訊、數(shù)據(jù)、論文、專利等資料。最后經(jīng)過整理,SciMaster會向交付用戶一份翔實可靠的調(diào)研報告。
接下來,我們就通過一些實際任務(wù)來看看SciMaster究竟能做到什么程度?
首先,為了直觀地展示SciMaster的能力,我們向其通用助手提出了一個經(jīng)典的科普問題:「為什么細胞是球形的?」
可以看到,SciMaster首先會進行深度思考,對問題進行初步的分析,然后確定所要使用的工具,包括使用web_search來獲取一些基礎(chǔ)知識以及再使用science_navigator查找是否有相關(guān)論文討論細胞形態(tài)的物理原理。
之后,SciMaster便會開始編寫一些Python腳本并實際執(zhí)行這些工具,如果代碼執(zhí)行出錯,SciMaster還會進行反思,并對出錯的部分進行修正。而如果工具返回的結(jié)果不理想,它可能還會更換關(guān)鍵詞再次搜索。這種探索+嘗試的方式極大地模擬了人類專家解決問題的思路。
上圖右側(cè),我們可以看到其第一次成功執(zhí)行web_search后所檢索到的部分結(jié)果。在上面,我們也可以切換瀏覽不同工具執(zhí)行后得到的結(jié)果。
而當需要更專業(yè)的生物物理學(xué)解釋時,SciMaster會通過science_navigator工具查詢專業(yè)文獻,從而確保結(jié)果準確,避免幻覺。整個過程完整透明。
經(jīng)過一系列的探索和信息整合,SciMaster最終會給出一個綜合答案??梢钥吹剑琒ciMaster不僅從物理和生物學(xué)角度解釋了細胞為球形的優(yōu)勢,同時還點明了我們提問中一個預(yù)設(shè)的錯誤前提——「細胞是球形的」。實際上,SciMaster指出,并非所有細胞都趨于球形,比如神經(jīng)元和肌肉細胞分別呈現(xiàn)星形分支和長纖維狀。
下圖展示了SciMaster解答這個問題的全過程。
與此同時,SciMaster還提供了便捷的分享功能,可以一鍵生成分享整個解答過程的鏈接,將所得到的結(jié)果分享出去,從而可以共享優(yōu)質(zhì)成果,避免重復(fù)計算,實現(xiàn)更加有效的溝通。比如,你可在此處查看上述查詢和解答:
https://scimaster.bohrium.com/chat/share/86c2ef04aef7477b8df3c7bdba3cc2cb
再來一個更有爭議的問題:「轉(zhuǎn)基因食物是否有害健康?」
同樣,SciMaster依然首先是簡單分析問題,然后使用web_search工具,以形成對問題本身的初步了解。在通過互聯(lián)網(wǎng)獲得了來自權(quán)威機構(gòu)的信息之后,SciMaster也并未盲信,依然繼續(xù)進行了專業(yè)檢索,最終得出了結(jié)論:「通過安全評價的轉(zhuǎn)基因食品與傳統(tǒng)食品同等安全,無證據(jù)表明其危害人類健康?!?/p>
而在此基礎(chǔ)上,為了做到概念明確,我們還可以繼續(xù)追問:「什么是通過安全評估的轉(zhuǎn)基因食品?」而這一次,SciMaster的思考就更加深度了。不僅引述了多個權(quán)威的定義標準,還給出了一些典型案例、政策以及依舊存在的爭議現(xiàn)狀。
接下來,該讓SciMaster深度調(diào)研上場炫技了:「為CRISPR基因編輯寫一份綜述報告」。
可以看到,與通用助手類似,SciMaster同樣第一步是分析問題;不同的是這一次其分析的深度和廣度都有明顯提升,另一個非常明顯的區(qū)別是在使用深度調(diào)研時,SciMaster的工作語言會切換成英語,如此能夠針對專業(yè)術(shù)語等進行更加深度的搜索,避免了專業(yè)文獻在翻譯過程中可能出現(xiàn)的錯漏和幻覺問題。
然后,它會制定更加詳細的計劃,包括綜述報告的內(nèi)容規(guī)劃、所要用到的工具以及具體將要執(zhí)行的研究步驟。
實際上,這個過程背后,正是其論文中提到的分散-堆疊的智能體工作流程在發(fā)揮作用。多個智能體分別扮演求解器、批評器、重寫器和選擇器,通過層層探索和優(yōu)化,以確保報告的深度和廣度。
接下來,SciMaster便會按照自己的計劃逐步執(zhí)行,并最終生成一份內(nèi)容詳情且?guī)в胸S富參考資料的報告——不用擔心,如果你使用的是中文頁面,那么生成的最終報告也會是中文版。
當然,SciMaster也支持將最終報告下載成PDF文件,你可以在這里查看和下載:
https://scimaster.bohrium.com/chat/share/4925c3b83b1244c685bd247af21e9573
整體實測下來,我們的最大感受是:強大可靠透明
SciMaster的強大之處在于能在短短半小時內(nèi)完成原本人類研究者需要花費數(shù)小時乃至數(shù)天時間完成的深度調(diào)研課題。而說它可靠,是因為它能有效抑制大語言模型(LLM)司空見慣的幻覺問題;通過強制性的文獻溯源和交叉驗證,SciMaster提供的每一個關(guān)鍵信息都有據(jù)可查,這對于嚴謹?shù)目蒲泄ぷ髦陵P(guān)重要。最后,它的透明體現(xiàn)在會將自己的思考過程完全開放給用戶;我們可以非常明晰地了解它為了解決問題究竟采用了怎樣的方法和工具。
可以說,對科研工作者而言,SciMaster的價值遠不僅僅是一個搜索引擎或?qū)懽鞴ぞ?,更是一個不知疲倦、知識淵博的科研助手。不知當SciMaster再進一步進化,真正做到「讀算做寫」四項全能時,我們又將見證怎樣的驚喜。
AIforScience的浪潮
才剛剛開始
用AI搞科研,如今已不再是遙遠的想象,而是人人都可實踐的現(xiàn)實。
前幾天,馬斯克在發(fā)布Grok4時曾說過,如果在今年底之前AI不能完成新的科學(xué)發(fā)現(xiàn),他會很驚訝。Grok4展示出來的科學(xué)探索能力已經(jīng)給我們留下了很深的印象,不過它畢竟是通用大模型,真正要落到科研上,我們還需要更加專業(yè)的工具。實際上,我們已經(jīng)在AI領(lǐng)域看到了利用AI來發(fā)現(xiàn)新模型架構(gòu)的研究正在涌現(xiàn)。
在AI與生命科學(xué)、醫(yī)藥、新材料等交叉的垂直領(lǐng)域中,同樣不斷涌現(xiàn)的新技術(shù)正在吸引著我們的眼球。在去年10月諾貝爾獎的評選中,來自DeepMind的AI蛋白質(zhì)結(jié)構(gòu)預(yù)測方法獲得化學(xué)獎,成功為生物學(xué)領(lǐng)域的AI輔助研究正名。
而在更廣泛的科研領(lǐng)域上,我們也在看到希望,SciMaster就是一個很好的開始。
這不得不讓我們再次對于國內(nèi)的AI刮目相看。自DeepSeek-R1開源以來,世界已經(jīng)再次刷新了對于中國AI技術(shù)的認知,國內(nèi)科技公司正不斷以創(chuàng)新的方法、更低成本、高效率的方法席卷全球市場。其實在AIforScience的賽道上,中國科技公司投入得更早,布局得更快,可以說早早領(lǐng)先了身位。未來,AI科學(xué)家的落地可能會持續(xù)推動科學(xué)技術(shù)前沿的發(fā)展。SciMaster的問世,正是這一前瞻性布局的集中體現(xiàn)。
正如其技術(shù)報告中寫到的那樣,SciMaster并非一個孤立的產(chǎn)品,而是一個宏大系列研究的開篇。深勢科技表示,SciMaster未來也將覆蓋更加廣泛科學(xué)知識的訴求,目標是開發(fā)出通用的科研AI智能體。一個由AI驅(qū)動的、人人皆可參與的科研新時代,或許真的不遠了。
亡靈類小說15本,亡靈紀元,死靈法師崛起,統(tǒng)御幽冥大軍黑暗征途
網(wǎng)易與暴雪創(chuàng)始人聯(lián)手《無主星淵》國內(nèi)首測!經(jīng)典游戲停止支持XP
最成功暗黑網(wǎng)游被騰訊收購,低下高傲的頭,為中國玩家大幅降低難度...
免責聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。