今天(7月26日),由中國科學(xué)院聯(lián)合團(tuán)隊(duì)自主研發(fā)的“磐石·科學(xué)基礎(chǔ)大模型”發(fā)布。該科學(xué)基礎(chǔ)大模型采用專業(yè)科學(xué)知識和數(shù)據(jù)進(jìn)行訓(xùn)練、服務(wù)于科學(xué)任務(wù)的智能底座,能夠?qū)崿F(xiàn)對波、譜、場等多種科學(xué)模態(tài)數(shù)據(jù)的深入理解,具備科學(xué)文獻(xiàn)萃取融合、科學(xué)知識表征推理和科學(xué)工具編排規(guī)劃等核心能力,從而為各領(lǐng)域的科技創(chuàng)新提供智能支撐。
“磐石·科學(xué)基礎(chǔ)大模型”可實(shí)現(xiàn)對數(shù)據(jù)和模型等各類資源的管理,以及對計(jì)算仿真等各類工具的調(diào)度,實(shí)現(xiàn)“假設(shè)提出-方案規(guī)劃-仿真推演-實(shí)驗(yàn)驗(yàn)證-規(guī)律發(fā)現(xiàn)”的科研全流程。這意味著,“人工智能+科學(xué)”真正擁有了跨學(xué)科“操作系統(tǒng)”。
在核心架構(gòu)方面,“磐石·科學(xué)基礎(chǔ)大模型”采用異構(gòu)混合專家架構(gòu),在國產(chǎn)開源大模型基礎(chǔ)上面向科學(xué)領(lǐng)域進(jìn)行深度定制,集成了自主研發(fā)的一系列面向共性科學(xué)數(shù)據(jù)模態(tài)的專用模型,并融合了AlphaFold、MatterGen等領(lǐng)域?qū)I(yè)模型。
在科學(xué)能力方面,“磐石·科學(xué)基礎(chǔ)大模型”已系統(tǒng)掌握數(shù)理化天地生六大學(xué)科核心定理、定律與專業(yè)知識,并實(shí)現(xiàn)了對波、譜、場等多種科學(xué)模態(tài)數(shù)據(jù)的深入理解。具體測評中,在基礎(chǔ)學(xué)科領(lǐng)域國際通用的數(shù)據(jù)集里,達(dá)到數(shù)學(xué)、物理、化學(xué)、材料、生物各學(xué)科門類當(dāng)前最佳性能;在通用人工智能助手測試基準(zhǔn)(GAIA)、事實(shí)性問答數(shù)據(jù)集(SimpleQA)等國際權(quán)威測試中,展示了領(lǐng)先的科學(xué)專業(yè)工具調(diào)用和科學(xué)推理性能。
基于“磐石·科學(xué)基礎(chǔ)大模型”,研發(fā)團(tuán)隊(duì)還開發(fā)了“磐石·文獻(xiàn)羅盤”和“磐石·工具調(diào)度臺”兩個(gè)科學(xué)智能體。
“磐石·文獻(xiàn)羅盤”旨在輔助科研人員精讀文章、撰寫綜述、評估科研選題與技術(shù)路徑,已接入1.7億篇科技文獻(xiàn)與實(shí)時(shí)開源科技信息,可深度理解包含公式與圖表的科學(xué)數(shù)據(jù),一次性透徹梳理上千篇文獻(xiàn)。在其支持下,以往需要3到5天才能完成的文獻(xiàn)調(diào)研工作可縮短至20分鐘。
“磐石·工具調(diào)度臺”旨在降低科研工具的使用門檻,可自主規(guī)劃及調(diào)用超過300個(gè)科學(xué)計(jì)算工具,實(shí)現(xiàn)工具的協(xié)同編排和便捷調(diào)用,可自動識別科研任務(wù)、智能編排并調(diào)度最優(yōu)工具鏈,提升科研流程效率,支持用戶靈活接入自有智能體與工具,快速搭建專屬科研應(yīng)用。
目前,“磐石·科學(xué)基礎(chǔ)大模型”已經(jīng)在多個(gè)學(xué)科領(lǐng)域進(jìn)行了深入應(yīng)用,大幅加速科研進(jìn)程。
在生命科學(xué)領(lǐng)域,團(tuán)隊(duì)依托“磐石·科學(xué)基礎(chǔ)大模型”構(gòu)建了X-Cell數(shù)字細(xì)胞大模型,實(shí)現(xiàn)了從基因序列和中心法則到細(xì)胞表型的整體建模,推動數(shù)字細(xì)胞實(shí)現(xiàn)靶點(diǎn)發(fā)現(xiàn)全流程自動化。X-Cell正在支持調(diào)控網(wǎng)絡(luò)分析、虛擬細(xì)胞實(shí)驗(yàn)和靶點(diǎn)發(fā)現(xiàn)應(yīng)用。以蛋白質(zhì)相互作用的藥物靶點(diǎn)發(fā)現(xiàn)為例,相對現(xiàn)有范式科研效率加速超過10倍。
在高能物理領(lǐng)域,北京正負(fù)電子對撞機(jī)的研究人員依托“磐石·科學(xué)基礎(chǔ)大模型”可以實(shí)現(xiàn)粒子物理研究任務(wù)的自動分解與高效規(guī)劃,生成覆蓋粒子物理工作流各階段的分析程序,可有效提升粒子模擬速度與重建效率,助力探索物質(zhì)基本組成和宇宙基本規(guī)律。
在力學(xué)研究中,“磐石·科學(xué)基礎(chǔ)大模型”發(fā)揮強(qiáng)大的科學(xué)數(shù)據(jù)理解和預(yù)測能力,可以高效計(jì)算高鐵模型在多種流體環(huán)境下的表面壓力場,為高鐵構(gòu)型設(shè)計(jì)提供數(shù)據(jù)支持。
此外,“磐石·科學(xué)基礎(chǔ)大模型”也正幫助科學(xué)家在化學(xué)合成中提升實(shí)驗(yàn)效率,在分子結(jié)構(gòu)預(yù)測中實(shí)現(xiàn)更加準(zhǔn)確的預(yù)測結(jié)果,在天文觀測中實(shí)現(xiàn)智能化的全球資源調(diào)度與分析等。
目前,“磐石·科學(xué)基礎(chǔ)大模型”現(xiàn)已全面開源,人們可以通過官網(wǎng)鏈接:https://scienceone.ia.ac.cn/訪問使用。
(總臺央視記者帥俊全褚爾嘉)
灰色預(yù)測模型:原理、優(yōu)勢與應(yīng)用解析
網(wǎng)絡(luò)安全態(tài)勢預(yù)測的三大方法及其應(yīng)用前景
綜合評價(jià)方法大揭秘:選擇適合你的分析工具