新智元報(bào)道
定慧好困
【新智元導(dǎo)讀】在WAIC2025大會(huì)上,上海AI實(shí)驗(yàn)室首席科學(xué)周伯文和Hinton教授的尖峰對(duì)話轟動(dòng)全場(chǎng)。而在科學(xué)探索上,實(shí)驗(yàn)室更是獨(dú)辟蹊徑開(kāi)創(chuàng)「通專融合」大模型創(chuàng)新路線,全新一代科學(xué)大模型拿下多模態(tài)能力全球第一。
在人聲鼎沸的WAIC2025上,一款堪稱「全能高手+科學(xué)明星」合體的大模型,由于在科學(xué)方面太優(yōu)秀,反倒顯得低調(diào)——但它的能力卻無(wú)法被忽視。
它能精準(zhǔn)解析分子結(jié)構(gòu)、看懂地震波圖、推演化學(xué)反應(yīng)路徑……
7月26日,上海人工智能實(shí)驗(yàn)室(上海AI實(shí)驗(yàn)室)發(fā)布并開(kāi)源「書生」科學(xué)多模態(tài)大模型Intern-S1。
它不僅多模態(tài)能力全球開(kāi)源第一,文本能力比肩國(guó)內(nèi)外一流模型,科學(xué)能力全模態(tài)達(dá)到國(guó)際領(lǐng)先。
而且,作為融合科學(xué)專業(yè)能力的基礎(chǔ)模型,其綜合性能更是當(dāng)前開(kāi)源模型的最優(yōu)。
在同一模型內(nèi),Intern-S1實(shí)現(xiàn)了語(yǔ)言和多模態(tài)性能的高水平均衡發(fā)展,具備「全能高手」的實(shí)力;
作為「科學(xué)明星」,Intern-S1富集了多學(xué)科專業(yè)知識(shí),并重點(diǎn)強(qiáng)化了科學(xué)能力,在化學(xué)、材料、地球等多學(xué)科專業(yè)任務(wù)基準(zhǔn)上超越了頂尖閉源模型Grok-4;
Intern-S1開(kāi)創(chuàng)了「多任務(wù)的通專融合」的新范式,支持大規(guī)模多任務(wù)強(qiáng)化學(xué)習(xí)齊頭并進(jìn),在保持能力全面的同時(shí)實(shí)現(xiàn)專業(yè)精通。
相比之下,傳統(tǒng)的單一模態(tài)分析在科學(xué)發(fā)現(xiàn)過(guò)程中往往難以全面捕捉復(fù)雜現(xiàn)象,尤其是在跨學(xué)科領(lǐng)域的深度探索中更加顯著。
Intern-S1體驗(yàn)頁(yè)面:
https://chat.intern-ai.org.cn/(點(diǎn)擊文末閱讀原文直達(dá))
GitHub鏈接:
https://github.com/InternLM
HuggingFace鏈接:
https://huggingface.co/internlm/Intern-S1-FP8
ModelScope鏈接:
https://modelscope.cn/models/Shanghai_AI_Laboratory/Intern-S1
開(kāi)源科學(xué)多模態(tài)
性能領(lǐng)先,重構(gòu)科研生產(chǎn)力
Intern-S1以輕量化訓(xùn)練成本,達(dá)成科學(xué)/通用雙維度性能突破。
在綜合多模態(tài)通用能力評(píng)估上,Intern-S1得分比肩國(guó)內(nèi)外一流模型,展現(xiàn)跨文本、圖像的全面理解力。該評(píng)估為多項(xiàng)通用任務(wù)評(píng)測(cè)基準(zhǔn)均分,證明其多場(chǎng)景任務(wù)中的魯棒性與適應(yīng)性,無(wú)懼復(fù)雜輸入組合挑戰(zhàn)。
在多個(gè)領(lǐng)域?qū)I(yè)評(píng)測(cè)集組成的科學(xué)能力評(píng)測(cè)中,Intern-S1領(lǐng)先Grok-4等最新閉源模型。評(píng)測(cè)覆蓋了物理、化學(xué)、材料、生物等領(lǐng)域的復(fù)雜專業(yè)任務(wù),驗(yàn)證了模型在科研場(chǎng)景的強(qiáng)邏輯性與準(zhǔn)確性,樹(shù)立行業(yè)新標(biāo)桿。
當(dāng)大模型在聊天、繪畫、代碼生成等場(chǎng)景中持續(xù)取得突破時(shí),科研領(lǐng)域卻仍在期待一個(gè)真正「懂科學(xué)」的AI伙伴。
盡管當(dāng)前主流模型在自然語(yǔ)言處理、圖像識(shí)別等方面表現(xiàn)出色,但在面對(duì)復(fù)雜、精細(xì)且高度專業(yè)化的科研任務(wù)時(shí),依然存在明顯短板。
一方面,現(xiàn)有開(kāi)源模型普遍缺乏對(duì)復(fù)雜科學(xué)數(shù)據(jù)的深度理解,難以滿足科研場(chǎng)景對(duì)精度、專業(yè)性和推理能力的嚴(yán)苛要求。
另一方面,性能更強(qiáng)的閉源模型存在部署門檻高、可控性弱等問(wèn)題,導(dǎo)致科研工作者在實(shí)際應(yīng)用中常面臨高成本、低透明的現(xiàn)實(shí)挑戰(zhàn)。
在2025世界人工智能大會(huì)(WAIC2025)科學(xué)前沿全體會(huì)議上,上海AI實(shí)驗(yàn)室發(fā)布了『書生』科學(xué)多模態(tài)大模型Intern-S1。
模型首創(chuàng)「跨模態(tài)科學(xué)解析引擎」,可精準(zhǔn)解讀化學(xué)分子式、蛋白質(zhì)結(jié)構(gòu)、地震波信號(hào)等多種復(fù)雜科學(xué)模態(tài)數(shù)據(jù),并具備多項(xiàng)前沿科研能力,如預(yù)測(cè)化合物合成路徑,判斷化學(xué)反應(yīng)可行性,識(shí)別地震波事件等,真正讓AI從「對(duì)話助手」進(jìn)化為「科研搭檔」,助力全面重構(gòu)科研生產(chǎn)力。
得益于強(qiáng)大的科學(xué)解析能力,Intern-S1在化學(xué)、材料、地球等多學(xué)科專業(yè)任務(wù)基準(zhǔn)上超越了頂尖閉源模型Grok-4,展現(xiàn)出卓越的科學(xué)推理與理解能力。
在多模態(tài)綜合能力方面,Intern-S1同樣表現(xiàn)亮眼,全面領(lǐng)先InternVL3、Qwen2.5-VL等主流開(kāi)源模型,堪稱「全能高手」中的「科學(xué)明星」。
基于Intern-S1強(qiáng)大的跨模態(tài)生物信息感知與整合能力,上海AI實(shí)驗(yàn)室聯(lián)合臨港實(shí)驗(yàn)室、上海交通大學(xué)、復(fù)旦大學(xué)、MIT等研究機(jī)構(gòu)協(xié)同攻關(guān),共同參與構(gòu)建了多智能體虛擬疾病學(xué)家系統(tǒng)——「元生」(OriGene),可用于靶標(biāo)發(fā)現(xiàn)與臨床轉(zhuǎn)化價(jià)值評(píng)估,已在肝癌和結(jié)直腸癌治療領(lǐng)域上分別提出新靶點(diǎn)GPR160和ARG2,且經(jīng)真實(shí)臨床樣本和動(dòng)物實(shí)驗(yàn)驗(yàn)證,形成科學(xué)閉環(huán)。
體系化的技術(shù)創(chuàng)新為Intern-S1的能力突破提供了有效支撐。自書生大模型首次發(fā)布以來(lái),上海AI實(shí)驗(yàn)室已逐步構(gòu)建起豐富的書生大模型家族,包括大語(yǔ)言模型、多模態(tài)模型、強(qiáng)推理模型等。
Intern-S1融合了『書生』大模型家族的優(yōu)勢(shì),在同一模型內(nèi)實(shí)現(xiàn)了語(yǔ)言和多模態(tài)性能的高水平均衡發(fā)展,成為新一代開(kāi)源多模態(tài)大模型標(biāo)桿。
Intern-S1在國(guó)際開(kāi)源社區(qū)引發(fā)了關(guān)注,不少開(kāi)發(fā)者紛紛為其點(diǎn)贊,并稱「幾乎每天都能看到來(lái)自中國(guó)的新開(kāi)源SOTA成果——紀(jì)錄每天都在被刷新?!?/p>
創(chuàng)新科學(xué)多模態(tài)架構(gòu)讓數(shù)據(jù)深度融合
受數(shù)據(jù)異構(gòu)性壁壘、專業(yè)語(yǔ)義理解瓶頸等因素制約,傳統(tǒng)的通用大模型在處理科學(xué)模態(tài)數(shù)據(jù)時(shí)面臨顯著挑戰(zhàn)。
為了更好地適應(yīng)科學(xué)數(shù)據(jù),Intern-S1新增了動(dòng)態(tài)Tokenizer和時(shí)序信號(hào)編碼器,可支持多種復(fù)雜科學(xué)模態(tài)數(shù)據(jù),實(shí)現(xiàn)了材料科學(xué)與化學(xué)分子式、生物制藥領(lǐng)域的蛋白質(zhì)序列、天文巡天中的光變曲線、天體碰撞產(chǎn)生的引力波信號(hào)、地震臺(tái)網(wǎng)記錄的地震波形等多種科學(xué)模態(tài)的深度融合。
通過(guò)架構(gòu)創(chuàng)新,Intern-S1還實(shí)現(xiàn)了對(duì)科學(xué)模態(tài)數(shù)據(jù)的深入理解與高效處理,例如,其對(duì)化學(xué)分子式的壓縮率相比DeepSeek-R1提升70%以上;在一系列基于科學(xué)模態(tài)的專業(yè)任務(wù)上消耗的算力更少,同時(shí)性能表現(xiàn)更優(yōu)。
「通專融合」讓單模型搞定多項(xiàng)專業(yè)任務(wù)
科學(xué)領(lǐng)域的高價(jià)值任務(wù)往往高度專業(yè)化,不僅模型輸出可讀性差,且不同任務(wù)在技能要求與思維方式上差異顯著,直接混合訓(xùn)練面臨此消彼長(zhǎng)的困境,難以實(shí)現(xiàn)能力的深度融合。
為此,研究團(tuán)隊(duì)提出通專融合的科學(xué)數(shù)據(jù)合成方法:一方面利用海量通用科學(xué)數(shù)據(jù)拓展模型的知識(shí)面,另一方面訓(xùn)練眾多專業(yè)模型生成具有高可讀性、思維路徑清晰的科學(xué)數(shù)據(jù),并由領(lǐng)域定制的專業(yè)驗(yàn)證智能體進(jìn)行數(shù)據(jù)質(zhì)量控制。
最終,這一閉環(huán)機(jī)制持續(xù)反哺基座模型,使其同時(shí)具備強(qiáng)大的通用推理能力與多項(xiàng)頂尖的專業(yè)能力,真正實(shí)現(xiàn)一個(gè)模型解決多項(xiàng)專業(yè)任務(wù)的的科學(xué)智能突破。
聯(lián)合優(yōu)化系統(tǒng)+算法,成本直降10倍
當(dāng)前,強(qiáng)化學(xué)習(xí)逐漸成為大模型后訓(xùn)練的核心,但面臨系統(tǒng)復(fù)雜度和穩(wěn)定性的重重挑戰(zhàn)。得益于訓(xùn)練系統(tǒng)與算法層面的協(xié)同突破,Intern-S1研發(fā)團(tuán)隊(duì)成功實(shí)現(xiàn)了大型多模態(tài)MoE模型在FP8精度下的高效穩(wěn)定強(qiáng)化學(xué)習(xí)訓(xùn)練,其強(qiáng)化學(xué)習(xí)訓(xùn)練成本相比近期公開(kāi)的MoE模型降低10倍。
在系統(tǒng)層面,Intern-S1研究團(tuán)隊(duì)采用了訓(xùn)推分離的RL方案,通過(guò)自研推理引擎進(jìn)行FP8高效率大規(guī)模異步推理,利用數(shù)據(jù)并行均衡策略緩解長(zhǎng)思維鏈解碼時(shí)的長(zhǎng)尾現(xiàn)象;在訓(xùn)練過(guò)程中同樣采用分塊式FP8訓(xùn)練,大大提升訓(xùn)練效率。后續(xù),訓(xùn)練系統(tǒng)也將開(kāi)源。
在算法層面,基于Intern·BootCamp構(gòu)建的大規(guī)模多任務(wù)交互環(huán)境,研究團(tuán)隊(duì)提出MixtureofRewards混合獎(jiǎng)勵(lì)學(xué)習(xí)算法,融合多種獎(jiǎng)勵(lì)和反饋信號(hào),在易驗(yàn)證的任務(wù)上采用RLVR訓(xùn)練范式,通過(guò)規(guī)則、驗(yàn)證器或者交互環(huán)境提供獎(jiǎng)勵(lì)信號(hào);在難驗(yàn)證的任務(wù)上(如,對(duì)話和寫作任務(wù))采用獎(jiǎng)勵(lì)模型提供的獎(jiǎng)勵(lì)信號(hào)進(jìn)行聯(lián)合訓(xùn)練。
同時(shí),訓(xùn)練算法還集成了上海AI實(shí)驗(yàn)室在大模型強(qiáng)化學(xué)習(xí)訓(xùn)練策略上的多項(xiàng)研究成果,實(shí)現(xiàn)了訓(xùn)練效率和穩(wěn)定性的顯著提升。
工具鏈全體系免費(fèi)開(kāi)源
打造更懂科學(xué)的AI助手
書生大模型自2023年正式開(kāi)源以來(lái),已陸續(xù)迭代升級(jí)多個(gè)版本,并持續(xù)降低大模型應(yīng)用及研究門檻。
書生大模型首創(chuàng)并開(kāi)源了面向大模型研發(fā)與應(yīng)用的全鏈路開(kāi)源工具體系,覆蓋數(shù)據(jù)處理、預(yù)訓(xùn)練、微調(diào)、部署、評(píng)測(cè)與應(yīng)用等關(guān)鍵環(huán)節(jié),包含低成本微調(diào)框架XTuner、部署推理框架LMDeploy、評(píng)測(cè)框架OpenCompass、高效文檔解析工具M(jìn)inerU,以及思索式AI搜索應(yīng)用MindSearch等在內(nèi)的核心工具全面開(kāi)源,已形成涵蓋數(shù)十萬(wàn)開(kāi)發(fā)者參與的活躍開(kāi)源社區(qū)。
近期,上海AI實(shí)驗(yàn)室進(jìn)一步開(kāi)源了,可廣泛應(yīng)用于化學(xué)、物理、生物等領(lǐng)域的12種科研任務(wù),在大幅提升科研效率的同時(shí),亦初步展現(xiàn)出多智能體系統(tǒng)自主學(xué)習(xí)、持續(xù)進(jìn)化的潛力,為人工智能自主完成算法設(shè)計(jì)、科學(xué)發(fā)現(xiàn)等高端科研任務(wù)開(kāi)辟了全新探索路徑。
基于Intern-S1的亦于近日上線,助力研究者、研究工具、研究對(duì)象三者能力全面提升、協(xié)同演進(jìn),驅(qū)動(dòng)科學(xué)研究從團(tuán)隊(duì)單點(diǎn)探索邁向科學(xué)發(fā)現(xiàn)ScalingLaw階段。
未來(lái),在研究范式創(chuàng)新及模型能力提升的基礎(chǔ)上,上海AI實(shí)驗(yàn)室將推進(jìn)Intern-S1及其全鏈條工具體系持續(xù)開(kāi)源,支持免費(fèi)商用,同時(shí)提供線上開(kāi)放服務(wù),與各界共同擁抱更廣闊的開(kāi)源生態(tài),攜手打造更懂科學(xué)的AI助手。
Intern-S1實(shí)測(cè)
借助強(qiáng)大的多模態(tài)及科學(xué)能力,Intern-S1面對(duì)科學(xué)問(wèn)題時(shí)得心應(yīng)手。下方案例,展示了Intern-S1快速、準(zhǔn)確識(shí)別圖中反應(yīng)物的化學(xué)式。
Q:從左到右,給出圖中反應(yīng)物的化學(xué)式
Intern-S1:左邊反應(yīng)物是順式-2,5-二甲基哌嗪,化學(xué)式為C?H??N?;右邊是對(duì)碘溴苯,化學(xué)式為C?H?BrI
作為對(duì)比,Grok的答案:C5H11N,C6H4BrI(回答錯(cuò)誤)
Intern-S1思考過(guò)程如下:
面對(duì)藝術(shù)作品時(shí),Intern-S1還能以科學(xué)的邏輯和知識(shí)體系對(duì)藝術(shù)畫作進(jìn)行理性賞析,以科學(xué)的方式「讀懂」藝術(shù)。
值得收藏的神奇小說(shuō)《我只想享受人生》,主角手段了得,值得收藏!
霸榜之作《我只想享受人生》,懸念重生的細(xì)節(jié),高能不停,品別樣人生
小說(shuō):重生次貸危機(jī)前,他立志打造2300億商業(yè)帝國(guó)享受人生
免責(zé)聲明:本文內(nèi)容由開(kāi)放的智能模型自動(dòng)生成,僅供參考。