長久以來,科學研究的范式都以數(shù)學原理和實驗觀測為基礎。從牛頓的《自然哲學的數(shù)學原理》到愛因斯坦的質(zhì)能方程,科學家們借助公式、定律、實驗和精確計算,來理解和預測自然。
而今,隨著生成式人工智能的發(fā)展,特別是Transformer和Diffusion模型在文本、多模態(tài)等領域大放異彩,“生成式科學”有可能改變既往的科學研究范式,即不再拘泥于對每一個中間步驟的精確數(shù)學描述和實驗驗證,而是依靠海量科學數(shù)據(jù)(如基因序列、結構等)進行基石模型訓練并獲得直接生成結果的能力,以達到“相對準、絕對快、絕對廣”的更優(yōu)效果。
這種“生成式科學”的真正開端是AlphaFold2誕生,革命性地解決了蛋白質(zhì)“從序列到結構”的預測問題。2023年,AlphaFold3發(fā)布,將能力擴展到蛋白質(zhì)與核酸、小分子、抗體等復雜生物分子的相互作用,這使得AF3具備了指導藥物研發(fā)的潛力。
2024年初,Deepmind旗下負責AF3產(chǎn)業(yè)化的子公司IsomorphicLabs,從禮來、諾華兩家MNC獲得了巨額訂單,合作開發(fā)多靶點的小分子療法,預付款分別高達4500萬美元、3750萬美元。值得一提的是,2025年初,諾華宣布拓展與IsomorphicLabs的合作,進一步增加合作研究數(shù)量。這也意味著諾華對其探索“未公開靶點”藥物能力的認可。
36氪了解到,2024年下半年成立的新創(chuàng)公司探序秩元(以下簡稱探序),在生成式科學(GenerativeScience)的浪潮中,新近發(fā)布了自研基礎模型IntelliFold。目前已開放公開server。
創(chuàng)始人孫鵬是一位前techventure投資人,職業(yè)生涯開始于Accenture管理咨詢、后于明勢資本等VC機構任職,多年從事前沿科技投資,擁有豐富的AI投資與產(chǎn)業(yè)經(jīng)營經(jīng)驗;首席科學家孫思琦為復旦大學研究員、博士生導師,在芝加哥大學TTI-Chicago讀博期間師從許錦波教授。2018-2022年間,孫思琦于微軟西雅圖總部工作,投身于前沿的大語言模型技術研究?;貒笾铝τ贏I在交叉學科中的創(chuàng)新應用,圍繞結構生物學智能計算領域的精度與效率瓶頸取得系統(tǒng)性前沿突破,成果發(fā)表于Science、Nature子刊等系列頂刊,總引用超過7000次。
孫鵬對36氪介紹,探序秩元的科研團隊成員大多同時具有“結構生物學+大語言模型”雙重研發(fā)背景,因此有能力自主開發(fā)結構預測基礎模型。
“幾年前,AI對于結構生物學面臨的結合預測和設計任務,價值以效率提升為主;但現(xiàn)在要用新的AI做傳統(tǒng)技術難以解決的問題,如高效探索未公開靶點,又或設計藥化學家未曾涉獵、甚至超越人類直覺的全新產(chǎn)物等,在這個過程中AI大模型不可或缺。但我們所做的事,不像訓練通用大語言模型那樣算力消耗甚巨無底,同時其產(chǎn)業(yè)價值轉化的路徑更短、更明確。用生成式科學模型直接參與科學研究探索,是AGI展開為智能生產(chǎn)力的三個一級切入點之一?!?/p>
據(jù)了解,IntelliFold的定位是“可控的基礎模型”。這意味著,一方面它可以對多種生物分子(蛋白質(zhì)、核酸、小分子、離子、修飾殘基等)之間的相互作用進行高精度三維結構預測;同時,通過應用輕量級的可訓練適配器,它可以被引導和控制,進而實現(xiàn)別構預測、給定口袋結合預測等特異性針對能力,幫助完成藥物發(fā)現(xiàn)等特定下游應用所需的復雜任務。
圖源報告:《IntelliFold:一個用于通用和特化生物分子結構預測的可控基礎模型》
據(jù)公司提供的技術測試報告,IntelliFold在蛋白質(zhì)結構預測測試的多個關鍵指標與AF3表現(xiàn)相當,如蛋白質(zhì)單體結構預測、蛋白質(zhì)-蛋白質(zhì)界面預測、蛋白質(zhì)-DNA/RNA界面等。在抗體-抗原界面、蛋白質(zhì)-配體相互作用預測方面,成功率略低于AF3。值得注意的是,在RNA單體預測上,甚至超越了AF3,展現(xiàn)了其在核酸結構預測上的優(yōu)勢。
“給定具體蛋白質(zhì)序列,IntelliFold模型可以預測它與小分子的結合構象及模式,這是我們當前技術為具特點、也是市場有明確需求的方向之一,”孫鵬表示。“除預測別構等特異性結合模式外,IntelliFold模型還可以預測Affinity(結合親和力,衡量藥物效力的核心指標之一)數(shù)值,可以增強藥物虛擬篩選的效率和準確性?!?/p>
在藥物設計中,蛋白質(zhì)可能會根據(jù)結合的分子產(chǎn)生構象變化,形成不同的功能狀態(tài),例如激酶家族中的CDK2,其活性可能受到抑制劑誘導的別構變化影響。這對于藥物設計至關重要,卻難以在大模型中有效訓練。但通過目標特異性適配器,IntelliFold能夠正確預測別構構象,“識別罕見構象狀態(tài),同時不影響模型在正構狀態(tài)上的準確性。”這對藥物的精準設計的靈活性頗為重要。
同時,孫鵬還提到,生成式科學模型也正在對蛋白質(zhì)設計帶來快速變革;與經(jīng)典的專家主導藥物設計范式不同,生成式模型可以完全從頭設計(DeNovoDesign)每一個氨基酸的位置及可能,甚至探索自然界不存在但可能更優(yōu)的結果?!半m然蛋白質(zhì)從頭設計的難點部分異于結合預測,但二者使用的基石模型源流相通近似,相互具備橫向拓展的能力;基石模型能力,毫無疑問是未來獲取具體場景領先性與產(chǎn)業(yè)可用性的關鍵前提?!?/p>
在探序秩元的未來規(guī)劃中,希望能將IntelliFold打造成通用的智能科學基石模型,在不同具體任務上發(fā)揮引擎作用,提高整個行業(yè)的研發(fā)效率。接下來,探序將通過與大型藥企聯(lián)合開發(fā)、為藥企/科研機構提供有價值的早期資產(chǎn)等多種方式,進行商業(yè)化。希望通過IntelliFold的應用和持續(xù)升級,系統(tǒng)提升新藥早期研發(fā)的成功率,從而改變新藥研發(fā)“10年周期、10億美元、10%成功率”的困境。
“通過AI,像設計芯片一樣設計蛋白質(zhì)和藥物,”黃仁勛的這一理念在美國已被廣為接受。隨著AI的應用,臨床前和處于臨床一期的藥物資產(chǎn)價值,目前也正在面臨重估。因為AI的介入,這些早期資產(chǎn)的成藥概率大大增加。諾華全球CEO瓦斯·納拉辛漢也曾表示,希望看到AI等新技術能將藥物研發(fā)的成功率,從現(xiàn)在的1/10提升到2/10、甚至3/10。
重生深情文:《暖風不及你情深》女主智商在線,男主很撩很性感!
繼《暖風不及你情深》后的經(jīng)典小說,女主智商在線,男主很撩很蘇
高人氣甜文,大愛《暖風不及你情深》,男女主雙商在線,高甜來襲