近期,美國(guó)斯坦福大學(xué)叢樂(lè)教授、美國(guó)普林斯頓大學(xué)王夢(mèng)迪教授與谷歌DeepMind團(tuán)隊(duì)合作,首次將大語(yǔ)言模型(LLM,LargeLanguageModel)用于基因編輯實(shí)驗(yàn),成功開(kāi)發(fā)出一種名為CRISPR-GPT的智能體系統(tǒng)。
值得關(guān)注的是,它能夠綜合利用LLM的計(jì)算效率和特定領(lǐng)域的知識(shí),實(shí)現(xiàn)為研究人員解決CRISPR基因編輯實(shí)驗(yàn)“量身定制”的自動(dòng)化設(shè)計(jì)與分析。
圖丨后排中間為叢樂(lè),前排左二為屈元昊(來(lái)源:屈元昊)
該系統(tǒng)為研究人員提供智能化的基因編輯方案設(shè)計(jì),在確保編輯精準(zhǔn)性的同時(shí),顯著降低了實(shí)驗(yàn)操作的復(fù)雜性。具體包括:基因編輯實(shí)驗(yàn)設(shè)計(jì)、CRISPR系統(tǒng)的選擇、設(shè)計(jì)指導(dǎo)gRNA序列、推薦細(xì)胞遞送方法、預(yù)測(cè)脫靶效應(yīng)、推薦實(shí)驗(yàn)程序和設(shè)計(jì)驗(yàn)證修改、實(shí)驗(yàn)的數(shù)據(jù)分析、確認(rèn)編輯結(jié)果的過(guò)程。
該研究顯示出CRISPR-GPT在促進(jìn)復(fù)雜生物發(fā)現(xiàn)任務(wù)方面的潛力,有望加速生物、醫(yī)學(xué)、農(nóng)業(yè)等領(lǐng)域的發(fā)現(xiàn)和應(yīng)用。
近日,相關(guān)論文以《CRISPR-GPT:基因編輯實(shí)驗(yàn)的智能體自動(dòng)化》(CRISPR-GPTforagenticautomationofgene-editingexperiment)為題發(fā)表在NatureBiomedicalEngineering上[1]。斯坦福大學(xué)博士研究生屈元昊和普林斯頓大學(xué)博士研究生黃凱旋是共同第一作者,斯坦福大學(xué)叢樂(lè)教授和普林斯頓大學(xué)王夢(mèng)迪教授擔(dān)任共同通訊作者。
圖丨相關(guān)論文(來(lái)源:NatureBiomedicalEngineering)
首次將大模型應(yīng)用于基因編輯實(shí)驗(yàn)設(shè)計(jì)
當(dāng)下,基因編輯技術(shù)讓人們對(duì)基因信息的精確改變成為可能。2012年,基因編輯系統(tǒng)CRISPR-Cas9的問(wèn)世,標(biāo)志著該領(lǐng)域取得重大突破。
2013年,基因編輯先驅(qū)、美國(guó)國(guó)家科學(xué)院院士張鋒教授與叢樂(lè)等人(后者為第一作者),在Science發(fā)表CPISPR基因編輯的突破性論文《利用CRISPR/Cas系統(tǒng)的多重基因組工程》(MultiplexGenomeEngineeringUsingCRISPR/CasSystems)[2]。
2020年,美國(guó)加州大學(xué)伯克利分校教授詹妮弗·杜德納(JenniferDoudna)以及德國(guó)馬克斯普朗克感染生物學(xué)研究所教授埃馬紐爾·夏彭蒂耶(EmmanuelleCharpentier),因在CRISPR-Cas9的貢獻(xiàn)而獲得諾貝爾化學(xué)獎(jiǎng)。
隨著基因編輯技術(shù)的進(jìn)步和發(fā)展,其在研究基因功能、治療遺傳病、制備基因修飾模型和治療癌癥、增強(qiáng)農(nóng)作物恢復(fù)力等方面發(fā)揮著愈發(fā)重要的作用。
然而,創(chuàng)建一個(gè)高效的基因編輯系統(tǒng),不僅需要對(duì)CRISPR深入了解,還要經(jīng)過(guò)復(fù)雜的實(shí)驗(yàn),這需要投入大量的時(shí)間和進(jìn)行專業(yè)的科研訓(xùn)練。
近年來(lái),LLM在日常對(duì)話、世界知識(shí)、圖像生成等方面展現(xiàn)出巨大的應(yīng)用潛力。LLM技術(shù)的發(fā)展為解決科學(xué)問(wèn)題提供了新的契機(jī)的同時(shí),AIforScience應(yīng)用也日益增多。此前,已有化學(xué)家通過(guò)LLM構(gòu)建智能體,輔助科研人員進(jìn)行實(shí)驗(yàn)設(shè)計(jì)和化學(xué)合成方案制定。
基于其他領(lǐng)域的成功應(yīng)用案例,結(jié)合以基因編輯作為工具解決生物學(xué)問(wèn)題的實(shí)際需求,該團(tuán)隊(duì)提出了一個(gè)關(guān)鍵問(wèn)題:能否將LLM應(yīng)用于基因編輯領(lǐng)域,通過(guò)智能體為研究人員提供專業(yè)輔助?
理論上雖然可行,但實(shí)際應(yīng)用中面臨諸多挑戰(zhàn):通用LLM存在幻覺(jué)等固有問(wèn)題,且由于缺乏專業(yè)領(lǐng)域知識(shí),無(wú)法為研究人員提供精準(zhǔn)、具體的基因編輯設(shè)計(jì)方案。該團(tuán)隊(duì)發(fā)現(xiàn),通用LLM的輸出結(jié)果缺乏一致性,往往會(huì)提供眾多不同的選擇方案,導(dǎo)致研究人員難以確定最適合的基因編輯系統(tǒng)。
(來(lái)源:NatureBiomedicalEngineering)
為解決這些問(wèn)題,CRISPR-GPT的每個(gè)模塊都通過(guò)將LLM與特定領(lǐng)域的生物數(shù)據(jù)進(jìn)行微調(diào)來(lái)優(yōu)化,以確?;蚓庉嫻ぷ鞯臏?zhǔn)確性和效率,用戶可以根據(jù)特定研究需求靈活調(diào)整設(shè)計(jì)方案。
這一創(chuàng)新的人工智能工具采用思維鏈推理模型和狀態(tài)機(jī)架構(gòu),確保即使是基因編輯領(lǐng)域的“新手”生物學(xué)家,也能夠迭代優(yōu)化實(shí)驗(yàn)設(shè)計(jì)。該系統(tǒng)可完成多種基因編輯任務(wù),包括CRISPR基因敲除、表觀遺傳編輯、先導(dǎo)編輯、堿基編輯等。
CRISPR-GPT的核心優(yōu)勢(shì)在于,充分利用LLM的推理能力來(lái)處理自然語(yǔ)言交互。用戶無(wú)需按照固定模式輸入需求,而是像咨詢專家一樣自然提問(wèn),系統(tǒng)便能協(xié)助解決基因編輯實(shí)驗(yàn)設(shè)計(jì)中的各類問(wèn)題。
斯坦福大學(xué)叢樂(lè)課題組博士研究生屈元昊的主要研究方向包括基因編輯、單細(xì)胞測(cè)序以及人工智能在生物醫(yī)學(xué)中的應(yīng)用。他對(duì)DeepTech表示:“據(jù)我了解,這是首次將大模型應(yīng)用于基因編輯實(shí)驗(yàn)設(shè)計(jì)的研究。我們的核心創(chuàng)新在于讓AI真正理解基因編輯的專業(yè)知識(shí),并能像領(lǐng)域?qū)<乙粯舆M(jìn)行推理和決策?!?/p>
三種模式:通過(guò)智能交互“量身定制”CRISPR基因編輯實(shí)驗(yàn)
目前,CRISPR-GPT共有三種交互模式,分別適用于不同背景的研究人員,真正實(shí)現(xiàn)個(gè)性化的基因編輯實(shí)驗(yàn)設(shè)計(jì)。
第一,預(yù)設(shè)模式。該模式適用于對(duì)基因編輯不太熟悉的研究人員(初學(xué)者),通過(guò)該模式能夠從最初的CRISPR系統(tǒng)選擇,一直到最后的數(shù)據(jù)分析,完整地做完基因編輯實(shí)驗(yàn)。
第二,自動(dòng)模式。這種模式比較適合具有基因編輯領(lǐng)域基礎(chǔ)的科研人員,以幫助他們解決某一個(gè)或某幾個(gè)問(wèn)題,而不需要從頭開(kāi)始基因編輯實(shí)驗(yàn)。
例如,研究人員可以用自然語(yǔ)言的方式對(duì)該系統(tǒng)說(shuō):我想設(shè)計(jì)一個(gè)靶向于某基因的gRNA。在自動(dòng)模式中,通過(guò)LLM的推理能力,讓它能夠具體地分析每個(gè)用戶不同的需求。
第三,問(wèn)答模式。在研究人員對(duì)一些不熟悉的CRISPR系統(tǒng)進(jìn)行實(shí)驗(yàn)時(shí),可采用問(wèn)答模式,自由地咨詢與CRISPR基因編輯實(shí)驗(yàn)相關(guān)的問(wèn)題。
(來(lái)源:NatureBiomedicalEngineering)
基于叢樂(lè)實(shí)驗(yàn)室在基因編輯領(lǐng)域多年的技術(shù)積累,經(jīng)常會(huì)收到來(lái)自世界各地的學(xué)者咨詢關(guān)于CRISPR的各種問(wèn)題。目前,研究人員正在將關(guān)于CRISPR問(wèn)題和回答的數(shù)據(jù)集,與在網(wǎng)絡(luò)中提取關(guān)于CRISPR數(shù)據(jù)集整合到CRISPR-GPT中。
屈元昊表示:“我們將實(shí)驗(yàn)室多年積累的CRISPR問(wèn)答數(shù)據(jù)集整合到系統(tǒng)中,通過(guò)LLM進(jìn)行專門訓(xùn)練和微調(diào)。這樣CRISPR-GPT就能基于真實(shí)的專家知識(shí)為用戶提供更準(zhǔn)確、可靠的答案,進(jìn)而真正解決實(shí)際研究中遇到的問(wèn)題。”
“專家級(jí)”智能決策:模擬專家思維提供精準(zhǔn)解決方案
CRISPR-GPT采用“專家思維”模式,通過(guò)逐步推理為用戶提供各類基因編輯實(shí)驗(yàn)的智能化解決方案。
以遞送系統(tǒng)選擇為例,這是基因編輯領(lǐng)域一個(gè)關(guān)鍵且復(fù)雜的技術(shù)難題。在干細(xì)胞或免疫細(xì)胞的體內(nèi)編輯中,實(shí)驗(yàn)成功與否很大程度上取決于遞送系統(tǒng)和CRISPR-Cas系統(tǒng)的匹配選擇。
傳統(tǒng)上,這個(gè)過(guò)程需要研究人員具備深厚的生物學(xué)背景,查閱大量文獻(xiàn),并憑借經(jīng)驗(yàn)進(jìn)行判斷,既耗時(shí)又依賴個(gè)人專業(yè)水平。
CRISPR-GPT通過(guò)智能化方式解決這一難題。當(dāng)系統(tǒng)識(shí)別到特定生物學(xué)關(guān)鍵詞(如“A-375細(xì)胞”)時(shí),會(huì)自動(dòng)關(guān)聯(lián)到其細(xì)胞類型特征(腫瘤細(xì)胞系)。
基于預(yù)設(shè)的專家知識(shí),系統(tǒng)首先提出幾個(gè)可能的備選遞送方案(如逆轉(zhuǎn)錄病毒遞送系統(tǒng))。接下來(lái),系統(tǒng)會(huì)進(jìn)行實(shí)時(shí)文獻(xiàn)搜索,參考學(xué)術(shù)引用數(shù)據(jù)等指標(biāo)對(duì)備選方案進(jìn)行綜合評(píng)估,最終為用戶提供1-2個(gè)最優(yōu)的遞送系統(tǒng)選擇。
屈元昊表示:“我們的核心理念是讓AI像專家一樣思考問(wèn)題。系統(tǒng)不僅具備專業(yè)知識(shí),還配備了實(shí)時(shí)文獻(xiàn)搜索等工具,能夠智能化地為用戶推薦最適合的遞送系統(tǒng)。這完全改變了傳統(tǒng)依賴個(gè)人經(jīng)驗(yàn)和手工查閱文獻(xiàn)的研究模式,讓基因編輯實(shí)驗(yàn)設(shè)計(jì)變得更高效、更精準(zhǔn)?!?/p>
(來(lái)源:NatureBiomedicalEngineering)
在一項(xiàng)針對(duì)人類肺癌細(xì)胞系的實(shí)驗(yàn)中,CRISPR-GPT成功設(shè)計(jì)了針對(duì)TGFβR1、SNAI1、BAX和BCL2L1四個(gè)關(guān)鍵基因的敲除實(shí)驗(yàn),并通過(guò)CRISPR-Cas12a系統(tǒng)進(jìn)行高效的基因編輯。根據(jù)實(shí)驗(yàn)結(jié)果,這些基因的編輯效率高達(dá)80%。
在另一項(xiàng)針對(duì)人類黑色素瘤細(xì)胞系的實(shí)驗(yàn)中,CRISPR-GPT成功設(shè)計(jì)并實(shí)施了對(duì)NCR3LG1和CEACAM1兩個(gè)基因的表觀遺傳激活實(shí)驗(yàn)。結(jié)果證明,這兩個(gè)基因的表達(dá)水平得到了明顯提高。上述兩項(xiàng)實(shí)驗(yàn)不僅表現(xiàn)優(yōu)異,并且均一次成功。
為評(píng)估CRISPR-GPT智能體的性能,該團(tuán)隊(duì)邀請(qǐng)了8名具有CRISPR和基因編輯專業(yè)知識(shí)的研究人員設(shè)計(jì)一系列任務(wù),測(cè)試CRISPR-GPT協(xié)助實(shí)驗(yàn)設(shè)計(jì)的能力。
他們從準(zhǔn)確性、推理能力、完整性和簡(jiǎn)潔性四個(gè)維度,將CRISPR-GPT與ChatGPT-3.5和ChatGPT-4o進(jìn)行對(duì)比評(píng)估。專家評(píng)估結(jié)果顯示,CRISPR-GPT在基因編輯實(shí)驗(yàn)設(shè)計(jì)的上述四個(gè)方面以及綜合評(píng)分均優(yōu)于通用LLM。
為自動(dòng)化生物科研開(kāi)辟新道路
研發(fā)CRISPR-GPT是為了更好地促進(jìn)科研的發(fā)展,但是這也是一把“雙刃劍”,不能忽視可能帶來(lái)的倫理道德和基因編輯安全等相關(guān)問(wèn)題。
為此,該團(tuán)隊(duì)通過(guò)與倫理道德專家和基因編輯安全專家交流和討論,采取了一系列預(yù)防措施。比如,通過(guò)設(shè)計(jì)關(guān)鍵詞過(guò)濾和指導(dǎo)原則等,對(duì)人類受試者的應(yīng)用限制、保護(hù)遺傳信息的隱私以及對(duì)可能出現(xiàn)的意外結(jié)果(例如編輯更強(qiáng)大的病毒)的警告。
總體來(lái)說(shuō),CRISPR-GPT實(shí)現(xiàn)了簡(jiǎn)化、自動(dòng)化復(fù)雜生物學(xué)研究的基因編輯實(shí)驗(yàn)的設(shè)計(jì)過(guò)程。由于該系統(tǒng)集成了LLM與學(xué)科專業(yè)知識(shí)、外部工具和模塊化任務(wù)執(zhí)行系統(tǒng),研究人員可以更簡(jiǎn)易、更準(zhǔn)確、更高效地計(jì)劃和開(kāi)展基因編輯的相關(guān)實(shí)驗(yàn)。
“這項(xiàng)研究為自動(dòng)化生物科研開(kāi)辟了新道路。目前我們正在不斷優(yōu)化技術(shù),解決實(shí)際應(yīng)用中的各種挑戰(zhàn)。我相信未來(lái)會(huì)有更多生物學(xué)研究能夠借助AI和機(jī)器學(xué)習(xí)技術(shù)來(lái)完成,這將徹底改變科研的工作方式?!鼻徽f(shuō)。
用機(jī)器幫助和替代人類執(zhí)行實(shí)驗(yàn)任務(wù),能夠減輕科研人員的工作負(fù)擔(dān),并極大地加速探索科學(xué)的進(jìn)展;而人類的最主要工作是思考、判斷、設(shè)計(jì)實(shí)驗(yàn),以及發(fā)現(xiàn)需要解決的科學(xué)問(wèn)題。
該團(tuán)隊(duì)希望未來(lái)可以通過(guò)所開(kāi)發(fā)的智能體控制機(jī)器人或自動(dòng)化實(shí)驗(yàn)平臺(tái),真正地實(shí)現(xiàn)用先進(jìn)的工具幫科研人員全自動(dòng)地做實(shí)驗(yàn),或生產(chǎn)基因編輯的細(xì)胞等模式。
隨著基因編輯工程領(lǐng)域的不斷發(fā)展,CRISPR-GPT與自動(dòng)化實(shí)驗(yàn)室的集成平臺(tái)和機(jī)器人技術(shù)的進(jìn)步,為加速科學(xué)發(fā)現(xiàn)和研究相關(guān)疾病帶來(lái)了新的希望。
目前,該課題組還有一系列基于生物醫(yī)學(xué)智能體研發(fā)的相關(guān)工作正在進(jìn)行中。感興趣的讀者可以訪問(wèn)genomics.stanford.edu了解最新進(jìn)展,并參與CRISPR-GPT智能體的beta測(cè)試。
參考資料:
1.Qu,Y.etal.CRISPR-GPTforagenticautomationofgene-editingexperiments.NatureBiomedicalEngineering(2025).
https://www.nature.com/articles/s41551-025-01463-z
2.Cong,L.etal.MultiplexGenomeEngineeringUsingCRISPR/CasSystems.Science339,6121,819-823(2013).
https://www.science.org/doi/abs/10.1126/science.1231143
運(yùn)營(yíng)/排版:何晨龍
延伸閱讀:與 90【后女兒火】速:補(bǔ)!位 的相關(guān)文章