近期,美國斯坦福大學(xué)叢樂教授、美國普林斯頓大學(xué)王夢迪教授與谷歌DeepMind團(tuán)隊合作,首次將大語言模型(LLM,LargeLanguageModel)用于基因編輯實驗,成功開發(fā)出一種名為CRISPR-GPT的智能體系統(tǒng)。
值得關(guān)注的是,它能夠綜合利用LLM的計算效率和特定領(lǐng)域的知識,實現(xiàn)為研究人員解決CRISPR基因編輯實驗“量身定制”的自動化設(shè)計與分析。
圖丨后排中間為叢樂,前排左二為屈元昊(來源:屈元昊)
該系統(tǒng)為研究人員提供智能化的基因編輯方案設(shè)計,在確保編輯精準(zhǔn)性的同時,顯著降低了實驗操作的復(fù)雜性。具體包括:基因編輯實驗設(shè)計、CRISPR系統(tǒng)的選擇、設(shè)計指導(dǎo)gRNA序列、推薦細(xì)胞遞送方法、預(yù)測脫靶效應(yīng)、推薦實驗程序和設(shè)計驗證修改、實驗的數(shù)據(jù)分析、確認(rèn)編輯結(jié)果的過程。
該研究顯示出CRISPR-GPT在促進(jìn)復(fù)雜生物發(fā)現(xiàn)任務(wù)方面的潛力,有望加速生物、醫(yī)學(xué)、農(nóng)業(yè)等領(lǐng)域的發(fā)現(xiàn)和應(yīng)用。
近日,相關(guān)論文以《CRISPR-GPT:基因編輯實驗的智能體自動化》(CRISPR-GPTforagenticautomationofgene-editingexperiment)為題發(fā)表在NatureBiomedicalEngineering上[1]。斯坦福大學(xué)博士研究生屈元昊和普林斯頓大學(xué)博士研究生黃凱旋是共同第一作者,斯坦福大學(xué)叢樂教授和普林斯頓大學(xué)王夢迪教授擔(dān)任共同通訊作者。
圖丨相關(guān)論文(來源:NatureBiomedicalEngineering)
首次將大模型應(yīng)用于基因編輯實驗設(shè)計
當(dāng)下,基因編輯技術(shù)讓人們對基因信息的精確改變成為可能。2012年,基因編輯系統(tǒng)CRISPR-Cas9的問世,標(biāo)志著該領(lǐng)域取得重大突破。
2013年,基因編輯先驅(qū)、美國國家科學(xué)院院士張鋒教授與叢樂等人(后者為第一作者),在Science發(fā)表CPISPR基因編輯的突破性論文《利用CRISPR/Cas系統(tǒng)的多重基因組工程》(MultiplexGenomeEngineeringUsingCRISPR/CasSystems)[2]。
2020年,美國加州大學(xué)伯克利分校教授詹妮弗·杜德納(JenniferDoudna)以及德國馬克斯普朗克感染生物學(xué)研究所教授埃馬紐爾·夏彭蒂耶(EmmanuelleCharpentier),因在CRISPR-Cas9的貢獻(xiàn)而獲得諾貝爾化學(xué)獎。
隨著基因編輯技術(shù)的進(jìn)步和發(fā)展,其在研究基因功能、治療遺傳病、制備基因修飾模型和治療癌癥、增強(qiáng)農(nóng)作物恢復(fù)力等方面發(fā)揮著愈發(fā)重要的作用。
然而,創(chuàng)建一個高效的基因編輯系統(tǒng),不僅需要對CRISPR深入了解,還要經(jīng)過復(fù)雜的實驗,這需要投入大量的時間和進(jìn)行專業(yè)的科研訓(xùn)練。
近年來,LLM在日常對話、世界知識、圖像生成等方面展現(xiàn)出巨大的應(yīng)用潛力。LLM技術(shù)的發(fā)展為解決科學(xué)問題提供了新的契機(jī)的同時,AIforScience應(yīng)用也日益增多。此前,已有化學(xué)家通過LLM構(gòu)建智能體,輔助科研人員進(jìn)行實驗設(shè)計和化學(xué)合成方案制定。
基于其他領(lǐng)域的成功應(yīng)用案例,結(jié)合以基因編輯作為工具解決生物學(xué)問題的實際需求,該團(tuán)隊提出了一個關(guān)鍵問題:能否將LLM應(yīng)用于基因編輯領(lǐng)域,通過智能體為研究人員提供專業(yè)輔助?
理論上雖然可行,但實際應(yīng)用中面臨諸多挑戰(zhàn):通用LLM存在幻覺等固有問題,且由于缺乏專業(yè)領(lǐng)域知識,無法為研究人員提供精準(zhǔn)、具體的基因編輯設(shè)計方案。該團(tuán)隊發(fā)現(xiàn),通用LLM的輸出結(jié)果缺乏一致性,往往會提供眾多不同的選擇方案,導(dǎo)致研究人員難以確定最適合的基因編輯系統(tǒng)。
(來源:NatureBiomedicalEngineering)
為解決這些問題,CRISPR-GPT的每個模塊都通過將LLM與特定領(lǐng)域的生物數(shù)據(jù)進(jìn)行微調(diào)來優(yōu)化,以確?;蚓庉嫻ぷ鞯臏?zhǔn)確性和效率,用戶可以根據(jù)特定研究需求靈活調(diào)整設(shè)計方案。
這一創(chuàng)新的人工智能工具采用思維鏈推理模型和狀態(tài)機(jī)架構(gòu),確保即使是基因編輯領(lǐng)域的“新手”生物學(xué)家,也能夠迭代優(yōu)化實驗設(shè)計。該系統(tǒng)可完成多種基因編輯任務(wù),包括CRISPR基因敲除、表觀遺傳編輯、先導(dǎo)編輯、堿基編輯等。
CRISPR-GPT的核心優(yōu)勢在于,充分利用LLM的推理能力來處理自然語言交互。用戶無需按照固定模式輸入需求,而是像咨詢專家一樣自然提問,系統(tǒng)便能協(xié)助解決基因編輯實驗設(shè)計中的各類問題。
斯坦福大學(xué)叢樂課題組博士研究生屈元昊的主要研究方向包括基因編輯、單細(xì)胞測序以及人工智能在生物醫(yī)學(xué)中的應(yīng)用。他對DeepTech表示:“據(jù)我了解,這是首次將大模型應(yīng)用于基因編輯實驗設(shè)計的研究。我們的核心創(chuàng)新在于讓AI真正理解基因編輯的專業(yè)知識,并能像領(lǐng)域?qū)<乙粯舆M(jìn)行推理和決策?!?/p>
三種模式:通過智能交互“量身定制”CRISPR基因編輯實驗
目前,CRISPR-GPT共有三種交互模式,分別適用于不同背景的研究人員,真正實現(xiàn)個性化的基因編輯實驗設(shè)計。
第一,預(yù)設(shè)模式。該模式適用于對基因編輯不太熟悉的研究人員(初學(xué)者),通過該模式能夠從最初的CRISPR系統(tǒng)選擇,一直到最后的數(shù)據(jù)分析,完整地做完基因編輯實驗。
第二,自動模式。這種模式比較適合具有基因編輯領(lǐng)域基礎(chǔ)的科研人員,以幫助他們解決某一個或某幾個問題,而不需要從頭開始基因編輯實驗。
例如,研究人員可以用自然語言的方式對該系統(tǒng)說:我想設(shè)計一個靶向于某基因的gRNA。在自動模式中,通過LLM的推理能力,讓它能夠具體地分析每個用戶不同的需求。
第三,問答模式。在研究人員對一些不熟悉的CRISPR系統(tǒng)進(jìn)行實驗時,可采用問答模式,自由地咨詢與CRISPR基因編輯實驗相關(guān)的問題。
(來源:NatureBiomedicalEngineering)
基于叢樂實驗室在基因編輯領(lǐng)域多年的技術(shù)積累,經(jīng)常會收到來自世界各地的學(xué)者咨詢關(guān)于CRISPR的各種問題。目前,研究人員正在將關(guān)于CRISPR問題和回答的數(shù)據(jù)集,與在網(wǎng)絡(luò)中提取關(guān)于CRISPR數(shù)據(jù)集整合到CRISPR-GPT中。
屈元昊表示:“我們將實驗室多年積累的CRISPR問答數(shù)據(jù)集整合到系統(tǒng)中,通過LLM進(jìn)行專門訓(xùn)練和微調(diào)。這樣CRISPR-GPT就能基于真實的專家知識為用戶提供更準(zhǔn)確、可靠的答案,進(jìn)而真正解決實際研究中遇到的問題?!?/p>
“專家級”智能決策:模擬專家思維提供精準(zhǔn)解決方案
CRISPR-GPT采用“專家思維”模式,通過逐步推理為用戶提供各類基因編輯實驗的智能化解決方案。
以遞送系統(tǒng)選擇為例,這是基因編輯領(lǐng)域一個關(guān)鍵且復(fù)雜的技術(shù)難題。在干細(xì)胞或免疫細(xì)胞的體內(nèi)編輯中,實驗成功與否很大程度上取決于遞送系統(tǒng)和CRISPR-Cas系統(tǒng)的匹配選擇。
傳統(tǒng)上,這個過程需要研究人員具備深厚的生物學(xué)背景,查閱大量文獻(xiàn),并憑借經(jīng)驗進(jìn)行判斷,既耗時又依賴個人專業(yè)水平。
CRISPR-GPT通過智能化方式解決這一難題。當(dāng)系統(tǒng)識別到特定生物學(xué)關(guān)鍵詞(如“A-375細(xì)胞”)時,會自動關(guān)聯(lián)到其細(xì)胞類型特征(腫瘤細(xì)胞系)。
基于預(yù)設(shè)的專家知識,系統(tǒng)首先提出幾個可能的備選遞送方案(如逆轉(zhuǎn)錄病毒遞送系統(tǒng))。接下來,系統(tǒng)會進(jìn)行實時文獻(xiàn)搜索,參考學(xué)術(shù)引用數(shù)據(jù)等指標(biāo)對備選方案進(jìn)行綜合評估,最終為用戶提供1-2個最優(yōu)的遞送系統(tǒng)選擇。
屈元昊表示:“我們的核心理念是讓AI像專家一樣思考問題。系統(tǒng)不僅具備專業(yè)知識,還配備了實時文獻(xiàn)搜索等工具,能夠智能化地為用戶推薦最適合的遞送系統(tǒng)。這完全改變了傳統(tǒng)依賴個人經(jīng)驗和手工查閱文獻(xiàn)的研究模式,讓基因編輯實驗設(shè)計變得更高效、更精準(zhǔn)?!?/p>
(來源:NatureBiomedicalEngineering)
在一項針對人類肺癌細(xì)胞系的實驗中,CRISPR-GPT成功設(shè)計了針對TGFβR1、SNAI1、BAX和BCL2L1四個關(guān)鍵基因的敲除實驗,并通過CRISPR-Cas12a系統(tǒng)進(jìn)行高效的基因編輯。根據(jù)實驗結(jié)果,這些基因的編輯效率高達(dá)80%。
在另一項針對人類黑色素瘤細(xì)胞系的實驗中,CRISPR-GPT成功設(shè)計并實施了對NCR3LG1和CEACAM1兩個基因的表觀遺傳激活實驗。結(jié)果證明,這兩個基因的表達(dá)水平得到了明顯提高。上述兩項實驗不僅表現(xiàn)優(yōu)異,并且均一次成功。
為評估CRISPR-GPT智能體的性能,該團(tuán)隊邀請了8名具有CRISPR和基因編輯專業(yè)知識的研究人員設(shè)計一系列任務(wù),測試CRISPR-GPT協(xié)助實驗設(shè)計的能力。
他們從準(zhǔn)確性、推理能力、完整性和簡潔性四個維度,將CRISPR-GPT與ChatGPT-3.5和ChatGPT-4o進(jìn)行對比評估。專家評估結(jié)果顯示,CRISPR-GPT在基因編輯實驗設(shè)計的上述四個方面以及綜合評分均優(yōu)于通用LLM。
為自動化生物科研開辟新道路
研發(fā)CRISPR-GPT是為了更好地促進(jìn)科研的發(fā)展,但是這也是一把“雙刃劍”,不能忽視可能帶來的倫理道德和基因編輯安全等相關(guān)問題。
為此,該團(tuán)隊通過與倫理道德專家和基因編輯安全專家交流和討論,采取了一系列預(yù)防措施。比如,通過設(shè)計關(guān)鍵詞過濾和指導(dǎo)原則等,對人類受試者的應(yīng)用限制、保護(hù)遺傳信息的隱私以及對可能出現(xiàn)的意外結(jié)果(例如編輯更強(qiáng)大的病毒)的警告。
總體來說,CRISPR-GPT實現(xiàn)了簡化、自動化復(fù)雜生物學(xué)研究的基因編輯實驗的設(shè)計過程。由于該系統(tǒng)集成了LLM與學(xué)科專業(yè)知識、外部工具和模塊化任務(wù)執(zhí)行系統(tǒng),研究人員可以更簡易、更準(zhǔn)確、更高效地計劃和開展基因編輯的相關(guān)實驗。
“這項研究為自動化生物科研開辟了新道路。目前我們正在不斷優(yōu)化技術(shù),解決實際應(yīng)用中的各種挑戰(zhàn)。我相信未來會有更多生物學(xué)研究能夠借助AI和機(jī)器學(xué)習(xí)技術(shù)來完成,這將徹底改變科研的工作方式。”屈元昊說。
用機(jī)器幫助和替代人類執(zhí)行實驗任務(wù),能夠減輕科研人員的工作負(fù)擔(dān),并極大地加速探索科學(xué)的進(jìn)展;而人類的最主要工作是思考、判斷、設(shè)計實驗,以及發(fā)現(xiàn)需要解決的科學(xué)問題。
該團(tuán)隊希望未來可以通過所開發(fā)的智能體控制機(jī)器人或自動化實驗平臺,真正地實現(xiàn)用先進(jìn)的工具幫科研人員全自動地做實驗,或生產(chǎn)基因編輯的細(xì)胞等模式。
隨著基因編輯工程領(lǐng)域的不斷發(fā)展,CRISPR-GPT與自動化實驗室的集成平臺和機(jī)器人技術(shù)的進(jìn)步,為加速科學(xué)發(fā)現(xiàn)和研究相關(guān)疾病帶來了新的希望。
目前,該課題組還有一系列基于生物醫(yī)學(xué)智能體研發(fā)的相關(guān)工作正在進(jìn)行中。感興趣的讀者可以訪問genomics.stanford.edu了解最新進(jìn)展,并參與CRISPR-GPT智能體的beta測試。
參考資料:
1.Qu,Y.etal.CRISPR-GPTforagenticautomationofgene-editingexperiments.NatureBiomedicalEngineering(2025).
https://www.nature.com/articles/s41551-025-01463-z
2.Cong,L.etal.MultiplexGenomeEngineeringUsingCRISPR/CasSystems.Science339,6121,819-823(2013).
https://www.science.org/doi/abs/10.1126/science.1231143
運營/排版:何晨龍
新寫完的五部架空歷史文
《三國:開局鎮(zhèn)守國門十年》 作者:山海星辰內(nèi)容簡介:“大皇子,即刻前往邊疆,鎮(zhèn)守邊關(guān),若無召喚,不得回京!”一道旨意,將劉歷發(fā)配邊境,終生不得返京-——。本以為自己會在數(shù)年后,戰(zhàn)死沙場,卻意外覺醒了神級簽到系統(tǒng)?!版?zhèn)守邊關(guān)一年,獎勵神級英雄一位-。”“鎮(zhèn)守邊關(guān)兩年,獎勵神級兵團(tuán)一支”“鎮(zhèn)守邊關(guān)五年