近期,美國斯坦福大學叢樂教授、美國普林斯頓大學王夢迪教授與谷歌DeepMind團隊合作,首次將大語言模型(LLM,LargeLanguageModel)用于基因編輯實驗,成功開發(fā)出一種名為CRISPR-GPT的智能體系統(tǒng)。
值得關注的是,它能夠綜合利用LLM的計算效率和特定領域的知識,實現(xiàn)為研究人員解決CRISPR基因編輯實驗“量身定制”的自動化設計與分析。
圖丨后排中間為叢樂,前排左二為屈元昊(來源:屈元昊)
該系統(tǒng)為研究人員提供智能化的基因編輯方案設計,在確保編輯精準性的同時,顯著降低了實驗操作的復雜性。具體包括:基因編輯實驗設計、CRISPR系統(tǒng)的選擇、設計指導gRNA序列、推薦細胞遞送方法、預測脫靶效應、推薦實驗程序和設計驗證修改、實驗的數(shù)據分析、確認編輯結果的過程。
該研究顯示出CRISPR-GPT在促進復雜生物發(fā)現(xiàn)任務方面的潛力,有望加速生物、醫(yī)學、農業(yè)等領域的發(fā)現(xiàn)和應用。
近日,相關論文以《CRISPR-GPT:基因編輯實驗的智能體自動化》(CRISPR-GPTforagenticautomationofgene-editingexperiment)為題發(fā)表在NatureBiomedicalEngineering上[1]。斯坦福大學博士研究生屈元昊和普林斯頓大學博士研究生黃凱旋是共同第一作者,斯坦福大學叢樂教授和普林斯頓大學王夢迪教授擔任共同通訊作者。
圖丨相關論文(來源:NatureBiomedicalEngineering)
首次將大模型應用于基因編輯實驗設計
當下,基因編輯技術讓人們對基因信息的精確改變成為可能。2012年,基因編輯系統(tǒng)CRISPR-Cas9的問世,標志著該領域取得重大突破。
2013年,基因編輯先驅、美國國家科學院院士張鋒教授與叢樂等人(后者為第一作者),在Science發(fā)表CPISPR基因編輯的突破性論文《利用CRISPR/Cas系統(tǒng)的多重基因組工程》(MultiplexGenomeEngineeringUsingCRISPR/CasSystems)[2]。
2020年,美國加州大學伯克利分校教授詹妮弗·杜德納(JenniferDoudna)以及德國馬克斯普朗克感染生物學研究所教授埃馬紐爾·夏彭蒂耶(EmmanuelleCharpentier),因在CRISPR-Cas9的貢獻而獲得諾貝爾化學獎。
隨著基因編輯技術的進步和發(fā)展,其在研究基因功能、治療遺傳病、制備基因修飾模型和治療癌癥、增強農作物恢復力等方面發(fā)揮著愈發(fā)重要的作用。
然而,創(chuàng)建一個高效的基因編輯系統(tǒng),不僅需要對CRISPR深入了解,還要經過復雜的實驗,這需要投入大量的時間和進行專業(yè)的科研訓練。
近年來,LLM在日常對話、世界知識、圖像生成等方面展現(xiàn)出巨大的應用潛力。LLM技術的發(fā)展為解決科學問題提供了新的契機的同時,AIforScience應用也日益增多。此前,已有化學家通過LLM構建智能體,輔助科研人員進行實驗設計和化學合成方案制定。
基于其他領域的成功應用案例,結合以基因編輯作為工具解決生物學問題的實際需求,該團隊提出了一個關鍵問題:能否將LLM應用于基因編輯領域,通過智能體為研究人員提供專業(yè)輔助?
理論上雖然可行,但實際應用中面臨諸多挑戰(zhàn):通用LLM存在幻覺等固有問題,且由于缺乏專業(yè)領域知識,無法為研究人員提供精準、具體的基因編輯設計方案。該團隊發(fā)現(xiàn),通用LLM的輸出結果缺乏一致性,往往會提供眾多不同的選擇方案,導致研究人員難以確定最適合的基因編輯系統(tǒng)。
(來源:NatureBiomedicalEngineering)
為解決這些問題,CRISPR-GPT的每個模塊都通過將LLM與特定領域的生物數(shù)據進行微調來優(yōu)化,以確保基因編輯工作的準確性和效率,用戶可以根據特定研究需求靈活調整設計方案。
這一創(chuàng)新的人工智能工具采用思維鏈推理模型和狀態(tài)機架構,確保即使是基因編輯領域的“新手”生物學家,也能夠迭代優(yōu)化實驗設計。該系統(tǒng)可完成多種基因編輯任務,包括CRISPR基因敲除、表觀遺傳編輯、先導編輯、堿基編輯等。
CRISPR-GPT的核心優(yōu)勢在于,充分利用LLM的推理能力來處理自然語言交互。用戶無需按照固定模式輸入需求,而是像咨詢專家一樣自然提問,系統(tǒng)便能協(xié)助解決基因編輯實驗設計中的各類問題。
斯坦福大學叢樂課題組博士研究生屈元昊的主要研究方向包括基因編輯、單細胞測序以及人工智能在生物醫(yī)學中的應用。他對DeepTech表示:“據我了解,這是首次將大模型應用于基因編輯實驗設計的研究。我們的核心創(chuàng)新在于讓AI真正理解基因編輯的專業(yè)知識,并能像領域專家一樣進行推理和決策?!?/p>
三種模式:通過智能交互“量身定制”CRISPR基因編輯實驗
目前,CRISPR-GPT共有三種交互模式,分別適用于不同背景的研究人員,真正實現(xiàn)個性化的基因編輯實驗設計。
第一,預設模式。該模式適用于對基因編輯不太熟悉的研究人員(初學者),通過該模式能夠從最初的CRISPR系統(tǒng)選擇,一直到最后的數(shù)據分析,完整地做完基因編輯實驗。
第二,自動模式。這種模式比較適合具有基因編輯領域基礎的科研人員,以幫助他們解決某一個或某幾個問題,而不需要從頭開始基因編輯實驗。
例如,研究人員可以用自然語言的方式對該系統(tǒng)說:我想設計一個靶向于某基因的gRNA。在自動模式中,通過LLM的推理能力,讓它能夠具體地分析每個用戶不同的需求。
第三,問答模式。在研究人員對一些不熟悉的CRISPR系統(tǒng)進行實驗時,可采用問答模式,自由地咨詢與CRISPR基因編輯實驗相關的問題。
(來源:NatureBiomedicalEngineering)
基于叢樂實驗室在基因編輯領域多年的技術積累,經常會收到來自世界各地的學者咨詢關于CRISPR的各種問題。目前,研究人員正在將關于CRISPR問題和回答的數(shù)據集,與在網絡中提取關于CRISPR數(shù)據集整合到CRISPR-GPT中。
屈元昊表示:“我們將實驗室多年積累的CRISPR問答數(shù)據集整合到系統(tǒng)中,通過LLM進行專門訓練和微調。這樣CRISPR-GPT就能基于真實的專家知識為用戶提供更準確、可靠的答案,進而真正解決實際研究中遇到的問題?!?/p>
“專家級”智能決策:模擬專家思維提供精準解決方案
CRISPR-GPT采用“專家思維”模式,通過逐步推理為用戶提供各類基因編輯實驗的智能化解決方案。
以遞送系統(tǒng)選擇為例,這是基因編輯領域一個關鍵且復雜的技術難題。在干細胞或免疫細胞的體內編輯中,實驗成功與否很大程度上取決于遞送系統(tǒng)和CRISPR-Cas系統(tǒng)的匹配選擇。
傳統(tǒng)上,這個過程需要研究人員具備深厚的生物學背景,查閱大量文獻,并憑借經驗進行判斷,既耗時又依賴個人專業(yè)水平。
CRISPR-GPT通過智能化方式解決這一難題。當系統(tǒng)識別到特定生物學關鍵詞(如“A-375細胞”)時,會自動關聯(lián)到其細胞類型特征(腫瘤細胞系)。
基于預設的專家知識,系統(tǒng)首先提出幾個可能的備選遞送方案(如逆轉錄病毒遞送系統(tǒng))。接下來,系統(tǒng)會進行實時文獻搜索,參考學術引用數(shù)據等指標對備選方案進行綜合評估,最終為用戶提供1-2個最優(yōu)的遞送系統(tǒng)選擇。
屈元昊表示:“我們的核心理念是讓AI像專家一樣思考問題。系統(tǒng)不僅具備專業(yè)知識,還配備了實時文獻搜索等工具,能夠智能化地為用戶推薦最適合的遞送系統(tǒng)。這完全改變了傳統(tǒng)依賴個人經驗和手工查閱文獻的研究模式,讓基因編輯實驗設計變得更高效、更精準?!?/p>
(來源:NatureBiomedicalEngineering)
在一項針對人類肺癌細胞系的實驗中,CRISPR-GPT成功設計了針對TGFβR1、SNAI1、BAX和BCL2L1四個關鍵基因的敲除實驗,并通過CRISPR-Cas12a系統(tǒng)進行高效的基因編輯。根據實驗結果,這些基因的編輯效率高達80%。
在另一項針對人類黑色素瘤細胞系的實驗中,CRISPR-GPT成功設計并實施了對NCR3LG1和CEACAM1兩個基因的表觀遺傳激活實驗。結果證明,這兩個基因的表達水平得到了明顯提高。上述兩項實驗不僅表現(xiàn)優(yōu)異,并且均一次成功。
為評估CRISPR-GPT智能體的性能,該團隊邀請了8名具有CRISPR和基因編輯專業(yè)知識的研究人員設計一系列任務,測試CRISPR-GPT協(xié)助實驗設計的能力。
他們從準確性、推理能力、完整性和簡潔性四個維度,將CRISPR-GPT與ChatGPT-3.5和ChatGPT-4o進行對比評估。專家評估結果顯示,CRISPR-GPT在基因編輯實驗設計的上述四個方面以及綜合評分均優(yōu)于通用LLM。
為自動化生物科研開辟新道路
研發(fā)CRISPR-GPT是為了更好地促進科研的發(fā)展,但是這也是一把“雙刃劍”,不能忽視可能帶來的倫理道德和基因編輯安全等相關問題。
為此,該團隊通過與倫理道德專家和基因編輯安全專家交流和討論,采取了一系列預防措施。比如,通過設計關鍵詞過濾和指導原則等,對人類受試者的應用限制、保護遺傳信息的隱私以及對可能出現(xiàn)的意外結果(例如編輯更強大的病毒)的警告。
總體來說,CRISPR-GPT實現(xiàn)了簡化、自動化復雜生物學研究的基因編輯實驗的設計過程。由于該系統(tǒng)集成了LLM與學科專業(yè)知識、外部工具和模塊化任務執(zhí)行系統(tǒng),研究人員可以更簡易、更準確、更高效地計劃和開展基因編輯的相關實驗。
“這項研究為自動化生物科研開辟了新道路。目前我們正在不斷優(yōu)化技術,解決實際應用中的各種挑戰(zhàn)。我相信未來會有更多生物學研究能夠借助AI和機器學習技術來完成,這將徹底改變科研的工作方式?!鼻徽f。
用機器幫助和替代人類執(zhí)行實驗任務,能夠減輕科研人員的工作負擔,并極大地加速探索科學的進展;而人類的最主要工作是思考、判斷、設計實驗,以及發(fā)現(xiàn)需要解決的科學問題。
該團隊希望未來可以通過所開發(fā)的智能體控制機器人或自動化實驗平臺,真正地實現(xiàn)用先進的工具幫科研人員全自動地做實驗,或生產基因編輯的細胞等模式。
隨著基因編輯工程領域的不斷發(fā)展,CRISPR-GPT與自動化實驗室的集成平臺和機器人技術的進步,為加速科學發(fā)現(xiàn)和研究相關疾病帶來了新的希望。
目前,該課題組還有一系列基于生物醫(yī)學智能體研發(fā)的相關工作正在進行中。感興趣的讀者可以訪問genomics.stanford.edu了解最新進展,并參與CRISPR-GPT智能體的beta測試。
參考資料:
1.Qu,Y.etal.CRISPR-GPTforagenticautomationofgene-editingexperiments.NatureBiomedicalEngineering(2025).
https://www.nature.com/articles/s41551-025-01463-z
2.Cong,L.etal.MultiplexGenomeEngineeringUsingCRISPR/CasSystems.Science339,6121,819-823(2013).
https://www.science.org/doi/abs/10.1126/science.1231143
運營/排版:何晨龍
婚姻就是有人記得你喝奶茶要三分甜
編輯精選年度好書《奶茶三分甜》,追完秒變檸檬精!??女生小說研究所
《原味三分甜》奶茶店老板x社恐漫畫師,很暖很甜,看了想談戀愛