不信馬列信鬼神 徐學(xué)陽(yáng)被開(kāi)除黨籍
中國(guó)臺(tái)灣地區(qū)被美國(guó)征收20%關(guān)稅
成渝中線高鐵開(kāi)通后將成為中國(guó)最快高鐵,時(shí)速可達(dá) 400 公里,為何是這條線路「搶鮮」?可能全面推廣嗎?
多年來(lái),美國(guó)伊利諾伊大學(xué)香檳分校博士畢業(yè)生、Keiji.AI公司聯(lián)合創(chuàng)始人王子豐一直在研究將AI應(yīng)用于臨床試驗(yàn),并已開(kāi)展多個(gè)相關(guān)項(xiàng)目,包括開(kāi)發(fā)用于臨床試驗(yàn)系統(tǒng)評(píng)價(jià)的輔助工具TrialMind[1]和LEADS[2],提升試驗(yàn)招募效率的TrialGPT[3],支持生物醫(yī)學(xué)數(shù)據(jù)分析的智能平臺(tái)DSWizard[4,5],以及自動(dòng)生成臨床試驗(yàn)文檔的系統(tǒng)InformGen[6]。
圖|王子豐(來(lái)源:王子豐)
在推進(jìn)這些研究的過(guò)程中,王子豐逐漸意識(shí)到,盡管制藥業(yè)內(nèi)對(duì)AI在臨床試驗(yàn)中的應(yīng)用充滿期待,但仍面臨諸多關(guān)鍵挑戰(zhàn)。
首先,目前缺乏有效的評(píng)估手段,使得大模型難以在臨床試驗(yàn)場(chǎng)景中實(shí)現(xiàn)可驗(yàn)證、可落地的應(yīng)用。
其次,真正理解制藥行業(yè)實(shí)踐的專(zhuān)業(yè)人士與AI技術(shù)專(zhuān)家之間存在明顯的知識(shí)壁壘,跨領(lǐng)域協(xié)同不足,也限制了技術(shù)轉(zhuǎn)化的深度和廣度。
而在構(gòu)建垂直領(lǐng)域模型和Agent的過(guò)程中,人們又面臨著兩個(gè)根本性的問(wèn)題:一是缺乏結(jié)構(gòu)清晰、適合AI訓(xùn)練的高質(zhì)量數(shù)據(jù)資源,二是缺乏貼近真實(shí)臨床試驗(yàn)任務(wù)、能夠系統(tǒng)評(píng)估模型能力的基準(zhǔn)任務(wù)集。
業(yè)界其實(shí)有一些出售臨床試驗(yàn)商業(yè)數(shù)據(jù)的公司比如Citeline,但是這些數(shù)據(jù)都非常昂貴,一般大型的制藥企業(yè)可能每年向他們支付數(shù)百萬(wàn)美元以上來(lái)獲取這些信息。而公共數(shù)據(jù)比如ClinicalTrials.gov只包括了在美國(guó)注冊(cè)的試驗(yàn)記錄,而很多的多個(gè)國(guó)家試驗(yàn)記錄以及發(fā)表的試驗(yàn)都需要被額外收集和標(biāo)準(zhǔn)化處理。
基于上述問(wèn)題,王子豐等人啟動(dòng)了本項(xiàng)研究,構(gòu)建了臨床試驗(yàn)領(lǐng)域的大規(guī)模結(jié)構(gòu)化數(shù)據(jù)庫(kù)TrialPanorama[7],匯聚了試驗(yàn)設(shè)計(jì)、干預(yù)手段、適應(yīng)癥、生物標(biāo)志物、結(jié)局指標(biāo)等核心要素,并對(duì)接權(quán)威醫(yī)學(xué)本體,確保數(shù)據(jù)的一致性與可擴(kuò)展性。在此基礎(chǔ)上,研究團(tuán)隊(duì)進(jìn)一步設(shè)計(jì)了一套配套的評(píng)測(cè)任務(wù)集,涵蓋從文獻(xiàn)評(píng)價(jià)到試驗(yàn)設(shè)計(jì)的多個(gè)關(guān)鍵環(huán)節(jié),以用于系統(tǒng)性地評(píng)估AI模型在臨床試驗(yàn)相關(guān)任務(wù)中的能力。該工作不僅為模型的訓(xùn)練與測(cè)試提供了高質(zhì)量數(shù)據(jù)支撐,也為后續(xù)開(kāi)發(fā)AIAgent提供數(shù)據(jù)源。
如前所述,本次研究的主要成果是構(gòu)建了一個(gè)覆蓋廣泛、結(jié)構(gòu)清晰的臨床試驗(yàn)數(shù)據(jù)庫(kù)TrialPanorama,共收錄了來(lái)自全球15個(gè)來(lái)源的1,657,476條臨床試驗(yàn)記錄以及匯總這些臨床試驗(yàn)的超過(guò)9,000篇系統(tǒng)評(píng)價(jià)論文。該數(shù)據(jù)庫(kù)系統(tǒng)性地整理了臨床試驗(yàn)設(shè)計(jì)與實(shí)施的關(guān)鍵要素,包括研究方案、干預(yù)方式、適應(yīng)癥、生物標(biāo)志物和結(jié)局指標(biāo)等,并與標(biāo)準(zhǔn)醫(yī)學(xué)本體(如DrugBank和MedDRA)進(jìn)行了對(duì)齊,具備良好的規(guī)范性與可擴(kuò)展性。
在此基礎(chǔ)上,研究團(tuán)隊(duì)還首次設(shè)計(jì)并發(fā)布了一套面向臨床試驗(yàn)任務(wù)的大模型評(píng)測(cè)基準(zhǔn),涵蓋系統(tǒng)評(píng)價(jià)和試驗(yàn)設(shè)計(jì)累計(jì)兩個(gè)類(lèi)別和八項(xiàng)任務(wù),這八項(xiàng)任務(wù)包括研究檢索、研究篩選、證據(jù)總結(jié)、試驗(yàn)組設(shè)計(jì)、入排標(biāo)準(zhǔn)制定、終點(diǎn)選擇、樣本量估計(jì)及完成情況評(píng)估。通過(guò)在五個(gè)當(dāng)前最先進(jìn)的大模型上開(kāi)展實(shí)驗(yàn),研究團(tuán)隊(duì)發(fā)現(xiàn)通用模型雖然具備一定的零樣本能力,但其表現(xiàn)尚不足以勝任高風(fēng)險(xiǎn)、要求嚴(yán)謹(jǐn)?shù)呐R床試驗(yàn)場(chǎng)景。
而本次工作不僅提供了一個(gè)高質(zhì)量的數(shù)據(jù)基礎(chǔ),還構(gòu)建了可用于訓(xùn)練、評(píng)估和推動(dòng)臨床試驗(yàn)AI研究的系統(tǒng)平臺(tái),有望為開(kāi)發(fā)更具專(zhuān)業(yè)性和實(shí)用性的智能系統(tǒng)奠定堅(jiān)實(shí)基礎(chǔ)。
(來(lái)源:https://arxiv.org/pdf/2505.16097)
本次研究成果具有廣泛的應(yīng)用前景,預(yù)計(jì)能在以下幾個(gè)方面發(fā)揮重要作用:
首先,TrialPanorama數(shù)據(jù)庫(kù)可以作為醫(yī)藥研發(fā)和醫(yī)學(xué)事務(wù)中基于AI的知識(shí)發(fā)現(xiàn)平臺(tái)。例如,人們可以借助該數(shù)據(jù)庫(kù)檢索某一適應(yīng)癥下既往的治療手段及其結(jié)果、正在研發(fā)中的同類(lèi)藥物等關(guān)鍵信息,從而輔助制定更科學(xué)、更具前瞻性的臨床試驗(yàn)方案。
其次,該數(shù)據(jù)庫(kù)為訓(xùn)練大模型提供了數(shù)據(jù)基礎(chǔ)。由于其結(jié)構(gòu)清晰、覆蓋全面,非常適合用于生成高質(zhì)量的訓(xùn)練樣本,推動(dòng)更貼近臨床場(chǎng)景的專(zhuān)用語(yǔ)言模型的開(kāi)發(fā)。同時(shí),研究團(tuán)隊(duì)發(fā)布的benchmark也為評(píng)估現(xiàn)有及未來(lái)的大模型在臨床試驗(yàn)任務(wù)中的表現(xiàn)提供了統(tǒng)一、專(zhuān)業(yè)的測(cè)試框架。
最后,對(duì)于當(dāng)前越來(lái)越多專(zhuān)注于臨床試驗(yàn)領(lǐng)域的AIAgent系統(tǒng)來(lái)說(shuō),TrialPanorama提供了結(jié)構(gòu)化、標(biāo)準(zhǔn)化的數(shù)據(jù)資源,并可以通過(guò)集成模型上下文協(xié)議(MCP,ModelContextProtocol)服務(wù)器實(shí)現(xiàn)快速接入與部署,從而助力構(gòu)建高可靠性、高專(zhuān)業(yè)度的垂類(lèi)AIAgent,為臨床研發(fā)帶來(lái)賦能。
(來(lái)源:https://arxiv.org/pdf/2505.16097)
多年前,王子豐就開(kāi)始研究AI,同時(shí)做一些AIforhealthcare。一開(kāi)始進(jìn)入這個(gè)方向時(shí),他覺(jué)得有很多的“l(fā)ow-hangingfruit”,他認(rèn)為只要把大模型用上、Agent搭起來(lái),然后就可以開(kāi)展很多臨床試驗(yàn)的任務(wù)。但是,當(dāng)他真正在項(xiàng)目中和醫(yī)生、藥廠的研發(fā)人員、銷(xiāo)售等各類(lèi)角色深度接觸之后,王子豐才意識(shí)到很多現(xiàn)實(shí)中的核心需求,其實(shí)并沒(méi)有被很好地抽象成AI問(wèn)題然后被做AI的人們注意到。
這中間有很多令人反思的時(shí)刻。比如他經(jīng)常看到一些很酷炫的大模型demo,但是藥廠的合作方告訴他,他們可能也會(huì)去嘗試一下,然而很多時(shí)候?qū)嶋H效果往往不能達(dá)到可用的程度,或者說(shuō)由于公司的合規(guī)性要求這些工具還不能夠嵌入他們的工作流。
而作為一名AI研究者,王子豐認(rèn)為得學(xué)會(huì)放下自嗨的技術(shù)視角,真正去傾聽(tīng)用戶的痛點(diǎn),理解他們的工作流程、合規(guī)限制和實(shí)際目標(biāo),然后再回過(guò)頭來(lái)重新定義問(wèn)題,想辦法用AI去解決。
同時(shí),這個(gè)“對(duì)話”和“重構(gòu)”的過(guò)程,是王子豐在本次研究之中認(rèn)為最有價(jià)值、也是最難忘的部分。這不僅僅凸顯了當(dāng)前的一些技術(shù)挑戰(zhàn),更是對(duì)于跨學(xué)科協(xié)作、產(chǎn)品思維、溝通能力的一種錘煉。
至于創(chuàng)業(yè),它對(duì)王子豐來(lái)說(shuō)也是一種自然的延伸。王子豐覺(jué)得做應(yīng)用研究的人去創(chuàng)業(yè)其實(shí)非常合適。一方面你能從一線看到很多真實(shí)又有挑戰(zhàn)的問(wèn)題,另一方面你也有機(jī)會(huì)把研究成果真正落地,幫助到藥廠、醫(yī)生甚至患者。這種“從問(wèn)題中來(lái),到應(yīng)用中去”的過(guò)程,非常充實(shí),也讓王子豐找到了科研之外的成就感。
正因此,王子豐聯(lián)合創(chuàng)辦了Keiji.AI,在該公司他主要負(fù)責(zé)AI算法和應(yīng)用的開(kāi)發(fā)。該公司由王子豐的博士導(dǎo)師JimengSun教授領(lǐng)銜,團(tuán)隊(duì)成員主要來(lái)自美國(guó)伊利諾伊大學(xué)香檳分校的研究團(tuán)隊(duì)。公司致力于將研究團(tuán)隊(duì)多年來(lái)在AI醫(yī)療和臨床試驗(yàn)領(lǐng)域的研究成果轉(zhuǎn)化。
基于這一背景,研究團(tuán)隊(duì)開(kāi)發(fā)了TrialMind平臺(tái),集成了多種AIAgent和工作流程,并接入研究團(tuán)隊(duì)自建的TrialPanorama數(shù)據(jù)庫(kù),支持臨床試驗(yàn)的方案設(shè)計(jì)、隊(duì)列抽取、數(shù)據(jù)分析、患者招募等關(guān)鍵環(huán)節(jié)的智能化加速。
目前,研究團(tuán)隊(duì)的客戶和合作伙伴包括多家制藥公司(如Takeda、Abbvie、Regeneron)、真實(shí)世界數(shù)據(jù)公司(如Medidata、GuardantHealth),以及大型CRO(如IQVIA)。公司正處于快速發(fā)展階段,正在積極推進(jìn)融資并擴(kuò)大團(tuán)隊(duì)。而基于上述工作,他們正在基于本次數(shù)據(jù)庫(kù)開(kāi)發(fā)臨床試驗(yàn)的垂類(lèi)AIAgent和模型。
參考資料:
1.https://arxiv.org/abs/2406.17755
2.https://arxiv.org/abs/2501.16255
3.https://www.nature.com/articles/s41467-024-53081-z
4.https://arxiv.org/abs/2410.21591
5.https://arxiv.org/abs/2505.16100
6.https://arxiv.org/abs/2504.00934
7.https://arxiv.org/abs/2505.16097
王者:突然發(fā)現(xiàn)自己很菜是種感覺(jué)?玩家:很多人還在相信熟能生巧
王者榮耀:越玩越菜,開(kāi)始沒(méi)信心很正常,突破就變強(qiáng)反之則墜落
廠長(zhǎng)談不上場(chǎng)原因:我現(xiàn)在很菜打不了,玩家:復(fù)出就是為了營(yíng)銷(xiāo)