記者|董溫淑
編輯|高宇雷
7月23日,「電廠」獲悉,夸克健康大模型已成功通過(guò)中國(guó)12門核心學(xué)科的主任醫(yī)師筆試評(píng)測(cè),成為國(guó)內(nèi)首個(gè)完成這一挑戰(zhàn)的大模型。
當(dāng)下“主任級(jí)AI醫(yī)生”能力已全面集成至夸克的AI搜索中,用戶在查詢健康問(wèn)題時(shí),選擇深度搜索即可調(diào)用。
另?yè)?jù)夸克健康運(yùn)營(yíng)負(fù)責(zé)人趙存忠介紹,憑借在醫(yī)學(xué)領(lǐng)域的專業(yè)性,夸克AI搜索已吸引了一大批醫(yī)學(xué)生和醫(yī)生群體。目前平臺(tái)在全國(guó)醫(yī)學(xué)生中月活用戶已突破200萬(wàn),覆蓋率過(guò)半,他們廣泛使用夸克用于基礎(chǔ)知識(shí)搜索、考試備考和臨床輔助診療。
對(duì)于健康大模型而言,如何提高正確率、盡可能降低幻覺(jué),是一個(gè)尤為重要的命題??淇私】邓惴ㄘ?fù)責(zé)人徐健舉例說(shuō),孕婦妊娠期是不能吃布洛芬的,屬于禁忌用藥。圍繞禁忌癥的正確性問(wèn)題,在Pretrain階段夸克準(zhǔn)備好藥品說(shuō)明書,在SFT階段夸克構(gòu)造一個(gè)禁忌癥問(wèn)答的有監(jiān)督學(xué)習(xí)任務(wù)提升模型做得對(duì)的概率,再在RLHF階段構(gòu)造錯(cuò)和對(duì)的對(duì)比例子,告訴模型區(qū)分錯(cuò)誤的邊界。
“當(dāng)我們?cè)谀P陀?xùn)練的3大環(huán)節(jié)上都掌握了對(duì)指定細(xì)微錯(cuò)誤的解決技術(shù),我們就可以全面的去解決好醫(yī)療中最重要的幻覺(jué)問(wèn)題”,徐健說(shuō)。
值得一提的是,本次的能力升級(jí),是夸克健康大模型繼5月通過(guò)副主任醫(yī)師職稱考試后實(shí)現(xiàn)的再次突破。與DeepSeek-R1(0528)模型、O3-mini模型的對(duì)比測(cè)評(píng)結(jié)果顯示,隨著醫(yī)師資格考試等級(jí)趨高、試題難度提升,夸克健康大模型呈現(xiàn)出領(lǐng)先優(yōu)勢(shì)增大的趨勢(shì)。
在發(fā)布會(huì)上,夸克團(tuán)隊(duì)介紹了健康大模型本次升級(jí)前在數(shù)據(jù)、訓(xùn)練方法、訓(xùn)練流程等方面進(jìn)行的設(shè)計(jì)。
比如構(gòu)建“雙數(shù)據(jù)產(chǎn)線+雙獎(jiǎng)勵(lì)機(jī)制”的工程體系。一方面,將醫(yī)學(xué)數(shù)據(jù)劃分為“可驗(yàn)證”和“不可驗(yàn)證”兩類,分別對(duì)應(yīng)診斷類任務(wù)和健康建議類任務(wù)。并且,夸克健康大模型搭建了擁有千人規(guī)模的專業(yè)醫(yī)師標(biāo)注團(tuán)隊(duì),其中超過(guò)400名均為副主任醫(yī)師及以上的高資歷醫(yī)療專家。
趙存忠補(bǔ)充道:“除了技術(shù)產(chǎn)品策略,我們也根據(jù)用戶側(cè)的問(wèn)題,在產(chǎn)品上進(jìn)行了分層處理,比如偏嚴(yán)肅醫(yī)療的問(wèn)題,會(huì)對(duì)回答的準(zhǔn)確性進(jìn)行明確界定,但是如果是偏健康飲食類的問(wèn)題,比如‘吃西瓜會(huì)不會(huì)中毒’,則會(huì)進(jìn)行相對(duì)差異化的設(shè)計(jì)。在產(chǎn)品上線前,我們針對(duì)效果會(huì)進(jìn)行評(píng)價(jià),滿意度準(zhǔn)確率至少達(dá)到90%以上才允許產(chǎn)品上線?!?/p>
在訓(xùn)練方法上引入“過(guò)程獎(jiǎng)勵(lì)模型”和“結(jié)果獎(jiǎng)勵(lì)模型”,分別評(píng)估模型推理鏈的合理性與最終結(jié)論的準(zhǔn)確性,顯著提升模型的臨床可解釋性和推理一致性。
徐健總結(jié)稱,本次夸克健康大模型的一大創(chuàng)新是構(gòu)建出了“慢思考能力”。該能力融合了鏈?zhǔn)酵评砼c多階段臨床演繹路徑建模,驅(qū)動(dòng)模型在面對(duì)復(fù)雜醫(yī)療問(wèn)題時(shí),能夠分階段、層層深入地推導(dǎo)出最終回答。
在發(fā)布會(huì)后的媒體溝通環(huán)節(jié),夸克健康產(chǎn)品負(fù)責(zé)人姚垚等人對(duì)「電廠」強(qiáng)調(diào),夸克健康大模型聚焦在提升用戶價(jià)值。
“這是我們業(yè)務(wù)方面的共識(shí),商業(yè)化方面,我們和一些服務(wù)機(jī)構(gòu)有一些輕度嘗試,比如說(shuō)服務(wù)機(jī)構(gòu)在用藥分等級(jí)方向上結(jié)合,但并不是作為主要推進(jìn)方向?!币愔v道。
延伸閱讀:與 已落地夸:克|深度搜索 的相關(guān)文章