IT之家7月10日消息,隨著生成式人工智能(AI)技術(shù)不斷演進(jìn),其應(yīng)用場(chǎng)景已從早期的簡(jiǎn)單問(wèn)答擴(kuò)展到更復(fù)雜的任務(wù)。然而,對(duì)于缺乏技術(shù)背景的用戶(hù)而言,如何高效、準(zhǔn)確地使用這些AI工具,正變得越來(lái)越具有挑戰(zhàn)性。
一份獨(dú)立報(bào)告顯示,微軟AI部門(mén)收到的用戶(hù)投訴中,最常見(jiàn)的一條是“Copilot不如ChatGPT好用”。對(duì)此,微軟迅速回應(yīng),將問(wèn)題歸咎于用戶(hù)“提示詞工程能力不佳”。為改善用戶(hù)體驗(yàn),微軟還推出了“Copilot學(xué)院”,幫助用戶(hù)提升AI使用技能。
該研究指出,過(guò)度依賴(lài)AI工具獲取醫(yī)療建議可能帶來(lái)危險(xiǎn)。更令人擔(dān)憂的是,如果用戶(hù)在提問(wèn)時(shí)出現(xiàn)拼寫(xiě)錯(cuò)誤(如單詞拼錯(cuò)或多余空格),AI可能會(huì)因此建議用戶(hù)無(wú)需就醫(yī)。此外,使用花哨語(yǔ)言或俚語(yǔ)也可能導(dǎo)致AI判斷失誤。
研究還發(fā)現(xiàn),女性用戶(hù)比男性更容易受到此類(lèi)錯(cuò)誤建議的影響,盡管這一結(jié)論仍需進(jìn)一步驗(yàn)證。
此次研究涵蓋了多個(gè)AI工具,包括OpenAI的GPT-4、Meta的LLaMA-3-70B,以及一款名為Palmyra-Med的醫(yī)療專(zhuān)用AI。研究人員模擬了數(shù)千個(gè)健康案例,數(shù)據(jù)來(lái)源包括真實(shí)患者投訴、Reddit上的健康相關(guān)帖子,以及AI生成的病例。
為測(cè)試AI的穩(wěn)定性,研究人員在數(shù)據(jù)中加入了“擾動(dòng)因素”,如句子首字母大小寫(xiě)不一致、感嘆號(hào)、情緒化語(yǔ)言,以及“可能”“大概”等不確定表達(dá)。結(jié)果顯示,這些擾動(dòng)使AI建議用戶(hù)“無(wú)需就醫(yī)”的概率上升了7%至9%。
研究負(fù)責(zé)人、MIT研究員阿比尼塔?古拉巴蒂娜(AbinithaGourabathina)指出:“這些模型通常是在醫(yī)學(xué)考試題目上訓(xùn)練和測(cè)試的,但實(shí)際應(yīng)用場(chǎng)景卻相差甚遠(yuǎn),比如評(píng)估臨床病例的嚴(yán)重程度。我們對(duì)大語(yǔ)言模型的理解仍然非常有限?!?/p>
這一研究結(jié)果引發(fā)了對(duì)AI在醫(yī)療領(lǐng)域應(yīng)用的廣泛擔(dān)憂。值得注意的是,就在不久前,微軟剛剛宣布其新推出的AI醫(yī)療工具“準(zhǔn)確率是人類(lèi)醫(yī)生的4倍,成本卻低20%”。微軟AI首席執(zhí)行官甚至稱(chēng)其為“邁向醫(yī)療超級(jí)智能的真正一步”。
然而,這項(xiàng)研究再次提醒我們,生成式AI在醫(yī)療等高度復(fù)雜的領(lǐng)域仍遠(yuǎn)未達(dá)到完全可靠的水平。盡管技術(shù)發(fā)展迅速,但在真正投入使用前,仍需更多驗(yàn)證與審慎評(píng)估。
強(qiáng)推夜北《絕世煉丹師:紈绔九小姐》爆棚,必追
現(xiàn)代心理醫(yī)生來(lái)到古代,宅斗、商斗、宮斗都不能少,誰(shuí)叫她是掌家娘子呢。還有那個(gè)他,任你運(yùn)籌帷幄,卻要一招敗落,只因?yàn)槟悴徽J(rèn)識(shí)我,我可認(rèn)識(shí)你_——。嗚嗚~好不容易愛(ài)上一位娘子,就要賣(mài)萌、打滾、耍賴(lài),將她娶回去掌家。ps:作者云霓的《掌家娘子》寫(xiě)得真好,連著幾天一口氣讀完了-——。總算看到了男主重生的-|。蠻好看,沒(méi)有那種超時(shí)代 當(dāng)初我放官到靈州那個(gè)苦寒之地咱家里里外外都是娘子一人在操持著又能句句說(shuō)到妻子的痛處,處處為女兒著想_-。我選忠勤伯府的袁家我原就是因?yàn)榭炊嗽慕B是個(gè)好孩子能嫁一個(gè)有擔(dān)當(dāng)?shù)暮美删姆蚱藓湍狼偕网Q將來(lái)生兒育女一生和順前后不過(guò)十句話,一下子就平息了妻子怒火|。一個(gè)處事圓滑、精明,又有幾說(shuō)完了|。