想象這樣一個(gè)未來:人工智能正悄然重塑軟件開發(fā)行業(yè),它可以精準(zhǔn)重構(gòu)混亂代碼,高效遷移遺留系統(tǒng),智能排查競態(tài)條件,而人類工程師得以專注于更具創(chuàng)造性的架構(gòu)設(shè)計(jì)和創(chuàng)新性問題解決。這一看似觸手可及的未來愿景,在麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)最新發(fā)表的研究中獲得了嚴(yán)謹(jǐn)審視。
“人人都說不再需要程序員,自動化工具已遍地?!盡IT教授、CSAIL首席研究員、論文資深作者ArmandoSolar-Lezama說,“工具確實(shí)強(qiáng)大,可離真正的自動化愿景仍有距離?!?/p>
由麻省理工學(xué)院(MIT)教授ArmandoSolar-Lezama領(lǐng)銜,聯(lián)合加州大學(xué)伯克利分校、康奈爾大學(xué)、斯坦福大學(xué)等多所頂尖院校的專家,發(fā)表了一篇題為《邁向AI軟件工程的挑戰(zhàn)與路徑》的文章,通過系統(tǒng)性的實(shí)證分析,揭示了當(dāng)前AI輔助軟件開發(fā)所面臨的三大核心挑戰(zhàn)。
評估體系亟待更新。研究指出,當(dāng)前主流的SWE-Bench評估標(biāo)準(zhǔn)存在明顯不足。測試案例通常僅涉及幾百行代碼,遠(yuǎn)不及企業(yè)級項(xiàng)目的規(guī)模;評估場景過于簡單,無法反映真實(shí)的工程挑戰(zhàn);更存在數(shù)據(jù)泄露的風(fēng)險(xiǎn)。這種“本科編程練習(xí)”式的評估,難以準(zhǔn)確衡量AI在實(shí)際開發(fā)環(huán)境中的表現(xiàn)。而真實(shí)的工作要復(fù)雜得多,包括日常重構(gòu)優(yōu)化設(shè)計(jì);把數(shù)百萬行COBOL遷往Java重塑業(yè)務(wù);持續(xù)測試與分析——模糊測試、屬性測試——抓并發(fā)漏洞、修零日;還要給十年老代碼補(bǔ)文檔等維護(hù)工作。
人機(jī)協(xié)作瓶頸。論文第一作者AlexGu指出,現(xiàn)有AI編程助手與開發(fā)者的交互就像“一條纖細(xì)的通信線”。具體表現(xiàn)在,開發(fā)者對AI輸出的控制力有限,生成的代碼是一個(gè)龐大而無結(jié)構(gòu)的文件,外加流于表面的測試;系統(tǒng)缺乏表達(dá)自信度的機(jī)制,無法標(biāo)識需要人工復(fù)核的代碼段;對專業(yè)開發(fā)工具的支持不足,難以有效運(yùn)用調(diào)試器等專業(yè)工具。這些問題導(dǎo)致開發(fā)者可能盲目信任那些能通過編譯卻在運(yùn)行時(shí)出錯(cuò)的代碼。
規(guī)?;奶魬?zhàn)更為嚴(yán)峻。研究表明,在面對企業(yè)級代碼庫時(shí),AI表現(xiàn)明顯下降。由于每家公司的代碼庫都具有獨(dú)特性,AI常常生成看似合理但不符合特定企業(yè)規(guī)范的“幻覺代碼”。此外,基于語法相似性的檢索方法也經(jīng)常出現(xiàn)誤判。
針對這些挑戰(zhàn),研究團(tuán)隊(duì)從三方面提出了突破性的解決方案。
數(shù)據(jù)層面,建議建立包含開發(fā)全流程的增強(qiáng)數(shù)據(jù)集,重點(diǎn)記錄代碼取舍決策過程、重構(gòu)演變軌跡等技術(shù)細(xì)節(jié);評估體系需要開發(fā)多維度框架,特別關(guān)注重構(gòu)質(zhì)量指數(shù)、缺陷修復(fù)持久性等關(guān)鍵指標(biāo);在協(xié)作機(jī)制上,應(yīng)設(shè)計(jì)新型人機(jī)交互界面,實(shí)現(xiàn)不確定性可視化、決策過程可追溯等高級功能。
AlexGu將其稱之為需多方參與的“開源行動”;Solar-Lezama則期待漸進(jìn)式地突破反哺商業(yè)工具,把AI從補(bǔ)全助手變?yōu)檎嬲暮献骰锇椤?/p>
“軟件已經(jīng)支撐著金融、交通、醫(yī)療保健以及日常生活的方方面面,而構(gòu)建和安全地維護(hù)軟件所需的人力正在成為瓶頸。能擔(dān)臟活且不埋雷的AI,將解放人去創(chuàng)造、決策、守倫理?!盙u說,“但前提是我們承認(rèn),補(bǔ)全最簡單,其余最難。我們的目標(biāo)不是取代程序員,而是增強(qiáng)他們的能力。當(dāng)人工智能能夠處理枯燥與可怕的事情時(shí),人類工程師可以將時(shí)間投入到只有人類才能做的事情上?!?/p>
1.https://news.mit.edu/2025/can-ai-really-code-study-maps-roadblocks-to-autonomous-software-engineering-0716