本文來源:時代周報作者:朱成呈
2025年世界人工智能大會上,“AI賦能新型工業(yè)化”成為最具現(xiàn)實張力的熱詞之一。從生成式AI到具身智能機器人,從工業(yè)操作系統(tǒng)到行業(yè)大模型,AI正試圖一步步打通底層設(shè)備、中層系統(tǒng)與頂層決策的縱深鏈條。
據(jù)麥肯錫調(diào)研顯示,今年1月評選出的全球17家“燈塔工廠”中,AI幫助其在制造成本、生產(chǎn)周期時間和缺陷率等方面改善50%以上。然而,這些工廠中排名前五的用例有77%應(yīng)用到判別式AI,僅有9%應(yīng)用到生成式AI。
咨詢公司Gartner預(yù)測,到2029年,中國60%的企業(yè)將把AI融入主要產(chǎn)品與服務(wù),并依托其成為核心營收驅(qū)動力。但從“實驗室”走進“車間地板”,AI要穿透工業(yè)體系的多樣性、復(fù)雜性和高可靠性要求,至少還有三座“硬山”需要翻越:一是高質(zhì)量數(shù)據(jù)收集困難,二是模型幻覺難以容忍,三是場景適配難以規(guī)模復(fù)制。
這不僅是一場算法能力的競賽,更是一場工業(yè)理解力與系統(tǒng)工程力的長跑。
高質(zhì)量數(shù)據(jù)是前提條件
在通用大模型邁向工業(yè)場景的過程中,高質(zhì)量數(shù)據(jù)不是加分項,而是決定模型能否落地的前提條件。
中國電子信息產(chǎn)業(yè)發(fā)展研究院信息化與軟件產(chǎn)業(yè)研究所發(fā)布的研究報告指出,海量高質(zhì)量數(shù)據(jù)是大模型泛化涌現(xiàn)能力的基礎(chǔ)。從行業(yè)前沿趨勢來看,大模型訓(xùn)練使用的數(shù)據(jù)集規(guī)模呈現(xiàn)爆發(fā)式增長,對訓(xùn)練數(shù)據(jù)的數(shù)據(jù)量、多樣性和更新速度方面也提出更高的要求。
從國際演進軌跡來看,模型訓(xùn)練的數(shù)據(jù)規(guī)模正急劇膨脹。GPT-1的數(shù)據(jù)集為4.6GB,GPT-3達到753GB,而GPT-4的數(shù)據(jù)量是前者數(shù)十倍。據(jù)推測,GPT-5的訓(xùn)練數(shù)據(jù)有望突破200TB。
工業(yè)場景下,這一挑戰(zhàn)更為復(fù)雜。國金證券研報指出,工業(yè)領(lǐng)域涵蓋廣泛,包括41個工業(yè)大類、207個工業(yè)中類、666個工業(yè)小類,導(dǎo)致數(shù)據(jù)結(jié)構(gòu)多樣,數(shù)據(jù)質(zhì)量參差不齊。同時,由于工業(yè)生產(chǎn)過程中的各個環(huán)節(jié)相互交織,數(shù)據(jù)之間的關(guān)聯(lián)性和復(fù)雜性也較高。數(shù)據(jù)來源、采集方式、時間戳等都會影響數(shù)據(jù)的準(zhǔn)確性和完整性。
這種數(shù)據(jù)結(jié)構(gòu)的多樣與質(zhì)量的參差不齊,給工業(yè)大模型的訓(xùn)練和應(yīng)用帶來挑戰(zhàn)。工業(yè)AI構(gòu)建,需要投入大量的時間和資源進行數(shù)據(jù)清洗、預(yù)處理和校驗,以確保數(shù)據(jù)的準(zhǔn)確性和一致性。
“當(dāng)前很多企業(yè)在IT層面已經(jīng)沉淀了大量數(shù)據(jù),例如ERP、MES等系統(tǒng)數(shù)據(jù),但在OT(操作技術(shù))層面的數(shù)據(jù)積累仍有明顯短板,尤其是在設(shè)備加工、運輸、裝配等底層環(huán)節(jié)。”在2025世界人工智能大會上,卡奧斯物聯(lián)科技股份有限公司副總經(jīng)理謝海琴向時代周報記者表示,“隨著柔性制造、自動化制造趨勢的加速推進,這部分OT數(shù)據(jù)的采集變得尤為關(guān)鍵?!?/p>
謝海琴表示,卡奧斯的做法是“從問題出發(fā)反推數(shù)據(jù)”,即先識別關(guān)鍵業(yè)務(wù)問題,明確所需數(shù)據(jù)要素,再去補齊采集路徑,從而確保數(shù)據(jù)不僅齊全,而且精準(zhǔn)。
“數(shù)據(jù)治理是一個‘久久為功’的系統(tǒng)工程,不僅要清洗、分類、建模,更需要在組織機制上為數(shù)據(jù)要素注入真實業(yè)務(wù)價值?!敝x海琴強調(diào),“如果數(shù)據(jù)質(zhì)量不過關(guān),無論是采集端還是清洗端,訓(xùn)練出的模型也無法具備工程可用性?!?/p>
控制模型“幻覺”風(fēng)險
相比消費互聯(lián)網(wǎng)可容忍一定程度的生成誤差,工業(yè)場景對模型“幻覺”的容錯率幾乎為零。任何一次看似無害的偏差,在工業(yè)現(xiàn)場都有可能演化為實質(zhì)性的安全風(fēng)險或經(jīng)濟損失。
國泰君安證券研報指出,AI幻覺(AIhallucinations)是指人工智能模型生成的看似合理但實際錯誤的內(nèi)容,這種現(xiàn)象通常表現(xiàn)為脫離現(xiàn)實、邏輯斷裂或偏離用戶需求的輸出。
大語言模型(LLM)在生成過程中可能感知到人類觀察者無法察覺或不存在的模式或物體,從而產(chǎn)生毫無意義或完全不準(zhǔn)確的輸出。這些錯誤的成因復(fù)雜多樣,包括訓(xùn)練數(shù)據(jù)不足、模型過擬合、數(shù)據(jù)偏差、錯誤假設(shè)以及上下文理解不足等。
謝海琴認(rèn)為,控制幻覺必須從三方面入手:提升數(shù)據(jù)質(zhì)量與行業(yè)理解,高質(zhì)量、高可信度的數(shù)據(jù)集是模型可靠性的基礎(chǔ),背后必須有對行業(yè)工藝流程的深刻洞察;引入外部知識體系,通過知識圖譜、專家規(guī)則庫等形式增強模型語義理解與推理能力;引入模型校驗機制,在模型推理之后增加交叉驗證、專家審?;蝾A(yù)測校驗等機制,防止模型“跑偏”。
在產(chǎn)業(yè)實踐中,企業(yè)正嘗試將幻覺風(fēng)險前置治理。在2025世界人工智能大會上,范式集團高級副總裁柴亦飛向時代周報記者表示,工業(yè)決策場景對可靠性要求極高,任何預(yù)測錯誤都可能導(dǎo)致實質(zhì)性損失。因此公司在設(shè)計中引入決策模型,通過工程邏輯、業(yè)務(wù)規(guī)則對模型輸出進行“約束校驗”,最大限度地降低幻覺風(fēng)險。
國金證券則提出一種可行架構(gòu):“大模型指揮、小模型執(zhí)行”。即在需要全局優(yōu)化和預(yù)測性分析的場景中,利用大模型進行宏觀指導(dǎo)與決策支持。而在具體執(zhí)行與實時反饋方面,則依靠小模型發(fā)揮其高精度和低成本的優(yōu)勢。
化解定制化適配難題
消費領(lǐng)域的大模型更關(guān)注“廣覆蓋”,而工業(yè)領(lǐng)域的大模型則必須直面“深穿透”的難題。
工業(yè)互聯(lián)網(wǎng)的核心特征是“1米寬,百米深”。謝海琴表示,無論是流程工業(yè)還是離散工業(yè),每一個細分行業(yè)的工藝流程都高度專業(yè)化、個性化,行業(yè)know-how極為深厚。這也意味著平臺型企業(yè)若要真正實現(xiàn)能力穿透,必須基于深刻的行業(yè)理解展開定制化適配。
卡奧斯自身的演進路徑印證了這一判斷。謝海琴指出,卡奧斯起源于離散制造業(yè),早期深度服務(wù)家電、電子、電腦等產(chǎn)業(yè),并在激烈市場競爭中積累了扎實的工業(yè)基礎(chǔ)。這些經(jīng)驗不僅幫助卡奧斯打下工業(yè)數(shù)字化底座,也構(gòu)成其拓展其他離散制造門類的重要支撐。
在“工業(yè)具身智能”領(lǐng)域,定制化同樣是穿透場景的前提。優(yōu)艾智合聯(lián)合創(chuàng)始人趙萬秋向時代周報記者表示,具身智能的價值不僅在于自動化效率,更在于其對柔性制造趨勢的支撐能力。“以手機制造為例,從過去一兩個型號到現(xiàn)在每代手機都可能有普通版、Pro版、Max版等多種配置和顏色,消費者個性化需求的提升正在倒逼生產(chǎn)流程柔性化?!?/p>
趙萬秋指出,優(yōu)艾智合構(gòu)建的面向工業(yè)實際需求的具身智能系統(tǒng),正是支撐這種變化的基礎(chǔ)設(shè)施。借助具身智能機器人及其調(diào)度系統(tǒng),工廠能夠?qū)崿F(xiàn)物料在不同生產(chǎn)節(jié)點間的智能流轉(zhuǎn)與動態(tài)調(diào)整,滿足多品類、小批量、高頻次的定制化生產(chǎn)需求。
算法層面的適配挑戰(zhàn)同樣不容忽視。柴亦飛表示,公司在實際應(yīng)用中面臨的最大挑戰(zhàn)之一,是每類場景的數(shù)據(jù)結(jié)構(gòu)和特征往往差異巨大。此外,在工程實踐中也會對模型進行“封裝”式的適配,不同應(yīng)用場景所接入的大模型雖然底層一致,但調(diào)用方式、輸入輸出接口都可以做出差異化設(shè)計。
與通用大模型主要處理文本輸入輸出不同,第四范式(06682.HK)的垂直模型更偏向任務(wù)導(dǎo)向型。例如,在“辦事型”場景中,大模型的核心作用不是生成文本,而是預(yù)測“下一個動作”或“下一個狀態(tài)”。以在制造環(huán)節(jié)中的產(chǎn)量需求預(yù)測為例,模型的任務(wù)就是根據(jù)當(dāng)前的多維數(shù)據(jù)輸入,預(yù)測明天的生產(chǎn)需求。這種預(yù)測類應(yīng)用本質(zhì)上更貼近“廣義智能決策”,而非純粹的語言生成。
前世一場賜婚等來的卻是他與別人成雙對,死后六年浴火重生驚亂世
《重上嫡女:王爺寵入骨》:“王爺一直都這么喜歡多管閑事?”
寵文:國公府四代無女,唯一小粉寶降生,全府人哭成球,跪地謝天