本文來(lái)源:時(shí)代周報(bào)作者:朱成呈
2025年世界人工智能大會(huì)上,“AI賦能新型工業(yè)化”成為最具現(xiàn)實(shí)張力的熱詞之一。從生成式AI到具身智能機(jī)器人,從工業(yè)操作系統(tǒng)到行業(yè)大模型,AI正試圖一步步打通底層設(shè)備、中層系統(tǒng)與頂層決策的縱深鏈條。
據(jù)麥肯錫調(diào)研顯示,今年1月評(píng)選出的全球17家“燈塔工廠”中,AI幫助其在制造成本、生產(chǎn)周期時(shí)間和缺陷率等方面改善50%以上。然而,這些工廠中排名前五的用例有77%應(yīng)用到判別式AI,僅有9%應(yīng)用到生成式AI。
咨詢公司Gartner預(yù)測(cè),到2029年,中國(guó)60%的企業(yè)將把AI融入主要產(chǎn)品與服務(wù),并依托其成為核心營(yíng)收驅(qū)動(dòng)力。但從“實(shí)驗(yàn)室”走進(jìn)“車間地板”,AI要穿透工業(yè)體系的多樣性、復(fù)雜性和高可靠性要求,至少還有三座“硬山”需要翻越:一是高質(zhì)量數(shù)據(jù)收集困難,二是模型幻覺(jué)難以容忍,三是場(chǎng)景適配難以規(guī)模復(fù)制。
這不僅是一場(chǎng)算法能力的競(jìng)賽,更是一場(chǎng)工業(yè)理解力與系統(tǒng)工程力的長(zhǎng)跑。
高質(zhì)量數(shù)據(jù)是前提條件
在通用大模型邁向工業(yè)場(chǎng)景的過(guò)程中,高質(zhì)量數(shù)據(jù)不是加分項(xiàng),而是決定模型能否落地的前提條件。
中國(guó)電子信息產(chǎn)業(yè)發(fā)展研究院信息化與軟件產(chǎn)業(yè)研究所發(fā)布的研究報(bào)告指出,海量高質(zhì)量數(shù)據(jù)是大模型泛化涌現(xiàn)能力的基礎(chǔ)。從行業(yè)前沿趨勢(shì)來(lái)看,大模型訓(xùn)練使用的數(shù)據(jù)集規(guī)模呈現(xiàn)爆發(fā)式增長(zhǎng),對(duì)訓(xùn)練數(shù)據(jù)的數(shù)據(jù)量、多樣性和更新速度方面也提出更高的要求。
從國(guó)際演進(jìn)軌跡來(lái)看,模型訓(xùn)練的數(shù)據(jù)規(guī)模正急劇膨脹。GPT-1的數(shù)據(jù)集為4.6GB,GPT-3達(dá)到753GB,而GPT-4的數(shù)據(jù)量是前者數(shù)十倍。據(jù)推測(cè),GPT-5的訓(xùn)練數(shù)據(jù)有望突破200TB。
工業(yè)場(chǎng)景下,這一挑戰(zhàn)更為復(fù)雜。國(guó)金證券研報(bào)指出,工業(yè)領(lǐng)域涵蓋廣泛,包括41個(gè)工業(yè)大類、207個(gè)工業(yè)中類、666個(gè)工業(yè)小類,導(dǎo)致數(shù)據(jù)結(jié)構(gòu)多樣,數(shù)據(jù)質(zhì)量參差不齊。同時(shí),由于工業(yè)生產(chǎn)過(guò)程中的各個(gè)環(huán)節(jié)相互交織,數(shù)據(jù)之間的關(guān)聯(lián)性和復(fù)雜性也較高。數(shù)據(jù)來(lái)源、采集方式、時(shí)間戳等都會(huì)影響數(shù)據(jù)的準(zhǔn)確性和完整性。
這種數(shù)據(jù)結(jié)構(gòu)的多樣與質(zhì)量的參差不齊,給工業(yè)大模型的訓(xùn)練和應(yīng)用帶來(lái)挑戰(zhàn)。工業(yè)AI構(gòu)建,需要投入大量的時(shí)間和資源進(jìn)行數(shù)據(jù)清洗、預(yù)處理和校驗(yàn),以確保數(shù)據(jù)的準(zhǔn)確性和一致性。
“當(dāng)前很多企業(yè)在IT層面已經(jīng)沉淀了大量數(shù)據(jù),例如ERP、MES等系統(tǒng)數(shù)據(jù),但在OT(操作技術(shù))層面的數(shù)據(jù)積累仍有明顯短板,尤其是在設(shè)備加工、運(yùn)輸、裝配等底層環(huán)節(jié)?!痹?025世界人工智能大會(huì)上,卡奧斯物聯(lián)科技股份有限公司副總經(jīng)理謝海琴向時(shí)代周報(bào)記者表示,“隨著柔性制造、自動(dòng)化制造趨勢(shì)的加速推進(jìn),這部分OT數(shù)據(jù)的采集變得尤為關(guān)鍵?!?/p>
謝海琴表示,卡奧斯的做法是“從問(wèn)題出發(fā)反推數(shù)據(jù)”,即先識(shí)別關(guān)鍵業(yè)務(wù)問(wèn)題,明確所需數(shù)據(jù)要素,再去補(bǔ)齊采集路徑,從而確保數(shù)據(jù)不僅齊全,而且精準(zhǔn)。
“數(shù)據(jù)治理是一個(gè)‘久久為功’的系統(tǒng)工程,不僅要清洗、分類、建模,更需要在組織機(jī)制上為數(shù)據(jù)要素注入真實(shí)業(yè)務(wù)價(jià)值?!敝x海琴?gòu)?qiáng)調(diào),“如果數(shù)據(jù)質(zhì)量不過(guò)關(guān),無(wú)論是采集端還是清洗端,訓(xùn)練出的模型也無(wú)法具備工程可用性。”
控制模型“幻覺(jué)”風(fēng)險(xiǎn)
相比消費(fèi)互聯(lián)網(wǎng)可容忍一定程度的生成誤差,工業(yè)場(chǎng)景對(duì)模型“幻覺(jué)”的容錯(cuò)率幾乎為零。任何一次看似無(wú)害的偏差,在工業(yè)現(xiàn)場(chǎng)都有可能演化為實(shí)質(zhì)性的安全風(fēng)險(xiǎn)或經(jīng)濟(jì)損失。
國(guó)泰君安證券研報(bào)指出,AI幻覺(jué)(AIhallucinations)是指人工智能模型生成的看似合理但實(shí)際錯(cuò)誤的內(nèi)容,這種現(xiàn)象通常表現(xiàn)為脫離現(xiàn)實(shí)、邏輯斷裂或偏離用戶需求的輸出。
大語(yǔ)言模型(LLM)在生成過(guò)程中可能感知到人類觀察者無(wú)法察覺(jué)或不存在的模式或物體,從而產(chǎn)生毫無(wú)意義或完全不準(zhǔn)確的輸出。這些錯(cuò)誤的成因復(fù)雜多樣,包括訓(xùn)練數(shù)據(jù)不足、模型過(guò)擬合、數(shù)據(jù)偏差、錯(cuò)誤假設(shè)以及上下文理解不足等。
謝海琴認(rèn)為,控制幻覺(jué)必須從三方面入手:提升數(shù)據(jù)質(zhì)量與行業(yè)理解,高質(zhì)量、高可信度的數(shù)據(jù)集是模型可靠性的基礎(chǔ),背后必須有對(duì)行業(yè)工藝流程的深刻洞察;引入外部知識(shí)體系,通過(guò)知識(shí)圖譜、專家規(guī)則庫(kù)等形式增強(qiáng)模型語(yǔ)義理解與推理能力;引入模型校驗(yàn)機(jī)制,在模型推理之后增加交叉驗(yàn)證、專家審校或預(yù)測(cè)校驗(yàn)等機(jī)制,防止模型“跑偏”。
在產(chǎn)業(yè)實(shí)踐中,企業(yè)正嘗試將幻覺(jué)風(fēng)險(xiǎn)前置治理。在2025世界人工智能大會(huì)上,范式集團(tuán)高級(jí)副總裁柴亦飛向時(shí)代周報(bào)記者表示,工業(yè)決策場(chǎng)景對(duì)可靠性要求極高,任何預(yù)測(cè)錯(cuò)誤都可能導(dǎo)致實(shí)質(zhì)性損失。因此公司在設(shè)計(jì)中引入決策模型,通過(guò)工程邏輯、業(yè)務(wù)規(guī)則對(duì)模型輸出進(jìn)行“約束校驗(yàn)”,最大限度地降低幻覺(jué)風(fēng)險(xiǎn)。
國(guó)金證券則提出一種可行架構(gòu):“大模型指揮、小模型執(zhí)行”。即在需要全局優(yōu)化和預(yù)測(cè)性分析的場(chǎng)景中,利用大模型進(jìn)行宏觀指導(dǎo)與決策支持。而在具體執(zhí)行與實(shí)時(shí)反饋方面,則依靠小模型發(fā)揮其高精度和低成本的優(yōu)勢(shì)。
化解定制化適配難題
消費(fèi)領(lǐng)域的大模型更關(guān)注“廣覆蓋”,而工業(yè)領(lǐng)域的大模型則必須直面“深穿透”的難題。
工業(yè)互聯(lián)網(wǎng)的核心特征是“1米寬,百米深”。謝海琴表示,無(wú)論是流程工業(yè)還是離散工業(yè),每一個(gè)細(xì)分行業(yè)的工藝流程都高度專業(yè)化、個(gè)性化,行業(yè)know-how極為深厚。這也意味著平臺(tái)型企業(yè)若要真正實(shí)現(xiàn)能力穿透,必須基于深刻的行業(yè)理解展開定制化適配。
卡奧斯自身的演進(jìn)路徑印證了這一判斷。謝海琴指出,卡奧斯起源于離散制造業(yè),早期深度服務(wù)家電、電子、電腦等產(chǎn)業(yè),并在激烈市場(chǎng)競(jìng)爭(zhēng)中積累了扎實(shí)的工業(yè)基礎(chǔ)。這些經(jīng)驗(yàn)不僅幫助卡奧斯打下工業(yè)數(shù)字化底座,也構(gòu)成其拓展其他離散制造門類的重要支撐。
在“工業(yè)具身智能”領(lǐng)域,定制化同樣是穿透場(chǎng)景的前提。優(yōu)艾智合聯(lián)合創(chuàng)始人趙萬(wàn)秋向時(shí)代周報(bào)記者表示,具身智能的價(jià)值不僅在于自動(dòng)化效率,更在于其對(duì)柔性制造趨勢(shì)的支撐能力?!耙允謾C(jī)制造為例,從過(guò)去一兩個(gè)型號(hào)到現(xiàn)在每代手機(jī)都可能有普通版、Pro版、Max版等多種配置和顏色,消費(fèi)者個(gè)性化需求的提升正在倒逼生產(chǎn)流程柔性化?!?/p>
趙萬(wàn)秋指出,優(yōu)艾智合構(gòu)建的面向工業(yè)實(shí)際需求的具身智能系統(tǒng),正是支撐這種變化的基礎(chǔ)設(shè)施。借助具身智能機(jī)器人及其調(diào)度系統(tǒng),工廠能夠?qū)崿F(xiàn)物料在不同生產(chǎn)節(jié)點(diǎn)間的智能流轉(zhuǎn)與動(dòng)態(tài)調(diào)整,滿足多品類、小批量、高頻次的定制化生產(chǎn)需求。
算法層面的適配挑戰(zhàn)同樣不容忽視。柴亦飛表示,公司在實(shí)際應(yīng)用中面臨的最大挑戰(zhàn)之一,是每類場(chǎng)景的數(shù)據(jù)結(jié)構(gòu)和特征往往差異巨大。此外,在工程實(shí)踐中也會(huì)對(duì)模型進(jìn)行“封裝”式的適配,不同應(yīng)用場(chǎng)景所接入的大模型雖然底層一致,但調(diào)用方式、輸入輸出接口都可以做出差異化設(shè)計(jì)。
與通用大模型主要處理文本輸入輸出不同,第四范式(06682.HK)的垂直模型更偏向任務(wù)導(dǎo)向型。例如,在“辦事型”場(chǎng)景中,大模型的核心作用不是生成文本,而是預(yù)測(cè)“下一個(gè)動(dòng)作”或“下一個(gè)狀態(tài)”。以在制造環(huán)節(jié)中的產(chǎn)量需求預(yù)測(cè)為例,模型的任務(wù)就是根據(jù)當(dāng)前的多維數(shù)據(jù)輸入,預(yù)測(cè)明天的生產(chǎn)需求。這種預(yù)測(cè)類應(yīng)用本質(zhì)上更貼近“廣義智能決策”,而非純粹的語(yǔ)言生成。
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。