AI解放生產(chǎn)力的奇點(diǎn),可能就在2025年。
作者|一濤
編輯|鄭玄
「2025年會(huì)成為智能體爆發(fā)的一年」這一判斷基本已經(jīng)成為了行業(yè)內(nèi)的共識(shí)。這一點(diǎn)從第三方機(jī)構(gòu)aicpbAI產(chǎn)品榜的變化就可以看出。在6月份最新發(fā)布的AI產(chǎn)品榜上,aicpb首次增加了智能體榜單。
令人意外的是,排名第一的并非此前大火的Manus,也不是來自老牌搜索廠商百度,或是號(hào)稱AllinAI的字節(jié)跳動(dòng),而是360旗下的納米AI。其156.67M的月度Web訪問量甚至斷層式領(lǐng)先了第二名Manus近10倍。
要知道,此時(shí)距離納米AI超級(jí)搜索正式發(fā)布還不到一個(gè)月。納米AI超級(jí)搜索是如何做到異軍突起的?
01
智能體時(shí)代:讓AI從「給你答案」
變成了「交付結(jié)果」
當(dāng)我們從網(wǎng)上獲取信息時(shí),大多數(shù)人腦海中浮現(xiàn)的仍然是那個(gè)熟悉的畫面:輸入關(guān)鍵詞,獲得一串鏈接,然后再自己手動(dòng)分析、篩選、整理,時(shí)常還找不到想要的答案。
這是傳統(tǒng)搜索引擎時(shí)代。關(guān)鍵詞稍有不同,顯示出來的結(jié)果也大相徑庭,也就無法真正理解用戶的需求。同時(shí),因?yàn)楦?jìng)價(jià)排名的廣告模式,內(nèi)容總是被點(diǎn)擊率所裹挾,很多所謂「標(biāo)題黨」的信息往往排名更靠前,信息需要用戶篩選掉大量無關(guān)信息。
ChatGPT的出現(xiàn)改寫了這種信息獲取的方式。用戶可以直接獲得一個(gè)相對(duì)精準(zhǔn)的結(jié)果,獲取信息的方式從「檢索、遍歷」進(jìn)化到了「直接獲取結(jié)果」。
智能體的出現(xiàn),標(biāo)志著AI生產(chǎn)力落地的又一次范式轉(zhuǎn)化。智能體帶來的最大變革,是讓AI從「給你答案」變成了「交付結(jié)果」。系統(tǒng)不再只是給出一個(gè)答案,而是可以自動(dòng)調(diào)用工具執(zhí)行用戶的復(fù)雜需求,直接給出一個(gè)交付結(jié)果。例如輸入「優(yōu)化公司財(cái)報(bào)」,它不再是教你怎么做,而是直接生成一份專業(yè)的財(cái)報(bào)優(yōu)化方案。
AI智能體、AI助理、聊天機(jī)器人的區(qū)別
具體而言,一個(gè)合格的智能體通常需要具備以下特征:
1、自主性:在最小人工干預(yù)下獨(dú)立運(yùn)行,具備自我驅(qū)動(dòng)的執(zhí)行能力。
2、環(huán)境感知:通過多種接口實(shí)時(shí)獲取環(huán)境狀態(tài)信息,并理解上下文變化。
3、推理規(guī)劃:基于目標(biāo)進(jìn)行任務(wù)分解,制定多步驟執(zhí)行策略和資源分配方案。
4、適應(yīng)學(xué)習(xí):從執(zhí)行反饋中提取經(jīng)驗(yàn),動(dòng)態(tài)調(diào)整行為模式和決策策略。
5、工具集成:主動(dòng)選擇和組合外部工具/API,擴(kuò)展自身能力邊界。
6、狀態(tài)管理:維護(hù)短期工作記憶和長期知識(shí)存儲(chǔ),支持上下文連續(xù)性。
7、目標(biāo)導(dǎo)向:圍繞明確目標(biāo)進(jìn)行行為選擇,具備結(jié)果評(píng)估和糾偏能力。
8、多模態(tài)交互:支持自然語言、API調(diào)用等多種交互方式,具備協(xié)作能力。
一句話總結(jié)就是,真正的智能體應(yīng)該具備「感知→推理→規(guī)劃→執(zhí)行→反饋→優(yōu)化」的完整閉環(huán)能力,而不僅僅是高級(jí)版本的問答系統(tǒng)。
整體而言,智能體目前仍處于早期階段。海外市場(chǎng)方面,巨頭如微軟、谷歌、OpenAI都在開發(fā)自己的智能體產(chǎn)品,例如OpenAI最近推出的ChatGPTAgent,大致覆蓋了上述特征。而在與大家更相關(guān)的國內(nèi)市場(chǎng),manus和納米AI可以說是跟進(jìn)最早的玩家。
02
兩個(gè)場(chǎng)景,看懂納米AI的能力
為了更好地理解納米AI智能體的能力,我們挑選了兩個(gè)典型的用戶場(chǎng)景。
首先是「一句話生成長視頻」,例如告訴納米AI,讓它生成一條上海城市的宣傳片。
「一句話生成長視頻」過程
面對(duì)這樣一個(gè)復(fù)雜任務(wù),納米AI其實(shí)把整個(gè)流程拆解成了「輸入信息、整理文案、生成分鏡腳本、文生圖、配音、圖生視頻、添加配音字幕、視頻拼接、獲取BGM、添加BGM」等環(huán)節(jié)。
每個(gè)任務(wù)由不同的智能體完成,整個(gè)視頻是一個(gè)多智能體組成的工作流。看起來用戶只說了一句話就得到了一個(gè)視頻,但實(shí)際上支撐納米AI完成這個(gè)復(fù)雜需求的是個(gè)智能體團(tuán)隊(duì)。
例如在最開始的信息檢索階段,就調(diào)用了超級(jí)搜索智能體,檢索出了30個(gè)搜索結(jié)果,并以此為基礎(chǔ)形成了這支上海城市宣傳片的文案和分鏡腳本部分。
納米AI生成的分鏡腳本(部分),可以看到很好的把握了上海的代表性元素
以分鏡腳本為基礎(chǔ),納米AI又調(diào)用了圖片生成智能體,形成了多個(gè)上海的代表性畫面作為分鏡圖片。
納米AI調(diào)用文生圖智能體
值得注意的是,納米AI最終產(chǎn)出的視頻長達(dá)兩分鐘,一條視頻能消耗1000萬左右token,以AI生成視頻的標(biāo)準(zhǔn)來說這個(gè)長度相當(dāng)夸張。業(yè)界具備類似長任務(wù)的執(zhí)行能力的智能體非常少。同時(shí),它有連貫的邏輯以及接近攝影實(shí)拍的視頻畫面,配音、BGM、字幕這些正常視頻的各種要素也全都具備。即使拿「人類作者」的標(biāo)準(zhǔn)看待,這也是一個(gè)相當(dāng)成熟的視頻。
過去制作一條視頻,往往要經(jīng)過「文案-分鏡-拍攝/繪圖-剪輯-后期」這樣一整套工作,涉及策劃、美術(shù)師、剪輯師等,不同工種耗費(fèi)數(shù)個(gè)工作日才能協(xié)作完成。
但是現(xiàn)在,泡一杯咖啡的時(shí)間,納米AI就能生成一個(gè)成熟的長視頻。AI生成視頻,在此刻真正做到了有用。
另一個(gè)場(chǎng)景是處理復(fù)雜的研究型問題,以「分析人工智能對(duì)就業(yè)市場(chǎng)的影響」為例。
納米AI深度研究過程
令人驚訝的是,在輸入需求之后,納米AI并沒有一味執(zhí)行任務(wù),而是主動(dòng)要求進(jìn)一步補(bǔ)充需求的具體細(xì)節(jié)。這體現(xiàn)了納米AI的「搜商」,能夠像人類一樣在思考,主動(dòng)發(fā)起交互、補(bǔ)足思維鏈。
納米AI主動(dòng)要求明確需求
在生成結(jié)果的關(guān)鍵節(jié)點(diǎn),納米AI也會(huì)主動(dòng)發(fā)起詢問,以更好地匹配用戶需求。這份提綱包含了現(xiàn)狀分析、趨勢(shì)預(yù)測(cè)、政策建議、和最后的結(jié)論,從結(jié)構(gòu)上來說,十分完整。
最終,納米AI超級(jí)搜索在十幾分鐘內(nèi)就生成了一份包含數(shù)據(jù)圖表、趨勢(shì)分析、政策建議的綜合報(bào)告。
過去,研究者需要從多個(gè)信息源收集資料,然后進(jìn)行人工分析和整合,往往要耗費(fèi)幾天甚至幾周的時(shí)間。而現(xiàn)在,在短時(shí)間內(nèi),所有人就能快速了解一個(gè)復(fù)雜問題的基本面貌。
報(bào)告不僅是文字,也包含圖表、圖片等多模態(tài)信息
不僅如此,這份最終生成的報(bào)告還可以轉(zhuǎn)換成PDF、Word、思維導(dǎo)圖、PPT,甚至是動(dòng)態(tài)網(wǎng)頁,形成了從資料搜索、生成分析到結(jié)果演示的完整閉環(huán)。
納米AI生成的動(dòng)態(tài)網(wǎng)頁
值得注意的是,納米AI在報(bào)告最后還列出了36個(gè)參考文獻(xiàn)的鏈接。對(duì)于復(fù)雜的研究型問題而言,這一點(diǎn)非常有必要,研究者可以很方便地作進(jìn)一步的研究和查證。
納米AI列出的參考文獻(xiàn)鏈接(部分)
在整個(gè)生成研究的過程中,納米AI自主跑完了一整個(gè)流程,直接完成了交付。甚至在用戶需求不明確時(shí),它還會(huì)主動(dòng)發(fā)起交互,補(bǔ)足思維鏈。從AI2.0時(shí)代的「告訴你怎么做」,到納米AI的「直接交付多模態(tài)的結(jié)果」,這是一整套范式的轉(zhuǎn)變。
實(shí)際上,要讓AI自主完成一件復(fù)雜任務(wù)并不是一件容易的事,背后有非常復(fù)雜的對(duì)技術(shù)路徑的先驗(yàn)思考和巨大的技術(shù)投入。
其中,多模型協(xié)作架構(gòu)是納米AI最令人印象深刻的技術(shù)特點(diǎn)之一。納米AI接入了80多個(gè)模型,并根據(jù)不同任務(wù)需求進(jìn)行智能調(diào)度。
正是有了這樣的模型基座能力,才實(shí)現(xiàn)復(fù)雜任務(wù)下的超長思維鏈。
納米AI在MCP(ModelContextProtocol)工具生態(tài)建設(shè)上也投入了大量資源,專為國內(nèi)環(huán)境自研了許多MCP。有人把MCP比作大模型的USB-C接口。正如USB標(biāo)準(zhǔn)化了硬件接口,MCP也為大模型的標(biāo)準(zhǔn)化接口,使得其能夠連接到各種外部數(shù)據(jù)源和工具,解決了「AI可用」的問題。
目前納米AI已接入110+工具,覆蓋辦公協(xié)作、學(xué)術(shù)研究、生活服務(wù)、搜索引擎、金融分析、媒體娛樂、數(shù)據(jù)抓取等多個(gè)領(lǐng)域。在上文的「一句話生成長視頻」中,比如文案生成智能體,就調(diào)用了AI搜索、圖片轉(zhuǎn)文字、音視頻轉(zhuǎn)文本、AI文檔分析等多個(gè)MCP工具。
納米AI智能體還實(shí)現(xiàn)了對(duì)本地瀏覽器的調(diào)用能力,可以識(shí)別網(wǎng)頁上的所有的可點(diǎn)擊元素,讓大模型像人一樣去操作瀏覽器。
這么做的好處是什么呢?
信息孤島的問題就被解決了。這是個(gè)由來已久的問題,各家互聯(lián)網(wǎng)公司出于商業(yè)考量,并不允許谷歌、百度這類搜索引擎抓取信息。但是有了對(duì)瀏覽器的調(diào)用能力之后,它就可以像普通用戶一樣「正常訪問」這些平臺(tái),獲取其內(nèi)部的深度信息和實(shí)時(shí)數(shù)據(jù)。
擁有了這樣的能力,納米AI就可以深度挖掘小紅書的旅行攻略和購買建議;直接對(duì)比多個(gè)電商平臺(tái)的商品,找到最低價(jià);或者是獲取社交媒體上的最新趨勢(shì)和用戶反饋。
納米AI突破信息孤島,檢索小紅書內(nèi)容,生成選購建議
03
AI下半場(chǎng),加速AI效用的生產(chǎn)落地
LnData的報(bào)告指出,2024年底全球智能體市場(chǎng)規(guī)模已突破500億美元,年度增長率超過200%。頭豹研究院對(duì)智能體的增長也持樂觀態(tài)度。它預(yù)測(cè),智能體行業(yè)市場(chǎng)規(guī)模將從2024年的695.28億人民幣增長至2028年的8520.35億人民幣,年復(fù)合增長率高達(dá)87.10%。
如此巨大的市場(chǎng)潛力,自然吸引了OpenAI、谷歌、微軟等科技巨頭,以及字節(jié)跳動(dòng)、阿里、騰訊、百度等國內(nèi)大廠的全面加碼。
就在7月17日深夜,OpenAI正式發(fā)布了ChatGPTAgent,這個(gè)被業(yè)界期待已久的智能體終于姍姍來遲。和ChatGPT初次發(fā)布的那種驚艷不同,輿論對(duì)ChatGPTAgent有些兩極分化。
支持者認(rèn)為這標(biāo)志著AI從「對(duì)話式AI」向「任務(wù)執(zhí)行型AI」的轉(zhuǎn)變。
反對(duì)者則認(rèn)為ChatGPTAgent的發(fā)布更像一次「補(bǔ)課」而非「創(chuàng)新」,因?yàn)槠湔故镜暮诵哪芰?,例如多步驟任務(wù)規(guī)劃、工具調(diào)用、上下文記憶,這些在國內(nèi)已經(jīng)不是什么新鮮事了——Manus和納米AI早在幾個(gè)月前就已經(jīng)實(shí)現(xiàn)了類似的功能。在某些方面,例如可視化生成,納米AI甚至展現(xiàn)出了比ChatGPTAgent更好的能力。
整體而言,ChatGPTAgent確實(shí)沒有表現(xiàn)出超越國內(nèi)智能體的能力。這其實(shí)反映了一個(gè)更深層的問題:AI領(lǐng)域的技術(shù)護(hù)城河正在快速縮小。OpenAI的生態(tài)整合能力和產(chǎn)品化水平依然值得學(xué)習(xí),但純粹從智能體能力來看,國內(nèi)外的差距確實(shí)在快速縮小,某些細(xì)分領(lǐng)域甚至已經(jīng)出現(xiàn)了反超。
智能體的終局尚未可知,但是在特定領(lǐng)域逐步發(fā)揮作用、成為提升工作效率的重要工具,的確是一條可預(yù)見的迭代路徑。真正的挑戰(zhàn)在于如何找到合適的應(yīng)用場(chǎng)景,構(gòu)建可持續(xù)的商業(yè)模式,并在技術(shù)創(chuàng)新和用戶需求之間找到平衡點(diǎn)。畢竟,技術(shù)再牛,用戶不買單也是白搭。
在AI下半場(chǎng)的激烈競(jìng)爭(zhēng)中,納米AI走出了一條獨(dú)特的差異化路線——它沒有選擇與巨頭們正面硬剛通用型超級(jí)智能體,而是選擇成為智能體生態(tài)繁榮的基礎(chǔ)設(shè)施搭建者。
周鴻祎對(duì)納米AI的愿景很明確——將納米AI打造成最大的「智能體社區(qū)」。
從數(shù)量上看,納米AI目前已經(jīng)擁有近萬個(gè)專業(yè)智能體,覆蓋不同行業(yè)和場(chǎng)景的業(yè)務(wù)需求。用戶面對(duì)具體問題時(shí),只需輸入需求描述,平臺(tái)即可匹配對(duì)應(yīng)的專業(yè)智能體,實(shí)現(xiàn)從需求到解決方案的快速連接。
平臺(tái)的價(jià)值不僅在于豐富的智能體資源,更在于其靈活的組合能力。在納米AI,如果你的任務(wù)需求過于復(fù)雜,用戶還可以調(diào)用多個(gè)智能體、組建多個(gè)智能體協(xié)作的團(tuán)隊(duì),通過任務(wù)分解和流程優(yōu)化,實(shí)現(xiàn)更高效的問題解決。這種團(tuán)隊(duì)化協(xié)作模式,為個(gè)人和小團(tuán)隊(duì)提供了以往只有大企業(yè)才能享有的專業(yè)服務(wù)能力。
如果多智能體協(xié)作還不能解決你的問題,納米AI的「360智能體工廠」,還提供了低門檻的智能體搭建平臺(tái)。通過自然語言交互,用戶無需編程技能即可創(chuàng)建符合特定需求的智能體。這種零代碼創(chuàng)建方式,讓智能體的定制化變得簡單高效,真正實(shí)現(xiàn)了「人人都能造專家」的愿景。
周鴻祎表示,AI時(shí)代為每個(gè)人、每個(gè)組織都帶來了前所未有的機(jī)遇,每個(gè)人都可以擁有三五十個(gè)智能體,形成自己的專家隊(duì)伍,這些智能體聽你指揮,替你干活,每個(gè)人都有機(jī)會(huì)成為超級(jí)個(gè)體。
AI下半場(chǎng),敘事邏輯從技術(shù)炫技逐步走向「效用落地」,從追求技術(shù)先進(jìn)性轉(zhuǎn)向追求解決問題的有效性,這才是AI的價(jià)值回歸,真正變成普通人的生產(chǎn)力工具。
納米AI在榜單上的排名可以視作是一個(gè)階段性的成果。斷層領(lǐng)先第二名近10倍,這并非偶然,背后反映的是使用智能體這一產(chǎn)品形態(tài)的強(qiáng)烈市場(chǎng)需求。
當(dāng)所有人都在談?wù)揂GI的終極目標(biāo)時(shí),納米AI已經(jīng)在實(shí)際應(yīng)用中交出了答案:AI的價(jià)值不在于有多「智能」,而在于能為多少人解決多少問題。
可以預(yù)見,智能體這場(chǎng)戰(zhàn)役并不好打,但納米AI已經(jīng)早早入局,并握了一副好牌。
*頭圖來源:納米AI
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請(qǐng)聯(lián)系極客君微信geekparkGO
極客一問
你如何看待納米AI?
外媒曝光馬斯克用200多員工人臉,幫助訓(xùn)練旗下GrokAI。
點(diǎn)贊關(guān)注極客公園視頻號(hào),
葉天穿越了 醒來后發(fā)覺自已竟然是一國之君 當(dāng)皇帝的感覺就是爽, 他要做的第一件事就是先推倒母儀天下的皇后, 摘掉童子雞的帽子, 然后再酒池肉林, 大開無遮大會(huì)。 愛江山, 更愛美人, 天下美女盡收后宮, 這是他最偉大的理想。 本故事純屬虛構(gòu), 如有雷同, 實(shí)屬巧合。 延伸閱讀:與 納米: !!AI 【憑什么】 的相關(guān)文章