“雖然OpenAI的DeepResearch能力很強(qiáng),但其適合做廣泛的搜索和很長(zhǎng)的報(bào)告。對(duì)于出口商品HSCode這樣一個(gè)具體要求精確答案的任務(wù),正確率卻只有5%。我們?cè)诖怪睌?shù)據(jù)庫上,做了工具的減法,以及上下文工程。這個(gè)垂直DeepResearch范式的HSCode判定工具,準(zhǔn)確率可以做到80%?!?/p>
在2025世界人工智能大會(huì)期間跟媒體交流的時(shí)候,阿里國際副總裁、阿里國際AIBusiness負(fù)責(zé)人張凱夫如是說。
近半年來,包括DeepResearch和Manus在內(nèi)的各類智能體產(chǎn)品紛紛涌現(xiàn),AIAgent儼然已經(jīng)成為人工智能賽道的“必爭(zhēng)之地”。近期以來,面向跨境貿(mào)易、跨境電商等實(shí)際場(chǎng)景,阿里國際數(shù)字商業(yè)集團(tuán)推出了多款智能體應(yīng)用產(chǎn)品,如智能退款agent、海關(guān)編碼HScodeagent以及在線招商agent等,在行業(yè)里獲得關(guān)注。
7月26日,2025世界人工智能大會(huì)卓越人工智能引領(lǐng)者SAIL獎(jiǎng)公布,阿里國際跨境電商AI解決方案Marco斬獲本屆SAIL之星,成為該領(lǐng)域的首個(gè)獲得者。在同觀察者網(wǎng)等媒體交流時(shí),張凱夫多次談到了AIAgent的發(fā)展。張凱夫認(rèn)為,在很多實(shí)際功能上,垂直Agent的機(jī)會(huì)可能比垂直模型的機(jī)會(huì)還要大。
為了服務(wù)更多出海貿(mào)易商家,阿里國際AIBusiness開始做中國商家自己的“DeepResearch”和垂直AIAgent。
“海關(guān)編碼HScodeagent,商家自己去匹配的準(zhǔn)確率比較低,我們自己的Agent的正確率能到80%。”談到研發(fā)經(jīng)驗(yàn),張凱夫表示,“先做減法,把數(shù)據(jù)限制好。只讓Agent去關(guān)注相關(guān)部門的數(shù)據(jù),而不是去互聯(lián)網(wǎng)上亂搜;在Agent的思考進(jìn)程里(thinkingprocess),我們也使用了較為領(lǐng)先的模型和優(yōu)質(zhì)的案例?!?/p>
“人跟AI交流,給它定好約束條件,告訴它不要干什么特別重要?!?/p>
人類跟AI交流,告訴它不要做什么特別重要
“通用”和“垂直”的路線之爭(zhēng),一直是人工智能領(lǐng)域的母命題。
2023年,國內(nèi)業(yè)界、學(xué)界圍繞“做基礎(chǔ)大模型,還是做垂直/行業(yè)大模型”進(jìn)行了不少討論。有的從業(yè)者認(rèn)為,要抓緊基礎(chǔ)大模型的研究,在底座模型上奮力追趕,尤其是要擺脫對(duì)國外開源模型的依賴;也有從業(yè)者認(rèn)為,中國市場(chǎng)巨大、數(shù)據(jù)豐富,應(yīng)用場(chǎng)景多元,可以用應(yīng)用發(fā)展來帶動(dòng)模型進(jìn)步,走一條“農(nóng)村包圍城市”的路線。
從DeepSeek攪動(dòng)全球風(fēng)云,到各行各業(yè)的專業(yè)大模型集體涌現(xiàn),事實(shí)上,中國在這兩條路上走得其實(shí)都不錯(cuò)。
近年來,人工智能領(lǐng)域的競(jìng)爭(zhēng)開始從類GPT式的問答對(duì)話,向具體場(chǎng)景的智能體Agent遷移。從OpenAI的DeepResearch,到轟動(dòng)一時(shí)的Manus,能夠調(diào)用多種能力,解決具體問題的智能體,成為行業(yè)競(jìng)相追逐的焦點(diǎn)。這也讓“通用”和“垂直”的路線差異,再一次顯現(xiàn)。
此時(shí)此刻,恰如彼時(shí)彼刻。
談到行業(yè)觀察,阿里國際副總裁、阿里國際AIBusiness負(fù)責(zé)人張凱夫?qū)τ^察者網(wǎng)等媒體表示,AI應(yīng)用領(lǐng)域已經(jīng)隨著行業(yè)從AIGC(生成式人工智能)走向了Agent(智能體):以前的應(yīng)用很多是AIGC,比如生成圖、搞翻譯、弄?jiǎng)?chuàng)意;今年更多是智能體,比如硅谷很火的BDagent,去找中小企業(yè)的聯(lián)系方式;合規(guī)Agent,從厚厚的法律材料中尋找合規(guī)相關(guān)內(nèi)容;比如營銷Agent,根據(jù)客戶需要去各種社交媒體發(fā)帖等等——這些過程都是自動(dòng)的。
正如上文中所舉的“海關(guān)編碼案例”一樣,在張凱夫看來,在Agent時(shí)代,很多專業(yè)領(lǐng)域的垂直Agent更有機(jī)會(huì)給人們帶來的巨大收益;相反,通用型的AIAgent,表現(xiàn)反而沒有那么好——OpenAIDeepResearch不能搞定的專業(yè)工作,一個(gè)更加接近行業(yè)的垂直Agent可能就能處理得很好。
“最近硅谷很火的概念是contextengineering(語境工程,或上下文工程),我們用一個(gè)模型,語境(context)非常重要。現(xiàn)在我們做智能體也是一樣,語境的約束特別重要,有時(shí)候你喂給它(Agent)的東西越多越不好,你一定要非常有針對(duì)性地喂給它一些內(nèi)容?!?/p>
張凱夫進(jìn)一步表示,現(xiàn)在人類和AI交流,給它定好約束條件,告訴它不要干什么特別重要——包括AIcoding(用AI寫代碼)。“想讓AI干嘛,大家都可以表達(dá),但真正地核心在于讓AI明確,解決這個(gè)問題的時(shí)候不是要新建代碼文件,而是找到對(duì)應(yīng)的具體代碼去修改。如果沒有這個(gè)約束條件,代碼庫就會(huì)越來越大,到后面一塌糊涂。”
“我們做一個(gè)Agent也是一樣的,語境縮減和精準(zhǔn)選擇是非常重要的一件事情?!?/p>
阿里國際AIBusiness算法負(fù)責(zé)人駱衛(wèi)華補(bǔ)充道,DeepResearch等通用性Agent,在解決很多通用性問答時(shí)是沒問題的。甚至通過底座模型能力,可以通過prompt(關(guān)鍵提示詞)調(diào)優(yōu)來獲得更好的結(jié)果。但是真正落地到非常專業(yè)、垂直的領(lǐng)域,通用型Agent是不夠用的,比如在海關(guān)編碼HScode上,它就是只有個(gè)位數(shù)的正確率。
“但是,如果我們通過引入更多的知識(shí)庫——既包括我們收集的規(guī)則,也包括一些判例,甚至包括一些已有的case(案例)——有一些歷史的、標(biāo)注過的,正確的或者錯(cuò)誤的case,用這些具體的專業(yè)知識(shí)去強(qiáng)化Agent。后面我們發(fā)現(xiàn),他們對(duì)agent效果的提升是非常大的,是幾十個(gè)點(diǎn)的提升?!?/p>
張凱夫認(rèn)為,整體來看,垂直Agent的發(fā)展,對(duì)當(dāng)前的國內(nèi)外AIAgent生態(tài)是一個(gè)非常好的事情。在一些不需要那么精確的問題上,ChatBot或者DeepResearch提供的能力,其實(shí)也夠了;但在具體的問題上,在細(xì)分的領(lǐng)域上,實(shí)際上還有千千萬的問題可以通過垂直Agent解決——這也是垂直Agent的機(jī)會(huì)。
日均10億次調(diào)用,中國跨境電商成為第一個(gè)實(shí)現(xiàn)規(guī)模級(jí)AI應(yīng)用的行業(yè)
相比于通用模型談概念、講參數(shù),更貼近中國普通人經(jīng)營實(shí)際的是,海關(guān)編碼HScodeAgent等國產(chǎn)垂直Agent,正在增強(qiáng)中國中小企業(yè)的競(jìng)爭(zhēng)力。數(shù)據(jù)顯示,僅阿里國際旗下的AIBusiness團(tuán)隊(duì),其提供的AI能力,可以幫中小企業(yè)解決60多個(gè)電商場(chǎng)景中遇到的問題,并在不同環(huán)節(jié),帶來1%-30%不等的顯著提升。
正如我們之前訪談中所觀察到的一樣:越是中小企業(yè),越能從AI的應(yīng)用中獲益。
公開資料顯示,阿里國際的所有電商平臺(tái)均已應(yīng)用AI,已服務(wù)了超50萬賣家,形成了以服務(wù)中小企業(yè)出海為核心,覆蓋全球多元市場(chǎng)、多種電商模式的規(guī)模級(jí)AI應(yīng)用。截至本月(2025年7月),阿里國際AI服務(wù)的調(diào)用量每?jī)蓚€(gè)月就會(huì)翻一番,平均日調(diào)用量已突破10億次。這使得跨境電商成為第一個(gè)實(shí)現(xiàn)規(guī)模級(jí)AI應(yīng)用的行業(yè)。
內(nèi)部報(bào)告顯示,過去一年,國內(nèi)商家使用頻次最高的AI功能分別是:圖文翻譯、圖像識(shí)別并完善商品信息、營銷文案生成。其中,翻譯在去年底實(shí)現(xiàn)了全面從小模型向大模型的轉(zhuǎn)換。在歐洲TOP語種中,因?yàn)榉g效果的提升,消費(fèi)者滿意度提升了30%;在SEO場(chǎng)景下,AI提供的SEO占到了整體SEO的近4成,未來有望達(dá)到一半甚至更高。
Agent時(shí)代,國產(chǎn)自研的AI產(chǎn)品,進(jìn)一步完善了普通中國商家應(yīng)對(duì)風(fēng)險(xiǎn)和變化的能力。
以海關(guān)編碼HScode(HarmonizedSystemCode)為例。HSCode是國際通用的商品分類編碼體系,由世界海關(guān)組織(WCO)制定并維護(hù)。它通過統(tǒng)一的分類規(guī)則,將全球貿(mào)易商品分為5000多種品目,每個(gè)商品類別由6位數(shù)字編碼表示,是國際貿(mào)易、海關(guān)清關(guān)、關(guān)稅征收和貿(mào)易統(tǒng)計(jì)的基礎(chǔ)工具。
HSCode在國際貿(mào)易中極其重要,關(guān)系到商家的合規(guī)和效率。但并非每個(gè)企業(yè)都能擁有自己的HSCode顧問。
AIAgent無疑為這個(gè)問題提供了更多解。例如阿里國際旗下的海關(guān)編碼HScodeagent,可以利用Reasoning模型(推理模型)的Planning(任務(wù)拆解&步驟規(guī)劃)、ToolUse(工具調(diào)用)、Reflection(自我迭代)能力,通過多輪調(diào)用工具不斷自主探索,從工作環(huán)境中獲取更為精確的信息,并不斷更新步驟,以得到導(dǎo)向正確答案的路徑。
數(shù)據(jù)顯示,在HScodeagent的幫助下,跨境商家們對(duì)10位HScode填寫準(zhǔn)確率提升了23%。
不過,談到AIAgent的“未來”,張凱夫表示,做“最通用的”和“最垂直的”,其實(shí)都是可以的——最重要的是研發(fā)者和使用者明確人類使用AI的場(chǎng)景。“做非常通用的智能體,類似OpenAIChatBot,沒有任何問題;或者做特別垂直的,把自己專業(yè)領(lǐng)域的知識(shí)弄得非常明白——比較讓人害怕的是夾在中間,因?yàn)閵A在中間沒有壁壘?!?/p>
和大模型時(shí)代,很多從業(yè)者堅(jiān)信“全球競(jìng)逐基礎(chǔ)大模型的,最終只有個(gè)位數(shù)玩家”的研判類似;在對(duì)話的最后,張凱夫也關(guān)注理性競(jìng)爭(zhēng)和投入的問題?!艾F(xiàn)在的行業(yè)格局,能做出特別通用的AIAgent的,全世界只有少數(shù)幾家企業(yè)。龐大的機(jī)會(huì)依然在垂直領(lǐng)域?!?/p>