白交發(fā)自凹非寺量子位|公眾號(hào)QbitAI
離企業(yè)AI落地最近的智能體,剛剛在WAIC官宣對(duì)外開源了。
京東云JoyAgent,成為了首個(gè)100%開源企業(yè)級(jí)智能體。
當(dāng)前市場(chǎng)上的開源Agent主要是SDK或者框架,而JoyAgent是包括前后端、框架、引擎、核心子智能體等完整能力全部開源,企業(yè)開發(fā)者無需再進(jìn)行二次開發(fā),直接就能本地獨(dú)立部署,開箱即用。
前段時(shí)間它已深夜開源,在開發(fā)者圈火了一波,大家紛紛好感拉滿,GitHubStar數(shù)持續(xù)拉升。
大家除了對(duì)這個(gè)產(chǎn)品級(jí)端到端開源印象深刻之外,還對(duì)它多智能體協(xié)同、處理問題的能力感到驚艷。
它在GAIA榜單上以Validation集準(zhǔn)確率75.15%的成績上榜,性能比肩甚至超越了行業(yè)領(lǐng)先的產(chǎn)品。而相較于前面數(shù)一數(shù)二的產(chǎn)品,它還勝在輕量化,并不依賴更多的生態(tài)和云平臺(tái),開發(fā)者能夠獨(dú)立部署。
因此即便JoyAgent提前悄悄上線,也阻止不了開發(fā)者們口口相傳的好評(píng)。
而且現(xiàn)在據(jù)說,這個(gè)智能體已經(jīng)是歷經(jīng)他們公司內(nèi)部大規(guī)模場(chǎng)景錘煉,超2萬個(gè)智能體實(shí)踐,可靠性自然就有保證。
所以JoyAgent相當(dāng)于是京東把自己企業(yè)智能體的落地經(jīng)驗(yàn),一攬子全開源了。
行業(yè)首個(gè)100%開源企業(yè)級(jí)智能體
首先JoyAgent這個(gè)名字就很有意思,尤其再跟它的定位「企業(yè)級(jí)」結(jié)合在一起來看。它似乎在傳達(dá)一種態(tài)度,智能體在企業(yè)場(chǎng)景中的部署和應(yīng)用,其實(shí)是一件很Joy的事情。
在JoyAgent之前,市面上也有不少開源產(chǎn)品,大部分都是智能體框架,或者主要是工作流,剩下的還有像SDK、技術(shù)模塊、或者協(xié)議。
這種「部分開源」的結(jié)果就是開發(fā)者們要做額外的開發(fā)和適配工作,包括前端界面、后端邏輯、智能體協(xié)調(diào)。開源組件雖然豐富,但還是需要自己一個(gè)個(gè)集成起來。
像JoyAgent這種產(chǎn)品級(jí)的產(chǎn)品之前并沒有,而現(xiàn)在JoyAgent也有且只有一個(gè)。
它端到端完整開源,沒有可依賴的生態(tài),可以獨(dú)立部署開箱即用。這種配置與企業(yè)場(chǎng)景天然適配,并且直接將企業(yè)智能體的使用門檻打下去了。
它有兩種方式可以快速開始:一種是docker一鍵啟動(dòng)服務(wù);另一種是手動(dòng)初始化環(huán)境,啟動(dòng)服務(wù)。
不過易用不代表好用,畢竟要智能體真正解決通用實(shí)際問題,其實(shí)難度不小。而透過GAIA榜單上看到,它的能力還不賴,三個(gè)level水平至少都算得上一流水平。
而在廣大開發(fā)者的評(píng)價(jià)以及實(shí)測(cè)結(jié)果上,我們發(fā)現(xiàn),JoyAgent有自己獨(dú)特「討巧」的解題思路。
比如它可擴(kuò)展性強(qiáng),有多種智能體、工具可選。
智能體主要包括SearchAgent、ReportAgent、CodeAgent等,工具包含多種文檔處理工具、不同報(bào)告生成工具如html、ppt、markdown、表格生成工具,支持多種樣式輸出。
如果想要定制新場(chǎng)景新功能,只需將相關(guān)的子智能體、工具掛載上去。步驟也非常簡(jiǎn)單:配置文件、啟動(dòng)服務(wù),然后就可以對(duì)話了。
比如添加一個(gè)12306工具之后,規(guī)劃7月7天2人從北京出發(fā)去新疆的旅行計(jì)劃,并查詢相關(guān)火車票信息。它就開始規(guī)劃、調(diào)用工具查詢,最終輸出報(bào)告。
再有就是它的并行處理思路,這樣一來執(zhí)行效率就會(huì)很高。
比如想讓它生成一份具身智能報(bào)告。提示詞很簡(jiǎn)單,就是具身智能報(bào)告。
它在思考了要收集最新的相關(guān)信息之后,到行動(dòng)環(huán)節(jié)就能看到hua的一下~五個(gè)搜索線程同時(shí)進(jìn)行,他們各司其職,各搜各的。
因此整個(gè)過程只搜索了一兩分鐘,然后就可以總結(jié)、生成報(bào)告了。
最后生成的可視化報(bào)告也挺全面,囊括具身智能的定義、理論基礎(chǔ)、發(fā)展現(xiàn)狀、關(guān)鍵技術(shù)體系、主要應(yīng)用領(lǐng)域以及行業(yè)挑戰(zhàn)與未來趨勢(shì)。
有最新的時(shí)間節(jié)點(diǎn),有可視化表格,還有參考文獻(xiàn)……在沒有任何多余提示的情況下,這么短時(shí)間內(nèi)出的深度研究報(bào)告,質(zhì)量可以說是非常之高了。
通用性強(qiáng)但輕量化,可選多種工具/智能體以滿足定制化需求,再有就是執(zhí)行效率也很高……這么一個(gè)100%開源的智能體產(chǎn)品,可以說打通了企業(yè)AI落地的最后一公里。
不過此次引發(fā)如此廣泛關(guān)注的原因,不僅在于產(chǎn)品本身,更在于其底層的技術(shù)創(chuàng)新。這些創(chuàng)新在解決行業(yè)核心挑戰(zhàn)——如復(fù)雜任務(wù)處理、上下文管理、工具應(yīng)用靈活性以及信息檢索效率方面具有重要的參考價(jià)值。
扒了扒代碼,發(fā)現(xiàn)有這些創(chuàng)新
在GitHub頁面上,京東云也攤開了自己的系統(tǒng)架構(gòu)圖和代碼。
整個(gè)系統(tǒng)設(shè)計(jì)得十分清晰,從中可以看到主要的創(chuàng)新點(diǎn),摘取部分展開介紹一下。
首先是多層級(jí)和多模式思考。這個(gè)其實(shí)不難理解。
隨著Agent能力越來越強(qiáng),解決的問題越來越復(fù)雜,簡(jiǎn)單的一步推理顯然是不夠的。傳統(tǒng)單層級(jí)智能體難以有效處理復(fù)雜問題的規(guī)劃和執(zhí)行。
而JoyAgent將這兩個(gè)核心步驟拆解開,主打各干各的,它采用了雙層級(jí)規(guī)劃架構(gòu),包括WorkLevel(計(jì)劃層)和TaskLevel(執(zhí)行層)。
WorkLevel負(fù)責(zé)整體任務(wù)規(guī)劃,能夠深度推理用戶輸入,識(shí)別核心需求,并將復(fù)雜問題分解為可管理、可執(zhí)行、獨(dú)立且清晰的子任務(wù)。但最多支持分解為5個(gè)子任務(wù),避免過度拆解,防止Agent過度思考陷入死循環(huán)。
而TaskLevel采用ReAct模式,用于具體的任務(wù)執(zhí)行,形成“思考-行動(dòng)-觀察-反思”的完整循環(huán)。
這種架構(gòu)確保了宏觀規(guī)劃與微觀執(zhí)行的最優(yōu)結(jié)合,類似于Gemini-CLI、Cursor等現(xiàn)代做法,通過粗粒度的Task來管控目標(biāo),通過ReasonAct模式來操作Task,協(xié)同完成整體目標(biāo)。
其次,文件系統(tǒng)+內(nèi)存混合的上下文管理系統(tǒng)。
日常使用大模型時(shí),經(jīng)常會(huì)因?yàn)樯舷挛南拗茖?dǎo)致重要信息丟失,簡(jiǎn)單的截?cái)嗷蛘蛔阋员A敉暾畔ⅰ4送膺€有任務(wù)與任務(wù)之間的上下文傳遞困難,以及還有多輪對(duì)話的文件持久化問題。
JoyAgent采用的這個(gè)上下文管理系統(tǒng),可以按需分離存儲(chǔ),對(duì)話歷史存儲(chǔ)在內(nèi)存中,而像Filetool、代碼解析、報(bào)告、深度搜索等結(jié)果則使用文件系統(tǒng)存儲(chǔ)。文件存儲(chǔ)的方式更長效,能更好地實(shí)現(xiàn)任務(wù)與任務(wù)之間的上下文傳遞。而分層次的上下文管理也更加靈活。
此外,它還區(qū)分全局產(chǎn)出文件(productFiles)和當(dāng)前任務(wù)文件(taskProductFiles),全局文件可以跨任務(wù)共享。任務(wù)切換時(shí)臨時(shí)文件會(huì)被清理,但全局產(chǎn)出文件會(huì)保留。
這種設(shè)計(jì)使得系統(tǒng)能夠處理大文件而不影響內(nèi)存,支持任務(wù)間的文件共享,實(shí)現(xiàn)多輪對(duì)話的文件持久化,并提供清晰的文件生命周期管理。它突破了LLM上下文限制,保留了信息的完整性,并降低了運(yùn)行成本,提升了框架穩(wěn)定性。
此外,還有工具/智能體自動(dòng)進(jìn)化機(jī)制。針對(duì)不同領(lǐng)域不同場(chǎng)景,JoyAgent能夠根據(jù)任務(wù)動(dòng)態(tài)為工具生成專業(yè)化數(shù)字員工角色。這與傳統(tǒng)框架中工具身份固定、適應(yīng)能力靜態(tài)配置不同,工具自行具備上下文感知和角色適應(yīng)能力。
比如分析財(cái)務(wù)報(bào)告時(shí),智能體就會(huì)是數(shù)據(jù)分析師、報(bào)告撰寫專家、信息檢索員。
Bytheway,這里也體現(xiàn)了多智能體協(xié)同能力,面對(duì)數(shù)據(jù)收集整理任務(wù)時(shí),數(shù)據(jù)整理員和信息檢索員將分工協(xié)作。
這樣做除了使用起來有場(chǎng)景沉浸感,也提升了工具使用準(zhǔn)確性,減少工具使用錯(cuò)誤40%。
此外還有深度搜索能力(比如五個(gè)線程并行搜索)、多智能體協(xié)同(面對(duì)復(fù)雜請(qǐng)求,由多個(gè)智能體提議、討論或投票選出最佳方案執(zhí)行)都是此次所展現(xiàn)出的亮點(diǎn)。
而且因?yàn)槭蔷〇|從自己業(yè)務(wù)系統(tǒng)中孵化的商業(yè)智能體。因此相較于其他開源產(chǎn)品,有著天然的技術(shù)優(yōu)勢(shì)和壁壘。企業(yè)開發(fā)者使用起來,怎么說也會(huì)更安心一點(diǎn)。
像安全性方面,據(jù)介紹,JoyAgent的企業(yè)級(jí)安全防護(hù)體系,從數(shù)據(jù)傳輸加密、細(xì)粒度權(quán)限管控到實(shí)時(shí)審計(jì)監(jiān)控,能夠全方位守護(hù)企業(yè)核心知識(shí)資產(chǎn)。
還有可靠性上,JoyAgent也是經(jīng)歷過京東618這種大場(chǎng)面的。
在零售采銷這件事兒上,它深度融合歷史銷售、實(shí)時(shí)搜索、氣象變化等多維數(shù)據(jù),精準(zhǔn)預(yù)測(cè)全國銷量將達(dá)數(shù)百萬臺(tái)(遠(yuǎn)超人工預(yù)估),并洞察到華南需求激增的現(xiàn)象;同時(shí)實(shí)時(shí)透視全國八大倉庫存,預(yù)警華南主力型號(hào)庫存僅剩50%?;诖耍琂oyAgent自動(dòng)生成供應(yīng)鏈優(yōu)化報(bào)告,明確分倉補(bǔ)貨策略(如緊急補(bǔ)貨廣州倉),并打通采購系統(tǒng),實(shí)現(xiàn)“一鍵生成采購單”,將采購流程從數(shù)天縮短至幾分鐘。
按照后續(xù)計(jì)劃,他們還將持續(xù)擴(kuò)展開源范圍,逐步納入更豐富的工具集與可視化功能模塊。
他們還表示,針對(duì)B端市場(chǎng)的商業(yè)化產(chǎn)品,在實(shí)際落地過程中,企業(yè)私有數(shù)據(jù)保護(hù)、定制化數(shù)據(jù)需求及業(yè)務(wù)流程適配等問題仍需解決,對(duì)此他們將為客戶提供定制化開發(fā)支持。
這可能是離企業(yè)AI落地最近的智能體
雖然眾人都在談?wù)撝悄荏w,但當(dāng)智能體試圖滲透進(jìn)企業(yè)核心業(yè)務(wù)釋放行業(yè)價(jià)值時(shí),面臨的是比消費(fèi)端更嚴(yán)苛的挑戰(zhàn)。
包括不限于專業(yè)知識(shí)門檻,金融、供應(yīng)鏈等場(chǎng)景需精準(zhǔn)理解行業(yè)術(shù)語與規(guī)則,普通Agent因知識(shí)泛化性不足而“答非所問”;其次是與傳統(tǒng)系統(tǒng)協(xié)同的復(fù)雜性,像ERP、CRM等封閉系統(tǒng)接口復(fù)雜,智能體需深度適配API邏輯才能驅(qū)動(dòng)業(yè)務(wù)流程;還有輸出結(jié)果的嚴(yán)謹(jǐn)性,比如采購決策、財(cái)報(bào)分析等輸出直接關(guān)聯(lián)企業(yè)損益,容錯(cuò)率近乎為零,還有企業(yè)端面臨的數(shù)據(jù)安全、商業(yè)隱私等問題需要應(yīng)對(duì)。
這也是這次JoyAgent發(fā)布為什么值得關(guān)注的原因,它向我們展示了一個(gè)真正面向生產(chǎn)環(huán)境打造的AIAgent構(gòu)建平臺(tái)。
在企業(yè)內(nèi)部的嚴(yán)肅商業(yè)場(chǎng)景中,一個(gè)智能體指令的錯(cuò)誤執(zhí)行不容絲毫的損失。這正是普通Agent難以滿足之處——它們或許能處理簡(jiǎn)單任務(wù),但在企業(yè)復(fù)雜、多變、且對(duì)結(jié)果精度要求嚴(yán)苛的環(huán)境下,往往力不從心。
JoyAgent憑借其源自京東復(fù)雜業(yè)務(wù)場(chǎng)景錘煉的可靠性,媲美一流水平的通用性能,以及開箱即用的企業(yè)級(jí)安全特性,真正具備了支撐企業(yè)核心業(yè)務(wù)流程的能力。
它解決的,是AIAgent真刀真槍地在企業(yè)環(huán)境中“用起來”、并產(chǎn)生實(shí)際生產(chǎn)力變革的問題,而非僅僅停留在“能用”的層面。
關(guān)鍵是它還免費(fèi),相比以往部署「外部」的開源產(chǎn)品動(dòng)輒幾十萬數(shù)百萬,京東云將自己用的JoyAgent開源出來,直接把門檻打沒,零成本實(shí)現(xiàn)部署。
也正因此,企業(yè)可以直接復(fù)制這個(gè)樣本,讓開發(fā)者可以基于京東AI實(shí)踐的基礎(chǔ)上去做創(chuàng)新,讓沒有足夠技術(shù)團(tuán)隊(duì)、缺乏商業(yè)場(chǎng)景驗(yàn)證的開發(fā)者,也能快速擁有與京東云相同的Agent能力。
雖然當(dāng)前Agent技術(shù)仍處于發(fā)展初期,未來演進(jìn)存在不確定性,但借助開源這樣的方式就可以共同突破難題。
小說:婚禮前夜被陷害,七年后他鑒寶古武雙絕,歸來稱王!
林楓通曉古董鑒定,金石字畫,古瓷雜項(xiàng),各種品類通吃,在昨天的比試中還贏了他“師父”,他師父說,林楓現(xiàn)在已是當(dāng)世鑒定大師,可林楓卻恨透了他師父。林楓不知道他師父的名字,只是暗地里叫她,蛇蝎美人。七年前,十一假期,林楓婚禮前一天晚上,跟朋友喝酒,喝醉了。醒來的時(shí)候,他被關(guān)在一個(gè)密室里,屋里沒一點(diǎn)兒光線。一開始他 如此地獄一樣的條件下,林楓能堅(jiān)持下來,是因?yàn)椋咝廊烁嬖V他,只要有一天,他能在古董鑒定和古武上贏了她,林楓想做什么都可以——|。甚至,離開這里,回歸他原來生活的地方,也可以。如今七年過去,林楓終于做到,那天夜里,他憤怒的把蛇蝎美人摁在床上,像猛獸一樣,想要撕碎她!可蛇蝎美人眉宇間多了幾分溫柔,目后面會(huì)介紹。小說:婚前被陷害關(guān)禁地七年,歸來成鑒寶古武大師,復(fù)仇開始!