白交發(fā)自凹非寺量子位|公眾號QbitAI
離企業(yè)AI落地最近的智能體,剛剛在WAIC官宣對外開源了。
京東云JoyAgent,成為了首個100%開源企業(yè)級智能體。
當前市場上的開源Agent主要是SDK或者框架,而JoyAgent是包括前后端、框架、引擎、核心子智能體等完整能力全部開源,企業(yè)開發(fā)者無需再進行二次開發(fā),直接就能本地獨立部署,開箱即用。
前段時間它已深夜開源,在開發(fā)者圈火了一波,大家紛紛好感拉滿,GitHubStar數(shù)持續(xù)拉升。
大家除了對這個產(chǎn)品級端到端開源印象深刻之外,還對它多智能體協(xié)同、處理問題的能力感到驚艷。
它在GAIA榜單上以Validation集準確率75.15%的成績上榜,性能比肩甚至超越了行業(yè)領先的產(chǎn)品。而相較于前面數(shù)一數(shù)二的產(chǎn)品,它還勝在輕量化,并不依賴更多的生態(tài)和云平臺,開發(fā)者能夠獨立部署。
因此即便JoyAgent提前悄悄上線,也阻止不了開發(fā)者們口口相傳的好評。
而且現(xiàn)在據(jù)說,這個智能體已經(jīng)是歷經(jīng)他們公司內(nèi)部大規(guī)模場景錘煉,超2萬個智能體實踐,可靠性自然就有保證。
所以JoyAgent相當于是京東把自己企業(yè)智能體的落地經(jīng)驗,一攬子全開源了。
行業(yè)首個100%開源企業(yè)級智能體
首先JoyAgent這個名字就很有意思,尤其再跟它的定位「企業(yè)級」結合在一起來看。它似乎在傳達一種態(tài)度,智能體在企業(yè)場景中的部署和應用,其實是一件很Joy的事情。
在JoyAgent之前,市面上也有不少開源產(chǎn)品,大部分都是智能體框架,或者主要是工作流,剩下的還有像SDK、技術模塊、或者協(xié)議。
這種「部分開源」的結果就是開發(fā)者們要做額外的開發(fā)和適配工作,包括前端界面、后端邏輯、智能體協(xié)調(diào)。開源組件雖然豐富,但還是需要自己一個個集成起來。
像JoyAgent這種產(chǎn)品級的產(chǎn)品之前并沒有,而現(xiàn)在JoyAgent也有且只有一個。
它端到端完整開源,沒有可依賴的生態(tài),可以獨立部署開箱即用。這種配置與企業(yè)場景天然適配,并且直接將企業(yè)智能體的使用門檻打下去了。
它有兩種方式可以快速開始:一種是docker一鍵啟動服務;另一種是手動初始化環(huán)境,啟動服務。
不過易用不代表好用,畢竟要智能體真正解決通用實際問題,其實難度不小。而透過GAIA榜單上看到,它的能力還不賴,三個level水平至少都算得上一流水平。
而在廣大開發(fā)者的評價以及實測結果上,我們發(fā)現(xiàn),JoyAgent有自己獨特「討巧」的解題思路。
比如它可擴展性強,有多種智能體、工具可選。
智能體主要包括SearchAgent、ReportAgent、CodeAgent等,工具包含多種文檔處理工具、不同報告生成工具如html、ppt、markdown、表格生成工具,支持多種樣式輸出。
如果想要定制新場景新功能,只需將相關的子智能體、工具掛載上去。步驟也非常簡單:配置文件、啟動服務,然后就可以對話了。
比如添加一個12306工具之后,規(guī)劃7月7天2人從北京出發(fā)去新疆的旅行計劃,并查詢相關火車票信息。它就開始規(guī)劃、調(diào)用工具查詢,最終輸出報告。
再有就是它的并行處理思路,這樣一來執(zhí)行效率就會很高。
比如想讓它生成一份具身智能報告。提示詞很簡單,就是具身智能報告。
它在思考了要收集最新的相關信息之后,到行動環(huán)節(jié)就能看到hua的一下~五個搜索線程同時進行,他們各司其職,各搜各的。
因此整個過程只搜索了一兩分鐘,然后就可以總結、生成報告了。
最后生成的可視化報告也挺全面,囊括具身智能的定義、理論基礎、發(fā)展現(xiàn)狀、關鍵技術體系、主要應用領域以及行業(yè)挑戰(zhàn)與未來趨勢。
有最新的時間節(jié)點,有可視化表格,還有參考文獻……在沒有任何多余提示的情況下,這么短時間內(nèi)出的深度研究報告,質(zhì)量可以說是非常之高了。
通用性強但輕量化,可選多種工具/智能體以滿足定制化需求,再有就是執(zhí)行效率也很高……這么一個100%開源的智能體產(chǎn)品,可以說打通了企業(yè)AI落地的最后一公里。
不過此次引發(fā)如此廣泛關注的原因,不僅在于產(chǎn)品本身,更在于其底層的技術創(chuàng)新。這些創(chuàng)新在解決行業(yè)核心挑戰(zhàn)——如復雜任務處理、上下文管理、工具應用靈活性以及信息檢索效率方面具有重要的參考價值。
扒了扒代碼,發(fā)現(xiàn)有這些創(chuàng)新
在GitHub頁面上,京東云也攤開了自己的系統(tǒng)架構圖和代碼。
整個系統(tǒng)設計得十分清晰,從中可以看到主要的創(chuàng)新點,摘取部分展開介紹一下。
首先是多層級和多模式思考。這個其實不難理解。
隨著Agent能力越來越強,解決的問題越來越復雜,簡單的一步推理顯然是不夠的。傳統(tǒng)單層級智能體難以有效處理復雜問題的規(guī)劃和執(zhí)行。
而JoyAgent將這兩個核心步驟拆解開,主打各干各的,它采用了雙層級規(guī)劃架構,包括WorkLevel(計劃層)和TaskLevel(執(zhí)行層)。
WorkLevel負責整體任務規(guī)劃,能夠深度推理用戶輸入,識別核心需求,并將復雜問題分解為可管理、可執(zhí)行、獨立且清晰的子任務。但最多支持分解為5個子任務,避免過度拆解,防止Agent過度思考陷入死循環(huán)。
而TaskLevel采用ReAct模式,用于具體的任務執(zhí)行,形成“思考-行動-觀察-反思”的完整循環(huán)。
這種架構確保了宏觀規(guī)劃與微觀執(zhí)行的最優(yōu)結合,類似于Gemini-CLI、Cursor等現(xiàn)代做法,通過粗粒度的Task來管控目標,通過ReasonAct模式來操作Task,協(xié)同完成整體目標。
其次,文件系統(tǒng)+內(nèi)存混合的上下文管理系統(tǒng)。
日常使用大模型時,經(jīng)常會因為上下文限制導致重要信息丟失,簡單的截斷或摘要不足以保留完整信息。此外還有任務與任務之間的上下文傳遞困難,以及還有多輪對話的文件持久化問題。
JoyAgent采用的這個上下文管理系統(tǒng),可以按需分離存儲,對話歷史存儲在內(nèi)存中,而像Filetool、代碼解析、報告、深度搜索等結果則使用文件系統(tǒng)存儲。文件存儲的方式更長效,能更好地實現(xiàn)任務與任務之間的上下文傳遞。而分層次的上下文管理也更加靈活。
此外,它還區(qū)分全局產(chǎn)出文件(productFiles)和當前任務文件(taskProductFiles),全局文件可以跨任務共享。任務切換時臨時文件會被清理,但全局產(chǎn)出文件會保留。
這種設計使得系統(tǒng)能夠處理大文件而不影響內(nèi)存,支持任務間的文件共享,實現(xiàn)多輪對話的文件持久化,并提供清晰的文件生命周期管理。它突破了LLM上下文限制,保留了信息的完整性,并降低了運行成本,提升了框架穩(wěn)定性。
此外,還有工具/智能體自動進化機制。針對不同領域不同場景,JoyAgent能夠根據(jù)任務動態(tài)為工具生成專業(yè)化數(shù)字員工角色。這與傳統(tǒng)框架中工具身份固定、適應能力靜態(tài)配置不同,工具自行具備上下文感知和角色適應能力。
比如分析財務報告時,智能體就會是數(shù)據(jù)分析師、報告撰寫專家、信息檢索員。
Bytheway,這里也體現(xiàn)了多智能體協(xié)同能力,面對數(shù)據(jù)收集整理任務時,數(shù)據(jù)整理員和信息檢索員將分工協(xié)作。
這樣做除了使用起來有場景沉浸感,也提升了工具使用準確性,減少工具使用錯誤40%。
此外還有深度搜索能力(比如五個線程并行搜索)、多智能體協(xié)同(面對復雜請求,由多個智能體提議、討論或投票選出最佳方案執(zhí)行)都是此次所展現(xiàn)出的亮點。
而且因為是京東從自己業(yè)務系統(tǒng)中孵化的商業(yè)智能體。因此相較于其他開源產(chǎn)品,有著天然的技術優(yōu)勢和壁壘。企業(yè)開發(fā)者使用起來,怎么說也會更安心一點。
像安全性方面,據(jù)介紹,JoyAgent的企業(yè)級安全防護體系,從數(shù)據(jù)傳輸加密、細粒度權限管控到實時審計監(jiān)控,能夠全方位守護企業(yè)核心知識資產(chǎn)。
還有可靠性上,JoyAgent也是經(jīng)歷過京東618這種大場面的。
在零售采銷這件事兒上,它深度融合歷史銷售、實時搜索、氣象變化等多維數(shù)據(jù),精準預測全國銷量將達數(shù)百萬臺(遠超人工預估),并洞察到華南需求激增的現(xiàn)象;同時實時透視全國八大倉庫存,預警華南主力型號庫存僅剩50%?;诖?,JoyAgent自動生成供應鏈優(yōu)化報告,明確分倉補貨策略(如緊急補貨廣州倉),并打通采購系統(tǒng),實現(xiàn)“一鍵生成采購單”,將采購流程從數(shù)天縮短至幾分鐘。
按照后續(xù)計劃,他們還將持續(xù)擴展開源范圍,逐步納入更豐富的工具集與可視化功能模塊。
他們還表示,針對B端市場的商業(yè)化產(chǎn)品,在實際落地過程中,企業(yè)私有數(shù)據(jù)保護、定制化數(shù)據(jù)需求及業(yè)務流程適配等問題仍需解決,對此他們將為客戶提供定制化開發(fā)支持。
這可能是離企業(yè)AI落地最近的智能體
雖然眾人都在談論智能體,但當智能體試圖滲透進企業(yè)核心業(yè)務釋放行業(yè)價值時,面臨的是比消費端更嚴苛的挑戰(zhàn)。
包括不限于專業(yè)知識門檻,金融、供應鏈等場景需精準理解行業(yè)術語與規(guī)則,普通Agent因知識泛化性不足而“答非所問”;其次是與傳統(tǒng)系統(tǒng)協(xié)同的復雜性,像ERP、CRM等封閉系統(tǒng)接口復雜,智能體需深度適配API邏輯才能驅(qū)動業(yè)務流程;還有輸出結果的嚴謹性,比如采購決策、財報分析等輸出直接關聯(lián)企業(yè)損益,容錯率近乎為零,還有企業(yè)端面臨的數(shù)據(jù)安全、商業(yè)隱私等問題需要應對。
這也是這次JoyAgent發(fā)布為什么值得關注的原因,它向我們展示了一個真正面向生產(chǎn)環(huán)境打造的AIAgent構建平臺。
在企業(yè)內(nèi)部的嚴肅商業(yè)場景中,一個智能體指令的錯誤執(zhí)行不容絲毫的損失。這正是普通Agent難以滿足之處——它們或許能處理簡單任務,但在企業(yè)復雜、多變、且對結果精度要求嚴苛的環(huán)境下,往往力不從心。
JoyAgent憑借其源自京東復雜業(yè)務場景錘煉的可靠性,媲美一流水平的通用性能,以及開箱即用的企業(yè)級安全特性,真正具備了支撐企業(yè)核心業(yè)務流程的能力。
它解決的,是AIAgent真刀真槍地在企業(yè)環(huán)境中“用起來”、并產(chǎn)生實際生產(chǎn)力變革的問題,而非僅僅停留在“能用”的層面。
關鍵是它還免費,相比以往部署「外部」的開源產(chǎn)品動輒幾十萬數(shù)百萬,京東云將自己用的JoyAgent開源出來,直接把門檻打沒,零成本實現(xiàn)部署。
也正因此,企業(yè)可以直接復制這個樣本,讓開發(fā)者可以基于京東AI實踐的基礎上去做創(chuàng)新,讓沒有足夠技術團隊、缺乏商業(yè)場景驗證的開發(fā)者,也能快速擁有與京東云相同的Agent能力。
雖然當前Agent技術仍處于發(fā)展初期,未來演進存在不確定性,但借助開源這樣的方式就可以共同突破難題。
本書同名改編的超級網(wǎng)劇同步制作中 如果想了解制作情況, 看最新最快的內(nèi)容, 番外同人以及線下活動, 這是一個詭奇虛幻的世界 這是一個信仰堅定卻崩潰的世界。 一個看似平凡卻背負驚天秘密的少年, 他崛起于卑微, 徘徊在生與死的邊緣, 迷茫于錯與對的選擇, 探索地球文明毀滅的真相, 當經(jīng)歷一系列不可思議冒險和坎坷成長后, 最終發(fā)現(xiàn)了深藏在神魔之戰(zhàn)背后的秘密, 演繹了一段熱血而又震撼的故事 延伸閱讀:與 《京東云將》Age:nt門95%檻直接給打沒了 的相關文章