【TechWeb】7月9日消息,全球應用交付和API安全解決方案提供商F5宣布F5BIG-IPNextforKubernetes推出全新功能,該解決方案深度整合NVIDIABlueField-3DPU以及NVIDIADOCA軟件框架,并已通過歐洲客戶Sesterce的實際部署驗證。
作為對F5應用交付與安全平臺(F5ApplicationDeliveryandSecurityPlatform)的進一步擴展,BIG-IPNextforKubernetes現(xiàn)可原生運行于NVIDIABlueField-3DPU,為大規(guī)模AI基礎設施提供高性能流量管理與安全防護,從而顯著提升AI應用的運行效率、控制能力與性能表現(xiàn)。
借助該聯(lián)合解決方案,企業(yè)可將簡單的AI相關任務路由至成本更低、更輕量級的LLM以支持生成式AI,同時將更復雜的查詢留給性能更強大的高階模型處理。該可定制化的智能路由機制還支持按領域調用特定LLM,從而提升輸出質量并顯著改善客戶體驗。F5的先進流量管理技術可確保查詢精準分發(fā)至最適合的模型節(jié)點,從而降低延遲并加快首個詞元生成時間。
今年早些時候,NVIDIA推出Dynamo框架,旨在為生成式AI與推理模型在大規(guī)模分布式環(huán)境中的部署提供支撐。通過統(tǒng)一調度、流量路由和內存管理等核心任務,NVIDIADynamo有效簡化了分布式環(huán)境中AI推理的復雜性,確保其在動態(tài)工作負載下的穩(wěn)定運行。F5與NVIDIA的聯(lián)合解決方案的核心優(yōu)勢之一,是將部分計算操作從CPU卸載至BlueFieldDPU,從而顯著提升整體效率。借助F5技術,DynamoKVCacheManager可基于容量智能路由請求,并通過鍵值(KV)緩存機制,顯著加速生成式AI應用的響應速度。該機制通過復用歷史運算信息,避免重復計算,顯著降低資源開銷。就基礎架構而言,企業(yè)通過KV緩存存儲與復用機制,相比直接占用GPU昂貴的內存資源,能以更低成本實現(xiàn)性能優(yōu)化。
另外,通過在MCP服務器前端部署F5與NVIDIA聯(lián)合解決方案,F(xiàn)5可充當反向代理,從而增強MCP解決方案及其所支持LLM的安全能力。同時,F(xiàn)5iRules提供的全數(shù)據(jù)可編程能力,能夠快速并靈活地響應AI協(xié)議的快速演進需求,并進一步抵御新興網(wǎng)絡安全風險。
四季養(yǎng)生指南:順應自然調身心,食療菜譜護安康
時令蔬果知多少?吃對了,才更好!那這份簡潔四季菜譜就交給你啦
一周四季節(jié)氣美味菜譜推薦
免責聲明:本文內容由開放的智能模型自動生成,僅供參考。