【TechWeb】7月9日消息,全球應用交付和API安全解決方案提供商F5宣布F5BIG-IPNextforKubernetes推出全新功能,該解決方案深度整合NVIDIABlueField-3DPU以及NVIDIADOCA軟件框架,并已通過歐洲客戶Sesterce的實際部署驗證。
作為對F5應用交付與安全平臺(F5ApplicationDeliveryandSecurityPlatform)的進一步擴展,BIG-IPNextforKubernetes現(xiàn)可原生運行于NVIDIABlueField-3DPU,為大規(guī)模AI基礎設施提供高性能流量管理與安全防護,從而顯著提升AI應用的運行效率、控制能力與性能表現(xiàn)。
借助該聯(lián)合解決方案,企業(yè)可將簡單的AI相關任務路由至成本更低、更輕量級的LLM以支持生成式AI,同時將更復雜的查詢留給性能更強大的高階模型處理。該可定制化的智能路由機制還支持按領域調用特定LLM,從而提升輸出質量并顯著改善客戶體驗。F5的先進流量管理技術可確保查詢精準分發(fā)至最適合的模型節(jié)點,從而降低延遲并加快首個詞元生成時間。
今年早些時候,NVIDIA推出Dynamo框架,旨在為生成式AI與推理模型在大規(guī)模分布式環(huán)境中的部署提供支撐。通過統(tǒng)一調度、流量路由和內存管理等核心任務,NVIDIADynamo有效簡化了分布式環(huán)境中AI推理的復雜性,確保其在動態(tài)工作負載下的穩(wěn)定運行。F5與NVIDIA的聯(lián)合解決方案的核心優(yōu)勢之一,是將部分計算操作從CPU卸載至BlueFieldDPU,從而顯著提升整體效率。借助F5技術,DynamoKVCacheManager可基于容量智能路由請求,并通過鍵值(KV)緩存機制,顯著加速生成式AI應用的響應速度。該機制通過復用歷史運算信息,避免重復計算,顯著降低資源開銷。就基礎架構而言,企業(yè)通過KV緩存存儲與復用機制,相比直接占用GPU昂貴的內存資源,能以更低成本實現(xiàn)性能優(yōu)化。
另外,通過在MCP服務器前端部署F5與NVIDIA聯(lián)合解決方案,F(xiàn)5可充當反向代理,從而增強MCP解決方案及其所支持LLM的安全能力。同時,F(xiàn)5iRules提供的全數(shù)據(jù)可編程能力,能夠快速并靈活地響應AI協(xié)議的快速演進需求,并進一步抵御新興網(wǎng)絡安全風險。
穿成反派的白月光,女主登場就回家了,結果半年后我又穿回來了
我穿成了瘋批反派的白月光,女主登場后便美美回家了|。結果半年后我又穿回來了,我問系統(tǒng):【說好的交班呢,說好的女主呢?】系統(tǒng)抱頭痛哭:【這天殺的反派,攻打了我們總部,還反手把女主送回鄉(xiāng)下喂豬去了_。他要求我們必須把你還給他?!康藭r我失去了光環(huán),只是站在他身后的一個炮灰女仆|-。我哆嗦地看著他砍掉了一個人的手指_。鮮血四濺 作為快穿白月光部門的一把手,云青洲向來是攻略了就跑的那種,結果沒想到有那么一天,他所扮演的過的世界都崩了——-。他的積分和假期全都被沒收,于是他只能披上另一個殼子回到原世界,可沒想到……——從伙伴變成和尚,妖尊男主費盡心思勾引他:若睜開眼睛看看我,我不信你兩眼空空-?!獜男值茏兂蓜`,點家說完了。老婆的白月光回來了 穿越成反派男二