【TechWeb】7月9日消息,全球應(yīng)用交付和API安全解決方案提供商F5宣布F5BIG-IPNextforKubernetes推出全新功能,該解決方案深度整合NVIDIABlueField-3DPU以及NVIDIADOCA軟件框架,并已通過歐洲客戶Sesterce的實(shí)際部署驗(yàn)證。
作為對F5應(yīng)用交付與安全平臺(F5ApplicationDeliveryandSecurityPlatform)的進(jìn)一步擴(kuò)展,BIG-IPNextforKubernetes現(xiàn)可原生運(yùn)行于NVIDIABlueField-3DPU,為大規(guī)模AI基礎(chǔ)設(shè)施提供高性能流量管理與安全防護(hù),從而顯著提升AI應(yīng)用的運(yùn)行效率、控制能力與性能表現(xiàn)。
借助該聯(lián)合解決方案,企業(yè)可將簡單的AI相關(guān)任務(wù)路由至成本更低、更輕量級的LLM以支持生成式AI,同時將更復(fù)雜的查詢留給性能更強(qiáng)大的高階模型處理。該可定制化的智能路由機(jī)制還支持按領(lǐng)域調(diào)用特定LLM,從而提升輸出質(zhì)量并顯著改善客戶體驗(yàn)。F5的先進(jìn)流量管理技術(shù)可確保查詢精準(zhǔn)分發(fā)至最適合的模型節(jié)點(diǎn),從而降低延遲并加快首個詞元生成時間。
今年早些時候,NVIDIA推出Dynamo框架,旨在為生成式AI與推理模型在大規(guī)模分布式環(huán)境中的部署提供支撐。通過統(tǒng)一調(diào)度、流量路由和內(nèi)存管理等核心任務(wù),NVIDIADynamo有效簡化了分布式環(huán)境中AI推理的復(fù)雜性,確保其在動態(tài)工作負(fù)載下的穩(wěn)定運(yùn)行。F5與NVIDIA的聯(lián)合解決方案的核心優(yōu)勢之一,是將部分計算操作從CPU卸載至BlueFieldDPU,從而顯著提升整體效率。借助F5技術(shù),DynamoKVCacheManager可基于容量智能路由請求,并通過鍵值(KV)緩存機(jī)制,顯著加速生成式AI應(yīng)用的響應(yīng)速度。該機(jī)制通過復(fù)用歷史運(yùn)算信息,避免重復(fù)計算,顯著降低資源開銷。就基礎(chǔ)架構(gòu)而言,企業(yè)通過KV緩存存儲與復(fù)用機(jī)制,相比直接占用GPU昂貴的內(nèi)存資源,能以更低成本實(shí)現(xiàn)性能優(yōu)化。
另外,通過在MCP服務(wù)器前端部署F5與NVIDIA聯(lián)合解決方案,F(xiàn)5可充當(dāng)反向代理,從而增強(qiáng)MCP解決方案及其所支持LLM的安全能力。同時,F(xiàn)5iRules提供的全數(shù)據(jù)可編程能力,能夠快速并靈活地響應(yīng)AI協(xié)議的快速演進(jìn)需求,并進(jìn)一步抵御新興網(wǎng)絡(luò)安全風(fēng)險。
《大明俗人》,為何只看一章就停不下來了?
今日推薦:《大明俗人》作者:有妖入夢來。點(diǎn)擊文末超鏈接開始觀看吧~-----精選段落----- 第741章義結(jié)金蘭如今丁小小和她擇偶標(biāo)準(zhǔn)都一致,又是全心全意的幫助沈煉成就千秋大業(yè),那就是她的盟友啊|——?;蛟S是感受到了金香玉直勾勾的眼神和釋放的友善,丁小小反而更忐忑了,求助般的看向沈煉|。沈大哥,你別看熱鬧啊,趕緊幫幫忙。沈煉有意袖手旁 今日推薦:《大明俗人》作者:有妖入夢來||。點(diǎn)擊文末超鏈接開始觀看吧~第289章暗中布局他慢慢走了過去,在王戎耳邊低語:“王家背靠九千歲這棵大樹是事實(shí),但我也是給九千歲辦差的,你王家別太囂張了,別以為我這次來江南沒有查你們王家的賬,你們就干凈-?!鄙驘掃@次來江南沒有動王家,除了顧慮到魏忠賢之外,..精華!《相逢如初見,回首是一生》不容錯過,不看太可惜!