7月30日,火山引擎在其主辦的FORCELinkAI創(chuàng)新巡展·廈門站活動上,發(fā)布豆包系列新模型及AI云原生服務(wù)升級成果,包括豆包·圖像編輯模型3.0、同聲傳譯模型2.0,以及全新升級的豆包大模型1.6系列,同時推出扣子核心能力開源、企業(yè)自有模型托管方案等工具,為企業(yè)及開發(fā)者構(gòu)建Agent、落地AI應(yīng)用提供全棧支持。
圖:火山引擎總裁譚待發(fā)布最新豆包模型
豆包系列新模型面向企業(yè)開放
針對AI圖像編輯中“聽不懂指令、誤改內(nèi)容、生成效果差”的痛點,火山引擎推出豆包·圖像編輯模型3.0(SeedEdit3.0)。該模型通過強化指令遵循能力、圖像保持能力及生成質(zhì)量,讓用戶僅憑自然語言即可完成消除冗余、調(diào)整光影、替換元素等操作,還能實現(xiàn)風(fēng)格轉(zhuǎn)換、材質(zhì)變換、姿勢調(diào)整等創(chuàng)新修圖場景。該模型廣泛適用于影像創(chuàng)作、廣告營銷等領(lǐng)域,企業(yè)用戶可在火山方舟調(diào)用其API,個人用戶則能通過即夢或豆包app進(jìn)行體驗。
最新發(fā)布的豆包·同聲傳譯模型2.0(Seed-LiveInterpret2.0),突破傳統(tǒng)“級聯(lián)模型”局限,采用全雙工框架將語音延遲從8-10秒降至2-3秒,實現(xiàn)文本與語音同步生成。更支持0樣本聲音復(fù)刻,無需提前錄制即可實時生成同音色外語語音,甚至匹配方言口音,大幅提升跨語言溝通沉浸感。
豆包大模型1.6系列也進(jìn)行了升級。其中,極速版Doubao-Seed-1.6-flash模型在保持強大視覺理解能力的同時,強化了代碼、推理、數(shù)學(xué)等能力,適配智能巡檢、手機助手等大規(guī)模商業(yè)化場景。該模型TPOT(首Token輸出時間)低至10ms,為業(yè)界領(lǐng)先;成本上,在0-32k輸入文本長度區(qū)間(企業(yè)最常用),每百萬tokens輸入僅0.15元、輸出1.5元,在客戶使用案例中,已實現(xiàn)延遲下降60%、成本降低70%。
此外,全模態(tài)向量化模型Seed1.6-Embedding首次實現(xiàn)“文本+圖像+視頻”混合模態(tài)融合檢索,助力企業(yè)構(gòu)建更強大的多模態(tài)知識庫,在權(quán)威測評中包攬多模態(tài)全面任務(wù)及中文文本的最優(yōu)成績。
優(yōu)化AI云原生服務(wù),加速Agent開發(fā)落地
為助力Agent端到端開發(fā)與落地,火山引擎持續(xù)優(yōu)化AI云原生全棧服務(wù)。7月26日,AIAgent開發(fā)平臺扣子核心能力正式開源,涵蓋一站式可視化開發(fā)工具“扣子開發(fā)平臺(CozeStudio)”和全鏈路管理工具“扣子羅盤(CozeLoop)”,采用Apache2.0許可證,用戶可在GitHub下載。開源僅三天,CozeStudio星標(biāo)數(shù)破萬,CozeLoop星標(biāo)數(shù)超3000?;鹕揭鏋槠涮峁┤嬷С?,企業(yè)AI平臺HiAgent可調(diào)用其能力,云基礎(chǔ)產(chǎn)品支持一鍵部署。
針對有模型定制需求的企業(yè),火山引擎依托火山方舟模型單元推出自有模型托管方案。企業(yè)無需運維底層GPU資源及復(fù)雜配置,即可實現(xiàn)自研模型全托管,享受彈性算力,自主選擇部署方式與機型,精準(zhǔn)控制時延,且無需為業(yè)務(wù)低谷期付費,目前已開放邀測。
同時,火山方舟升級API體系,推出ResponsesAPI。該API具備原生上下文管理能力,支持多輪對話鏈?zhǔn)焦芾砑拔谋?、圖像等多模態(tài)數(shù)據(jù)銜接,結(jié)合緩存能力可降低80%成本;還支持單次請求聯(lián)動多工具與模型組合響應(yīng),將智能助手Agent開發(fā)從460行代碼、1-2天,縮減至60行代碼、1小時,大幅提升效率。
此次系列發(fā)布進(jìn)一步完善了火山引擎AI生態(tài)布局,為企業(yè)與開發(fā)者提供從基礎(chǔ)模型到開發(fā)工具的全鏈條支持,加速AI在各行業(yè)的落地應(yīng)用。