7月30日,火山引擎在其主辦的FORCELinkAI創(chuàng)新巡展·廈門(mén)站活動(dòng)上,發(fā)布豆包系列新模型及AI云原生服務(wù)升級(jí)成果,包括豆包·圖像編輯模型3.0、同聲傳譯模型2.0,以及全新升級(jí)的豆包大模型1.6系列,同時(shí)推出扣子核心能力開(kāi)源、企業(yè)自有模型托管方案等工具,為企業(yè)及開(kāi)發(fā)者構(gòu)建Agent、落地AI應(yīng)用提供全棧支持。
圖:火山引擎總裁譚待發(fā)布最新豆包模型
豆包系列新模型面向企業(yè)開(kāi)放
針對(duì)AI圖像編輯中“聽(tīng)不懂指令、誤改內(nèi)容、生成效果差”的痛點(diǎn),火山引擎推出豆包·圖像編輯模型3.0(SeedEdit3.0)。該模型通過(guò)強(qiáng)化指令遵循能力、圖像保持能力及生成質(zhì)量,讓用戶僅憑自然語(yǔ)言即可完成消除冗余、調(diào)整光影、替換元素等操作,還能實(shí)現(xiàn)風(fēng)格轉(zhuǎn)換、材質(zhì)變換、姿勢(shì)調(diào)整等創(chuàng)新修圖場(chǎng)景。該模型廣泛適用于影像創(chuàng)作、廣告營(yíng)銷等領(lǐng)域,企業(yè)用戶可在火山方舟調(diào)用其API,個(gè)人用戶則能通過(guò)即夢(mèng)或豆包app進(jìn)行體驗(yàn)。
最新發(fā)布的豆包·同聲傳譯模型2.0(Seed-LiveInterpret2.0),突破傳統(tǒng)“級(jí)聯(lián)模型”局限,采用全雙工框架將語(yǔ)音延遲從8-10秒降至2-3秒,實(shí)現(xiàn)文本與語(yǔ)音同步生成。更支持0樣本聲音復(fù)刻,無(wú)需提前錄制即可實(shí)時(shí)生成同音色外語(yǔ)語(yǔ)音,甚至匹配方言口音,大幅提升跨語(yǔ)言溝通沉浸感。
豆包大模型1.6系列也進(jìn)行了升級(jí)。其中,極速版Doubao-Seed-1.6-flash模型在保持強(qiáng)大視覺(jué)理解能力的同時(shí),強(qiáng)化了代碼、推理、數(shù)學(xué)等能力,適配智能巡檢、手機(jī)助手等大規(guī)模商業(yè)化場(chǎng)景。該模型TPOT(首Token輸出時(shí)間)低至10ms,為業(yè)界領(lǐng)先;成本上,在0-32k輸入文本長(zhǎng)度區(qū)間(企業(yè)最常用),每百萬(wàn)tokens輸入僅0.15元、輸出1.5元,在客戶使用案例中,已實(shí)現(xiàn)延遲下降60%、成本降低70%。
此外,全模態(tài)向量化模型Seed1.6-Embedding首次實(shí)現(xiàn)“文本+圖像+視頻”混合模態(tài)融合檢索,助力企業(yè)構(gòu)建更強(qiáng)大的多模態(tài)知識(shí)庫(kù),在權(quán)威測(cè)評(píng)中包攬多模態(tài)全面任務(wù)及中文文本的最優(yōu)成績(jī)。
優(yōu)化AI云原生服務(wù),加速Agent開(kāi)發(fā)落地
為助力Agent端到端開(kāi)發(fā)與落地,火山引擎持續(xù)優(yōu)化AI云原生全棧服務(wù)。7月26日,AIAgent開(kāi)發(fā)平臺(tái)扣子核心能力正式開(kāi)源,涵蓋一站式可視化開(kāi)發(fā)工具“扣子開(kāi)發(fā)平臺(tái)(CozeStudio)”和全鏈路管理工具“扣子羅盤(pán)(CozeLoop)”,采用Apache2.0許可證,用戶可在GitHub下載。開(kāi)源僅三天,CozeStudio星標(biāo)數(shù)破萬(wàn),CozeLoop星標(biāo)數(shù)超3000?;鹕揭鏋槠涮峁┤嬷С郑髽I(yè)AI平臺(tái)HiAgent可調(diào)用其能力,云基礎(chǔ)產(chǎn)品支持一鍵部署。
針對(duì)有模型定制需求的企業(yè),火山引擎依托火山方舟模型單元推出自有模型托管方案。企業(yè)無(wú)需運(yùn)維底層GPU資源及復(fù)雜配置,即可實(shí)現(xiàn)自研模型全托管,享受彈性算力,自主選擇部署方式與機(jī)型,精準(zhǔn)控制時(shí)延,且無(wú)需為業(yè)務(wù)低谷期付費(fèi),目前已開(kāi)放邀測(cè)。
同時(shí),火山方舟升級(jí)API體系,推出ResponsesAPI。該API具備原生上下文管理能力,支持多輪對(duì)話鏈?zhǔn)焦芾砑拔谋?、圖像等多模態(tài)數(shù)據(jù)銜接,結(jié)合緩存能力可降低80%成本;還支持單次請(qǐng)求聯(lián)動(dòng)多工具與模型組合響應(yīng),將智能助手Agent開(kāi)發(fā)從460行代碼、1-2天,縮減至60行代碼、1小時(shí),大幅提升效率。
此次系列發(fā)布進(jìn)一步完善了火山引擎AI生態(tài)布局,為企業(yè)與開(kāi)發(fā)者提供從基礎(chǔ)模型到開(kāi)發(fā)工具的全鏈條支持,加速AI在各行業(yè)的落地應(yīng)用。
從口碑小眾到全網(wǎng)爆火,《天啟預(yù)報(bào)》成奇幻類牌面,風(fēng)月變強(qiáng)了...
16本已完結(jié)水晶宮西幻小說(shuō),瑰麗的奇幻種族,艷羨的逍遙史詩(shī)
北京紫禁城究竟與二十多代帝王有著何等恩怨糾葛???游樂(lè)無(wú)限