劉淑岳
IT之家7月30日消息,今天,在FORCELinkAI創(chuàng)新巡展?廈門(mén)站,字節(jié)跳動(dòng)火山引擎發(fā)布豆包?圖像編輯模型3.0、豆包?同聲傳譯模型2.0,豆包大模型1.6系列全新升級(jí),并宣布開(kāi)源扣子核心能力,發(fā)布企業(yè)自有模型托管方案、ResponsesAPI等多個(gè)模型服務(wù)和工具產(chǎn)品。
IT之家從官方獲悉,豆包?圖像編輯模型SeedEdit3.0基于強(qiáng)大的文生圖模型Seedream3.0,具備更強(qiáng)的指令遵循能力、圖像保持能力和更強(qiáng)的圖像生成質(zhì)量;疊加多樣化的數(shù)據(jù)融合方法與特定獎(jiǎng)勵(lì)模型,可支持1K以上高清圖像的生成與處理。
用戶(hù)只需通過(guò)自然語(yǔ)言指令,即可完成消除多余內(nèi)容、改變光影效果、替換文字等操作。同時(shí),豆包?圖像編輯模型3.0具備對(duì)風(fēng)格、結(jié)構(gòu)與語(yǔ)義的精準(zhǔn)控制力,能夠像人類(lèi)大腦一樣理解指令、深度思考,解鎖更多創(chuàng)新的修圖場(chǎng)景,例如圖像風(fēng)格轉(zhuǎn)換、變換材質(zhì)、變化人物姿勢(shì)、根據(jù)提示詞進(jìn)行推理等P圖玩法。
官方介紹稱(chēng),豆包?圖像編輯模型3.0可廣泛應(yīng)用于影像創(chuàng)作、廣告營(yíng)銷(xiāo)、游戲宣傳等領(lǐng)域,企業(yè)用戶(hù)可在火山方舟平臺(tái)調(diào)用API,個(gè)人用戶(hù)可使用即夢(mèng)或豆包App進(jìn)行體驗(yàn)。
不該動(dòng)的地方,絕不動(dòng)!
豆包?圖像編輯模型3.0精準(zhǔn)鎖定頭發(fā)區(qū)域換成短發(fā),只修改毛衣區(qū)域顏色和紋理并添加項(xiàng)鏈。
調(diào)整人物姿態(tài)讓其自然落座,背景、人物面部特征、其他細(xì)節(jié)毫發(fā)無(wú)損!
你的話,它聽(tīng)得懂、做得到!
豆包?圖像編輯模型3.0只瞄準(zhǔn)文字區(qū)域,字體、光影會(huì)自動(dòng)匹配原圖風(fēng)格,智能填充周?chē)y理,畫(huà)面完好如初!
P完還是那么美,那么清晰!
豆包?圖像編輯模型3.0讓黑夜秒變陽(yáng)光明媚的白晝,光影自然過(guò)渡,建筑、樹(shù)木細(xì)節(jié)清晰銳利,毫無(wú)涂抹感或分辨率下降。
會(huì)“腦補(bǔ)”,理解力MAX!
豆包?圖像編輯模型3.0能理解“發(fā)酵”過(guò)程,生成體積膨大、充滿(mǎn)氣泡的發(fā)酵面團(tuán)圖。并且基于面團(tuán)狀態(tài)進(jìn)行推理,在保持面團(tuán)主體關(guān)聯(lián)性的前提下,生成金黃酥脆、香氣四溢的面包圖。
旅游照片中路人太多?說(shuō)句“去掉所有路人”,背景瞬間干干凈凈~(yú)
下載的圖片有水???下指令“消除文字”,無(wú)痕處理比橡皮擦還好用~
老照片想上色?線稿想變寫(xiě)實(shí)?一句話搞定,色彩均勻又自然。
想換光影氛圍?發(fā)出指令“逆光+暖色調(diào)+金色光暈”,秒變電影質(zhì)感。
想給照片或設(shè)計(jì)換個(gè)Style?“毛氈風(fēng)”“水彩風(fēng)”“卡通風(fēng)”……一句指令就能切換,讓你的創(chuàng)意無(wú)限延伸!
豆包?同聲傳譯模型2.0正式發(fā)布:3秒極低延遲,0樣本聲音復(fù)刻
傳統(tǒng)的翻譯系統(tǒng)通常依賴(lài)于“級(jí)聯(lián)模型”——多個(gè)模塊相互串聯(lián),依次處理語(yǔ)音識(shí)別、翻譯、聲音復(fù)刻和語(yǔ)音合成等任務(wù),翻譯結(jié)果不夠連貫、處理速度慢。
此次全新發(fā)布的豆包?同聲傳譯模型Seed-LiveInterpret2.0,支持全雙工語(yǔ)音理解和生成框架,將傳統(tǒng)機(jī)器同傳的語(yǔ)音延遲從8-10秒降低到2-3秒,實(shí)現(xiàn)文本與語(yǔ)音的同步生成;無(wú)需提前錄制,一邊說(shuō)話一邊采樣,實(shí)現(xiàn)0樣本聲音復(fù)刻,讓同一個(gè)人同音色開(kāi)口說(shuō)外語(yǔ),帶來(lái)更沉浸的體驗(yàn)。
豆包大模型1.6系列再升級(jí):極速版延遲低至10ms
今年6月,豆包大模型1.6系列多個(gè)模型正式發(fā)布,為企業(yè)提供多樣化選擇。此次,極速版Doubao-Seed-1.6-flash模型在保持出色的視覺(jué)理解能力的同時(shí),升級(jí)了代碼、推理、數(shù)學(xué)等大語(yǔ)言模型能力。
Doubao-Seed-1.6-flash模型,非常適合智能巡檢、手機(jī)助手、智能硬件等對(duì)模型效果、速度和成本都有要求的大規(guī)模商業(yè)化場(chǎng)景。該模型具有業(yè)界領(lǐng)先的極低延遲,TPOT僅10ms,并依然具備強(qiáng)大的視覺(jué)理解能力。
價(jià)格上,Doubao-Seed-1.6-flash在輸入文本長(zhǎng)度0-32k的區(qū)間中(企業(yè)使用量最大),每百萬(wàn)tokens輸入僅需0.15元,輸出僅1.5元。在真實(shí)的客戶(hù)案例中,該模型幫助客戶(hù)延遲下降60%,成本降低70%。
此外,火山引擎發(fā)布全模態(tài)向量化模型Seed1.6-Embedding,首次實(shí)現(xiàn)了“文本+圖像+視頻”混合模態(tài)的融合檢索,幫助企業(yè)構(gòu)建更強(qiáng)大的多模態(tài)知識(shí)庫(kù)。在權(quán)威測(cè)評(píng)榜單中,該模型包攬了多模態(tài)全面任務(wù)、中文文本的SOTA成績(jī)。
來(lái)源:紅網(wǎng)
作者:趙柏樂(lè)
編輯:林孟霖
本文為紅辣椒評(píng)論 原創(chuàng)文章,僅系作者個(gè)人觀點(diǎn),不代表紅網(wǎng)立場(chǎng)。轉(zhuǎn)載請(qǐng)附原文出處鏈接和本聲明。