IT之家7月30日消息,今天,在FORCELinkAI創(chuàng)新巡展?廈門站,字節(jié)跳動火山引擎發(fā)布豆包?圖像編輯模型3.0、豆包?同聲傳譯模型2.0,豆包大模型1.6系列全新升級,并宣布開源扣子核心能力,發(fā)布企業(yè)自有模型托管方案、ResponsesAPI等多個模型服務和工具產(chǎn)品。
IT之家從官方獲悉,豆包?圖像編輯模型SeedEdit3.0基于強大的文生圖模型Seedream3.0,具備更強的指令遵循能力、圖像保持能力和更強的圖像生成質(zhì)量;疊加多樣化的數(shù)據(jù)融合方法與特定獎勵模型,可支持1K以上高清圖像的生成與處理。
用戶只需通過自然語言指令,即可完成消除多余內(nèi)容、改變光影效果、替換文字等操作。同時,豆包?圖像編輯模型3.0具備對風格、結(jié)構(gòu)與語義的精準控制力,能夠像人類大腦一樣理解指令、深度思考,解鎖更多創(chuàng)新的修圖場景,例如圖像風格轉(zhuǎn)換、變換材質(zhì)、變化人物姿勢、根據(jù)提示詞進行推理等P圖玩法。
官方介紹稱,豆包?圖像編輯模型3.0可廣泛應用于影像創(chuàng)作、廣告營銷、游戲宣傳等領域,企業(yè)用戶可在火山方舟平臺調(diào)用API,個人用戶可使用即夢或豆包App進行體驗。
不該動的地方,絕不動!豆包?圖像編輯模型3.0精準鎖定頭發(fā)區(qū)域換成短發(fā),只修改毛衣區(qū)域顏色和紋理并添加項鏈。調(diào)整人物姿態(tài)讓其自然落座,背景、人物面部特征、其他細節(jié)毫發(fā)無損!▲prompt:變成時尚短發(fā)造型。改變姿勢,讓她坐在椅子上你的話,它聽得懂、做得到!豆包?圖像編輯模型3.0只瞄準文字區(qū)域,字體、光影會自動匹配原圖風格,智能填充周圍紋理,畫面完好如初!▲prompt:把“MORE”變成“MAGAZINE”。把“探索未知”變成“凝視內(nèi)心”P完還是那么美,那么清晰!豆包?圖像編輯模型3.0讓黑夜秒變陽光明媚的白晝,光影自然過渡,建筑、樹木細節(jié)清晰銳利,毫無涂抹感或分辨率下降?!鴓rompt:把場景變?yōu)榘滋鞎澳X補”,理解力MAX!豆包?圖像編輯模型3.0能理解“發(fā)酵”過程,生成體積膨大、充滿氣泡的發(fā)酵面團圖。并且基于面團狀態(tài)進行推理,在保持面團主體關聯(lián)性的前提下,生成金黃酥脆、香氣四溢的面包圖。prompt:1小時之后將會發(fā)生什么?面團會變成什么樣的食物呢?旅游照片中路人太多?說句“去掉所有路人”,背景瞬間干干凈凈~▲prompt:把所有路人都去掉下載的圖片有水印?下指令“消除文字”,無痕處理比橡皮擦還好用~prompt:消除圖片中的文字老照片想上色?線稿想變寫實?一句話搞定,色彩均勻又自然。prompt:把女人站在埃菲爾鐵塔前的黑白照片變成彩色的prompt:把線稿建筑變成水彩畫想換光影氛圍?發(fā)出指令“逆光+暖色調(diào)+金色光暈”,秒變電影質(zhì)感。prompt:保持原畫面主體內(nèi)容與構(gòu)圖不變,逆光、暖色調(diào)、光影交織、輪廓光、氛圍感、陽光灑入、金色光暈、明暗對比想給照片或設計換個Style?“毛氈風”“水彩風”“卡通風”……一句指令就能切換,讓你的創(chuàng)意無限延伸!豆包?同聲傳譯模型2.0正式發(fā)布:3秒極低延遲,0樣本聲音復刻傳統(tǒng)的翻譯系統(tǒng)通常依賴于“級聯(lián)模型”——多個模塊相互串聯(lián),依次處理語音識別、翻譯、聲音復刻和語音合成等任務,翻譯結(jié)果不夠連貫、處理速度慢。此次全新發(fā)布的豆包?同聲傳譯模型Seed-LiveInterpret2.0,支持全雙工語音理解和生成框架,將傳統(tǒng)機器同傳的語音延遲從8-10秒降低到2-3秒,實現(xiàn)文本與語音的同步生成;無需提前錄制,一邊說話一邊采樣,實現(xiàn)0樣本聲音復刻,讓同一個人同音色開口說外語,帶來更沉浸的體驗。豆包大模型1.6系列再升級:極速版延遲低至10ms今年6月,豆包大模型1.6系列多個模型正式發(fā)布,為企業(yè)提供多樣化選擇。此次,極速版Doubao-Seed-1.6-flash模型在保持出色的視覺理解能力的同時,升級了代碼、推理、數(shù)學等大語言模型能力。Doubao-Seed-1.6-flash模型,非常適合智能巡檢、手機助手、智能硬件等對模型效果、速度和成本都有要求的大規(guī)模商業(yè)化場景。該模型具有業(yè)界領先的極低延遲,TPOT僅10ms,并依然具備強大的視覺理解能力。價格上,Doubao-Seed-1.6-flash在輸入文本長度0-32k的區(qū)間中(企業(yè)使用量最大),每百萬tokens輸入僅需0.15元,輸出僅1.5元。在真實的客戶案例中,該模型幫助客戶延遲下降60%,成本降低70%。此外,火山引擎發(fā)布全模態(tài)向量化模型Seed1.6-Embedding,首次實現(xiàn)了“文本+圖像+視頻”混合模態(tài)的融合檢索,幫助企業(yè)構(gòu)建更強大的多模態(tài)知識庫。在權(quán)威測評榜單中,該模型包攬了多模態(tài)全面任務、中文文本的SOTA成績。
盤點《小花仙》中最美十大花仙精靈王,最后一個和安安的感情最深
小花仙最美的7位黑化精靈王,第3位高貴冷艷,最后一位很淑女??動漫...
《小花仙4》中最美麗的七大進化花仙精靈王,你覺得哪個最好看?
免責聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。