大多數(shù)新人在結婚前,都想拍一組好看的婚紗照留念??墒牵恼杖菀?,后期修圖卻不簡單。專業(yè)修圖師報價昂貴,自己修圖費時費力還可能不滿意,怎么辦?豆包P圖的出現(xiàn),能夠很好地解決這一問題。如下面的視頻所示,筆者先在豆包P圖里上傳了一張AI生成的婚紗照,輸入“讓女生臉部更加精致立體,并適當放大眼睛”的指令,很快得到一張符合要求的圖片。而后,又輸入“把場景換成秋天,女生婚紗換成粉色”的指令,豆包既能出色地完成任務,又能保持女生面部和體型上的特征。最后,輸入“讓圖片整體更加有質感”的指令,筆者成功得到一張高質量成品圖。顯然,憑借強大的圖像編輯能力,普通用戶也能輕松修出理想圖片。其背后,離不開豆包?圖像編輯模型3.0(SeedEdit3.0)提供的技術支撐。
實測豆包P圖功能
2025年7月30日,火山引擎主辦FORCELinkAI創(chuàng)新巡展·廈門站活動。會上,發(fā)布豆包系列新模型和AI云原生服務升級成果,包括豆包·圖像編輯模型3.0、同聲傳譯模型2.0,以及全新升級的豆包大模型1.6系列,同時推出扣子核心能力開源、企業(yè)自有模型托管方案等多款工具,為企業(yè)及開發(fā)者構建Agent、落地AI應用提供全棧支持。
發(fā)布豆包·圖像編輯模型3.0等多款大模型,完成豆包大模型1.6系列新升級
火山引擎推出豆包·圖像編輯模型3.0,主要是為解決AI圖像編輯中聽不懂指令、誤改內容和生成效果差的痛點。該模型面向指令遵循、圖像保持和圖像質量三方面進行優(yōu)化,讓用戶僅用自然語言就能完成替換元素、消除冗余、風格轉換等操作,可在影像創(chuàng)作、廣告營銷等領域得到廣泛應用,助力解鎖更多創(chuàng)新場景。據(jù)了解,目前個人用戶可在豆包APP和即夢中體驗該模型,企業(yè)用戶可在火山方舟調用其應用程序編程接口(API,ApplicationProgrammingInterface)。
豆包·同聲傳譯模型1.0自去年9月發(fā)布以來便廣受認可,但在服務過程中,還面臨時間延遲和聲音復刻兩大有待解決的問題。對此,本次會議上,火山引擎推出豆包·同聲傳譯模型2.0(Seed-LiveInterpret2.0),將語音延遲從8-10秒降至2-3秒,實現(xiàn)文本與語音同步生成,且支持0樣本聲音復刻,無需提前錄制即可實時生成同音色外語語音,甚至匹配方言口音。實測該模型時,筆者朗讀了一段來自人民日報的文章,發(fā)現(xiàn)該模型能清楚地識別筆者的音色,并快速地將中文同傳為英文。
實測豆包·同聲傳譯模型2.0
會上,該公司發(fā)布并開源了豆包最新翻譯模型Doubao-Seed-Translation。其支持28種語言,能實現(xiàn)26種小語種與中英文的高質量互譯。無論是科技領域的專業(yè)術語,還是生物醫(yī)藥、金融法律等場景下的復雜文本,該模型都能精準地把握語境,提供高質量的翻譯結果。
另外,豆包大模型1.6系列也迎來新升級。
首先,極速版Doubao-Seed-1.6-flash模型具備強大的視覺理解能力,代碼、推理、數(shù)學等能力也進一步強化,可在商超、工廠、家居等行業(yè)發(fā)揮重要作用。測評時,筆者上傳了一張飲品店的圖片,要求模型回答“店內員工是否正確佩戴口罩,奶茶桶是否被擺放在正確的位置”,模型很快便給出正確判斷。
實測Doubao-Seed-1.6-flash模型視覺理解能力
其次,全模態(tài)向量化模型Seed1.6-Embedding也有三大升級。第一,效果全面領先。在延續(xù)上一代圖文檢索優(yōu)勢的基礎上,進一步增強圖文理解能力。第二,在語義匹配等通用向量化任務中表現(xiàn)良好,跨任務泛化能力更強,首次實現(xiàn)“文本+圖像+視頻”混合模態(tài)融合檢索。第三,自定義指令能力全面升級,向量生成更貼合各類業(yè)務需求。
最后,新版Doubao-1.6-thinking,則在代碼、推理和視覺理解等能力上實現(xiàn)大幅優(yōu)化。
優(yōu)化AI云原生全棧服務,為加速Agent落地提供全鏈路技術支持
為幫助企業(yè)在AI時代更好地構建Agent,火山引擎持續(xù)優(yōu)化AI云原生全棧服務,為AI原生應用提供全鏈路技術支持。
在本次大會上,AIAgent開發(fā)平臺扣子核心能力正式開源,覆蓋扣子開發(fā)平臺(CozeStudio)和扣子羅盤(CozeLoop),采用Apache2.0許可證。
“開源僅三天,CozeStudio星標數(shù)破萬,CozeLoop星標數(shù)超3000?;鹕揭鏋槠涮峁┤嬷С?,企業(yè)AI平臺HiAgent可調用其能力,云基礎產品支持一鍵部署?!被鹕揭婵偛米T待表示。
圖丨譚待(來源:資料圖)
針對有模型定制化需求的企業(yè)客戶,依托火山方舟模型單元推出自有模型托管方案。企業(yè)無需運維底層GPU資源及復雜配置,即可實現(xiàn)自研模型全托管。此外,通過火山方舟的彈性模型單元,企業(yè)還可自主選擇部署方式與機型,精準控制時延,且無需為業(yè)務低谷期付費。
為促進多模態(tài)API的開發(fā)者統(tǒng)一,火山引擎升級火山方舟平臺的API開發(fā)體系,推出新的ResponsesAPI。該API具備原生上下文管理能力,不僅支持多輪對話鏈式管理及文本、圖像等多模態(tài)數(shù)據(jù)銜接,還支持用戶單次請求聯(lián)動多工具與模型組合響應,讓智能助手Agent開發(fā)從460行代碼縮減至60行代碼,幫助客戶降本增效。
高性能云原生向量數(shù)據(jù)庫VikingDB,也在全介質索引升級、更好的性價比和全模態(tài)表征能力等方面迎來升級,以該數(shù)據(jù)庫為基礎,火山引擎還打造了方便易用的知識庫產品,支持圖、文、視頻多模態(tài)處理及混排輸出。
提示詞工程,是開發(fā)AI應用時必不可少的環(huán)節(jié)?!拔覀儜撟孉gent隨著用戶數(shù)據(jù)自發(fā)改進,就像所有成功的搜索引擎和推薦引擎那樣,讓Agent也找到自己的scalinglaw?!被鹕揭嬷悄芩惴ㄘ撠熑藚堑媳硎?。
基于此,火山引擎升級智能提示詞優(yōu)化平臺PromptPilot,支持任意模型的提示詞優(yōu)化,通過與火山引擎知識庫的深度融合,該平臺在文本理解任務的生成、調試等環(huán)節(jié)中,能精準調用專業(yè)內容,幫助模型在垂直領域實現(xiàn)更深入、精準、可信的理解與輸出。
另外,本次還發(fā)布了AIAgent人機協(xié)同工作臺?!拔覀兺ㄟ^提供千人千面的畫布形態(tài),作為數(shù)字員工的交互入口,連接企業(yè)所有系統(tǒng),讓數(shù)字員工主動服務用戶,解決企業(yè)效率瓶頸?!被鹕揭娓笨偛脧場伪硎?。
同時,廈門大學信息與網絡中心副主任鄭海山,上臺分享了廈門大學Agent上崗案例,該校聯(lián)合火山引擎構建專有智能體開發(fā)基座,結合學校自有知識庫形成的智能底座,支撐學校管理決策與教學科研。
最后,ServingKit、AgentKit和TrainingKit這三款AI開發(fā)工具包也完成新升級。
“ServingKit為推理服務和推理引擎提供更有性價比的底層支持能力,包括模型部署與分發(fā)加速、全鏈路透明運維可觀測能力等?!被鹕揭嬖苹A產品負責人羅浩解釋道。
而另外兩款工具,前者新增了CozeStudio托管服務、擴展插件與模型調用,并優(yōu)化了ComputerUse性能,后者優(yōu)化預訓練性能,支持大規(guī)模集群線性加速。
基于火山引擎提供的工具,游戲企業(yè)網龍開展了多方面探索。據(jù)網龍?zhí)烨鏏I平臺技術負責人黃繼峰分享,該公司訓練了高智能MOBA人機陪玩智能體,接入豆包1.6多模態(tài)模型,探索了更多游戲新玩法與內容生成。
回看本次大會,圍繞大模型和AI云原生服務,火山引擎發(fā)布并升級了諸多產品,進一步完善了公司AI生態(tài)布局?;诖耍摴镜哪繕耸牵铝τ跒槠髽I(yè)與開發(fā)者提供從基礎模型到開發(fā)工具的全鏈條技術支持,加速AI在各行業(yè)快速落地。
國內MMO最激烈神豪互毆現(xiàn)場?參與者加起來總氪金超過2億!
小說:重回游戲之初,我憑什么能稱霸神豪?
DNF:旭旭寶寶多“豪”?背包里國慶套數(shù)量,看到后都不敢相信??游戲...