作者|鄧詠儀
編輯|蘇建勛
以往在大模型上一直低調(diào)行事,但在AI應(yīng)用上,騰訊這回終于不藏著了。
7月26日,世界人工智能大會(huì)(WAIC)在上海開幕。明顯可見的是,騰訊在WAIC上,讓AI智能體成為14億用戶的“數(shù)字好友”,用智能體構(gòu)建起了一個(gè)“好友圈”,覆蓋用戶生活中的
騰訊也發(fā)布了從自研大模型到智能體的多項(xiàng)新品,可以說是“AI全家桶“,包括:
ToB一側(cè):新發(fā)布混元世界模型1.0,能夠應(yīng)用在VR,游戲開發(fā),場景編輯,物理仿真等;接下來還要開源多個(gè)混元小體量模型;ToC一側(cè),發(fā)布了超過10個(gè)Agent(智能體),朱啊喲圍繞生活、學(xué)習(xí)、工作場景,包括旅游規(guī)劃Agent平臺(tái)層面:發(fā)布了智能體開發(fā)平臺(tái)、具身智能開放平臺(tái)Tairos、AIGC內(nèi)容生成平臺(tái)、端側(cè)大模型平臺(tái)、AI教育平臺(tái)
“現(xiàn)在的AI是從到短期記憶到長期記憶的演進(jìn)”,騰訊云副總裁、騰訊云智能負(fù)責(zé)人、騰訊優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲表示,在很長一段時(shí)間里面,大模型只能記住比較短的上下文,這對(duì)復(fù)雜任務(wù)是不夠的。
而騰訊大力投入到智能體中,也是對(duì)技術(shù)演進(jìn)路線的探索。比如多智能體協(xié)同——吳運(yùn)聲表示,AI技術(shù)正在從圖文問答向全方位的多模態(tài)(視頻、圖像、音頻等)交互演進(jìn),全模態(tài)的無縫的交互在以后是不要的。而如果有不同的智能體負(fù)責(zé)不同的專業(yè),去讓各種各樣智能體做協(xié)同,才能去完成更加復(fù)雜的任務(wù)。
△來源:騰訊
2023年,騰訊云剛剛發(fā)布混元大模型家族時(shí),講的還是“行業(yè)大模型”的故事——從金融、政務(wù)、運(yùn)營商等10大行業(yè),主打“行業(yè)大模型”的路線,一口氣拋出超過50個(gè)解決方案。
但到現(xiàn)在,敘事已經(jīng)改變,從語言模型迅速擴(kuò)展到多模態(tài)、具身智能。
這次WAIC上,騰訊也首次重點(diǎn)發(fā)布了具身智能相關(guān)的進(jìn)展。騰訊旗下的RoboticsX實(shí)驗(yàn)室與福田實(shí)驗(yàn)室,聯(lián)合發(fā)布了“具身智能開放平臺(tái)Tairos”。
△來源:騰訊
這是國內(nèi)首個(gè)以模塊化的方式提供大模型、開發(fā)工具和數(shù)據(jù)服務(wù)的具身智能軟件平臺(tái),即插即用,且面向機(jī)器人行業(yè)開放,為機(jī)器人本體開發(fā)商與應(yīng)用開發(fā)商補(bǔ)齊關(guān)鍵的軟件能力。
模型和ToB/ToC應(yīng)用兩手抓
在模型側(cè),這次騰訊正式發(fā)布的重點(diǎn)是混元3D世界模型1.0,并宣布全面開源。
如果說大語言模型(LLM)的技術(shù)演進(jìn)路線已經(jīng)逐步明晰,從擴(kuò)大規(guī)模Scaleup,到以強(qiáng)化學(xué)習(xí)(ReinforceLearning)為主的下半場;那么多模態(tài)的發(fā)展階段還在早期,無論是技術(shù)選型、高質(zhì)量數(shù)據(jù)、模型工程都有多項(xiàng)難點(diǎn)。
多模態(tài)則是今年各家比拼的重點(diǎn),而世界模型也是多模態(tài)的一個(gè)重要分支,在2024年12月才興起。
簡單來說,騰訊混元3D世界模型1.0融合了全景視覺生成與分層3D重建技術(shù),同時(shí)支持文字和圖片輸入,實(shí)現(xiàn)了高質(zhì)量、風(fēng)格多樣的可漫游3D場景生成。
△來源:騰訊
過去,3D建模和渲染是個(gè)巨大的工程,需要專業(yè)建模團(tuán)隊(duì)數(shù)周才能搭建?,F(xiàn)在,只需一句文字或一張圖片,幾分鐘內(nèi)即可生成。
談及世界模型的訓(xùn)練難點(diǎn),數(shù)據(jù)是其中一個(gè)。騰訊混元3D負(fù)責(zé)人郭春超在接受包括36氪等媒體采訪時(shí)表示,目前3D資產(chǎn)主要依賴于藝術(shù)家或建模師的手工制作,因此其數(shù)量僅為幾千萬級(jí),與百億、千億級(jí)的圖片數(shù)量相比,存在數(shù)量級(jí)上的差距,這種獲取難度較大的情況是客觀存在的。
對(duì)于未來的發(fā)展重點(diǎn),郭春超表示,混元世界模型的目標(biāo)有兩方面:一是提升3D資產(chǎn)生成的質(zhì)量,使其達(dá)到更高的商用水平。目前,3D資產(chǎn)生成已達(dá)到中等水平,但與頂尖水平仍有差距。通過提高生成質(zhì)量和泛化性,他們希望能更好地滿足游戲、自動(dòng)駕駛、XR、動(dòng)漫及影視等行業(yè)的需求,降低成本并縮短周期;
二則是改進(jìn)場景生成和交互模型,構(gòu)建更完整、真實(shí)模擬物理規(guī)律的世界模型,今年重點(diǎn)開展,在明年達(dá)到更高成熟度。
今年年初,DeepSeekR1的經(jīng)驗(yàn)已經(jīng)證明,在嶄新的技術(shù)領(lǐng)域,搶占技術(shù)話語權(quán),并且做出令人尊敬的工作,能夠獲得巨大的市場回報(bào)。
在那之后,各家都紛紛加快了開源步伐。事實(shí)上,除本次發(fā)布即開源的混元3D世界模型1.0,混元還將在月底開源一系列小尺寸模型,包含0.5B、1.8B、4B、7B混合推理模型,更輕量、好部署。
騰訊由于游戲、社交等內(nèi)容領(lǐng)域的積累,在多模態(tài)的探索上,已經(jīng)是國內(nèi)第一梯隊(duì)的選手?,F(xiàn)在,騰訊已經(jīng)對(duì)外提供接近商業(yè)模型性能的開源基座,方便社區(qū)基于業(yè)務(wù)和使用場景定制。
據(jù)騰訊發(fā)布的公開數(shù)據(jù),如今騰訊的圖像、視頻衍生模型數(shù)量分別達(dá)到1400和1600個(gè),混元3D系列模型社區(qū)下載量超過230萬,已成為全球最受歡迎的3D開源模型。
除了世界模型之外,騰訊混元還披露了包括端側(cè)混合推理語言模型、多模態(tài)理解模型、游戲視覺模型等在內(nèi)的一系列開源計(jì)劃。
比如,即將開源的混元-large-vision,就是在LMArenaVision榜單拿下國內(nèi)第一的多模態(tài)理解模型;而專為游戲場景優(yōu)化的、交互式游戲視頻生成框架“混元GameCraft”,也會(huì)在近期對(duì)外開源。
落地,還是落地
在大模型的戰(zhàn)略上,騰訊一而貫之的風(fēng)格是務(wù)實(shí),這次的WAIC上,騰訊的主題也是“讓‘好用的AI’成為普惠生產(chǎn)力”。
騰訊已經(jīng)將Agent的能力,嵌入到騰訊多個(gè)ToB及ToC應(yīng)用中,覆蓋生活、工作、學(xué)習(xí)、娛樂等場景。
在學(xué)習(xí)場景,QQ瀏覽器QBot提供AI搜索、AI瀏覽、AI辦公、AI學(xué)習(xí)、AI寫作等功能;imaAI工作臺(tái)可以輔助完成日常學(xué)習(xí)和工作任務(wù),并長期沉淀為個(gè)人的智能化知識(shí)庫,也支持加入別人的共享知識(shí)庫進(jìn)行精準(zhǔn)問答。
又比如,旅游規(guī)劃Agent。它可以根據(jù)參觀者需求,一鍵生成旅行攻略,還可隨時(shí)對(duì)生成的攻略進(jìn)行個(gè)性化編輯。同時(shí)通過內(nèi)置小程序直接實(shí)現(xiàn)無縫下單,真正實(shí)現(xiàn)一次輸入,多項(xiàng)指令一步到位。
△來源:騰訊
在娛樂創(chuàng)作方面,QQ音樂也上線了“AI作歌”及“AI唱”功能,幫助用戶創(chuàng)作或者高質(zhì)量“演唱”歌曲。此前,QQ音樂就推出了全球首位AI歌手“AI力宏”。
騰訊不止自己做智能體,也上了配套的智能體“創(chuàng)作工具”。比如,“騰訊云智能體開發(fā)平臺(tái)”和“騰訊元器”兩大智能體開發(fā)平臺(tái),就可以大大降低AIAgent搭建與使用的門檻,幫助企業(yè)客戶和創(chuàng)作者搭建屬于自己的智能體。
此前,和企業(yè)上私有云類似,行業(yè)大模型定制化程度高,市場常有“落地成本高”“落地難”的疑問。在大模型這兩年不斷提升能力之后,智能體目前收到追捧。
有了智能體之后,行業(yè)大模型的意義在什么地方?吳運(yùn)聲對(duì)36氪表示,智能體和行業(yè)大模型更多是配合作用。在行業(yè)大模型上,企業(yè)客戶可以和騰訊云共創(chuàng),將行業(yè)Know-how沉淀到行業(yè)大模型中,這些能力可以服用;而智能體則可以通過MCP等協(xié)議,在企業(yè)客戶的前端場景中,解決更小單元的問題。
“智能體能夠放大大模型價(jià)值,是解決業(yè)界落地問題的重要形態(tài)?!眳沁\(yùn)聲對(duì)36氪表示。
誠意推薦!一本設(shè)定滿分的都市腦洞文《都市絕世神帝》,劇情合理
《都市絕世神帝》,竟然1天就火遍全網(wǎng)?放心入坑就對(duì)了
都市修真,萬古仙帝重生都市富二代,吊打一切,懷擁美女縱橫花都
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。