機器之心報道
楊文、澤南
AI超級實用的落地,只有這家玩明白了。
前幾天,奧特曼在采訪中透露,親自體驗GPT-5后,被其強大的能力嚇到。有個自己都搞不懂的問題,模型卻能一下答出來,那一刻他甚至覺得自己在擅長的領域也有些「無力」。
盡管AI進展飛快,但總有人質(zhì)疑:真正落地的AI不多,很多所謂的新技術(shù),可能只是炒作。
目光轉(zhuǎn)向剛剛開幕的世界人工智能大會WAIC,我們會發(fā)現(xiàn)AI實用化的落地應用其實并不少。
智駕正被全網(wǎng)熱議,會場內(nèi)外,有很多無人駕駛車輛忙碌的身影,它們是大會的官方接駁車輛。
走進展區(qū),數(shù)字人主播正在與人們互動,TA們語氣自然,知識淵博,反應比你還快,可以說已經(jīng)達到了頂級主播的水準。
這一波展示,像是把我們一下拉進了未來世界。更有意思的是,這些貼近我們生活且有用的AI技術(shù)都來自一家公司,而且是全棧自研的。
中國最火RoboTaxi出海,半年拿下兩城
在今年的世界人工智能大會(WAIC)上,百度蘿卜快跑入選「中國人工智能產(chǎn)業(yè)創(chuàng)新成果展」,成為本屆大會的「國家隊」代表之一。此外,大會還傳來好消息——百度等一批科技公司獲得了上海智能網(wǎng)聯(lián)汽車示范運營牌照,Robotaxi正式駛?cè)肫謻|核心區(qū)。
不知從何時開始,國內(nèi)大街上穿梭的蘿卜快跑成為了稀松平常的事物。在社交網(wǎng)絡上一些有關新鮮事物的話題下,不時可以看到對于無人出租的好評。
出行服務是自動駕駛商業(yè)化落地的關鍵場景,就在今年,全球無人駕駛行業(yè)展現(xiàn)出了前所未有的發(fā)展速度,Waymo、特斯拉、蘿卜快跑等玩家的進展不斷。轟轟烈烈的RoboTaxi大潮中,蘿卜快跑做到了覆蓋范圍廣,用戶口碑好。
截至目前,蘿卜快跑已為全球用戶提供了超過1100萬次出行服務,僅在國內(nèi),他們的無人駕駛車隊就已駛?cè)氡本⑸钲?、武漢、重慶等十多個城市,如果拉出一條最近業(yè)務擴展的時間線,你會發(fā)現(xiàn)它的發(fā)展速度很快。
今年3月,蘿卜快跑首次出海,宣布與迪拜道路交通局(RTA)簽署戰(zhàn)略合作協(xié)議,在迪拜市區(qū)開展無人駕駛規(guī)?;瘻y試和服務。雙方計劃在迪拜部署超過1000輛無人駕駛汽車。蘿卜快跑還宣布與阿聯(lián)酋自動駕駛出行公司Autogo達成戰(zhàn)略合作,打造阿布扎比地區(qū)規(guī)模最大的無人車隊。
6月,香港特別行政區(qū)運輸署發(fā)布消息稱,蘿卜快跑已獲批在香港東涌的指定路段和時段開展測試,進?步豐富其自動駕駛應用場景。這是自去年11月蘿卜快跑獲批香港首個自動駕駛車輛先導牌照后在港發(fā)展的最新進展。
短短半年內(nèi),蘿卜快跑的測試范圍從最初的機場周邊逐步延伸至北大嶼山核心區(qū)域,如今已深入東涌城市生活圈,測試范圍已延伸至交通情境更復雜的道路。
蘿卜快跑在香港已開始測試。
就在7月15日,蘿卜快跑與Uber達成了戰(zhàn)略合作伙伴關系,計劃未來將無人駕駛出行服務拓展至美國及中國內(nèi)地以外的全球多個市場。
這就意味著以后RoboTaxi會無縫融入人們的日常生活。服務上線后,乘客將可以用UberApp呼叫到由蘿卜快跑提供服務的無人駕駛車輛。數(shù)千輛蘿卜快跑會接入Uber的全球出行網(wǎng)絡。據(jù)介紹在今年年底前,雙方將率先在亞洲和中東地區(qū)部署蘿卜快跑第六代無人駕駛車,未來將逐步擴展至全球更多市場。
在技術(shù)逐漸成熟,政策支持的加持下,蘿卜快跑的商業(yè)模式已經(jīng)獲得了進一步驗證,預示著中國自動駕駛技術(shù)已經(jīng)具備快速復制和落地的能力。
也許再過不了多久,我們的出行方式就會因為RoboTaxi發(fā)生轉(zhuǎn)變。
AI老羅帶貨5500萬后,百度又放大招
除了蘿卜快跑,百度還在數(shù)字人上下足了功夫。
前不久的618大促,百度的羅永浩數(shù)字人在社交平臺刷屏。
直播間里,AI老羅和AI朱蕭木插科打諢、段子頻出,叭叭地講了6個多小時,共吸引超1300萬人次觀看,GMV更是突破5500萬元,一度創(chuàng)下數(shù)字?直播帶貨新紀錄。
沒想到,短短一個月,百度的數(shù)字人技術(shù)又升級了。
這次WAIC上,百度發(fā)布新一代數(shù)字人技術(shù)NOVA,預計在今年10月份上線,超頭主播能力復刻將進入規(guī)模化量產(chǎn)時代。這也意味著,普通用戶也能像大主播一樣專業(yè)帶貨了。
NOVA的技術(shù)亮點之一就是劇本模式的升級
過去,數(shù)字人主播只能照著腳本念臺詞,語氣生硬、表情刻板,但現(xiàn)在的NOVA依托文心4.5Turbo的大師級劇本模式,將普通腳本升級為劇本,可以根據(jù)商品信息、參考知識以及人設要求等,實時調(diào)整主播的語調(diào)、表情和動作。
前段時間刷到馮唐的視頻號,越看越不對勁,里面的動作來來回回就那幾個,點頭、擺手,還一卡一卡的。說實話,傳統(tǒng)數(shù)字人之所以一眼假,很大程度上是因為動作僵硬。
NOVA數(shù)字人在動作生成上也進行了改進,不再是簡單的動作復制,而是能夠貼合話術(shù)場景精準生成符合語義的復雜動作,甚至在業(yè)界首次實現(xiàn)雙人互動。直播中,倆數(shù)字人可以隨時插話、打斷而不穿幫。
此外,NOVA的語音克隆技術(shù)也達到了新的高度,能夠完美復刻主播的聲音和氣口,甚至連口頭禪都能準確捕捉。
就以羅永浩數(shù)字人為例,它在直播中時不時蹦出一句老羅經(jīng)典口頭禪「聽懂了沒?」「明白了吧?」,隨便拋出的金句也都是熟悉的老羅的味道。
在雙人講品中,倆數(shù)字人也可以默契配合,無縫接話,不會說了下句忘了上句。講到激動處它們可以手舞足蹈、語速加快;商品賣爆時能興奮到聲調(diào)拔高,已經(jīng)達到與真人主播難辨真假的程度。
據(jù)了解,這樣的高效復刻能力,僅需要10分鐘的真人樣本。也就說,你傳10分鐘自己的視頻,NOVA能還你一個超真實的數(shù)字人,實現(xiàn)聲音、動作與氛圍的精準匹配。
Nova數(shù)字人技術(shù)的另一大突破就是AI大腦的升級,讓數(shù)字人能夠向頂級主播水平進階——搭載的AI大腦可實時接收直播數(shù)據(jù)并自主決策,調(diào)度多智能體完成問答互動,并結(jié)合熱點輸出風格化內(nèi)容。
在問答環(huán)節(jié),AI大腦的高效性和精準度又讓數(shù)字人能夠快速回應觀眾提問。同時,基于用戶的歷史行為,AI大腦能夠主動發(fā)起問題,引導觀眾在直播中互動,并通過多輪追問和解答有效引導用戶的購買意向。
AI大腦還通過智能決策和多智能體協(xié)同,實現(xiàn)了更為靈活的互動方式。比如,基于直播間實時熱度及轉(zhuǎn)化情況,靈活調(diào)度助播專家、運營專家、場控專家等多個角色智能體,實現(xiàn)智能發(fā)福袋、開價、控庫存等玩法,提升帶貨轉(zhuǎn)化。
對于觀眾和直播者來說,數(shù)字人技術(shù)帶來了真正實用級的體驗。
百度全棧自研背后
要打造「數(shù)百萬個超級應用」
不論是加速出海的智駕,還是不斷制造爆款的數(shù)字人,百度的AI應用背后都是一套全棧自研的技術(shù)體系在提供支撐。值得一提的是,本次WAIC,百度的智算集群和飛槳深度學習平臺,與蘿卜快跑一起入選了「中國人工智能產(chǎn)業(yè)創(chuàng)新成果展」,這無疑也是對百度AI全棧能力的又一強力肯定。
從AI掀起第一個浪頭時,百度就意識到了AI的真正價值在于應用,而不僅僅是技術(shù)的炫技。
基于這一戰(zhàn)略思維,百度成功布局了一個龐大的AI應用矩陣。
除了蘿卜快跑和Nova數(shù)字人這兩大代表成果外,百度還在傳統(tǒng)搜索、網(wǎng)盤以及智能辦公等多個領域,實現(xiàn)AI應用的全面落地。
例如,今年3月份百度正式上線的秒噠平臺,以「?句話做應用+多智能體協(xié)作+多工具調(diào)用」的技術(shù)組合,顛覆了傳統(tǒng)開發(fā)流程。用戶可以通過自然語言描述需求,自動生成完整功能代碼,極大提升了開發(fā)效率。
而百度文庫和百度網(wǎng)盤的升級版,則通過多模態(tài)的AI能力提升了內(nèi)容管理、知識創(chuàng)作和共享的效率,推動了AI技術(shù)在傳統(tǒng)產(chǎn)品中的深度應用。
百度之所以能夠在AI應用層面持續(xù)推進,正是依托其強大的AI全棧自研架構(gòu)。作為國內(nèi)最早投身AI研發(fā)的企業(yè)之一,百度從算力、框架、模型到應用構(gòu)建起一個完整的AI生態(tài)系統(tǒng)
百度的AI全棧架構(gòu)首先在算力層面實現(xiàn)關鍵突破,核心支撐來自自研的昆侖芯P800和百舸AI異構(gòu)計算平臺。
今年,百度成功點亮國內(nèi)首個全自研三萬卡集群,支持多個千億參數(shù)大模型全量訓練,同時滿足千家客戶百億參數(shù)大模型的高效精調(diào)需求。這一成果不僅保障了國產(chǎn)算力供給,還顯著降低了訓練與推理成本。在算力管理方面,百舸平臺通過兼容多芯片、適配主流框架、異構(gòu)資源調(diào)度等方式,實現(xiàn)了高達99.5%的有效訓練時長,并優(yōu)化了推理效率與穩(wěn)定性。
在框架層,飛槳作為國內(nèi)首個自主研發(fā)的深度學習平臺,成為了國內(nèi)外多個行業(yè)的技術(shù)基礎。飛槳框架具備高度的靈活性,能夠支持大規(guī)模的AI模型訓練和推理任務,同時與百度的其他技術(shù)組件深度融合,提升了模型訓練的效率。飛槳不僅支持多種硬件平臺,還為開發(fā)者提供了簡潔易用的接口,極大降低了AI技術(shù)的應用門檻。
此外,飛槳還是中國市場上唯一可與全球兩大主流深度學習框架美國TensorFlow、PyTorch正面交鋒的深度學習框架,這意味著中國打造了自主可控的人工智能操作系統(tǒng)。
在模型層,百度構(gòu)建了以文心大模型為核心的多層次模型體系,持續(xù)推動生成式AI能力向產(chǎn)業(yè)落地。文心大模型具備跨模態(tài)、強推理、低成本等核心特性,廣泛應用于搜索、推薦、智能助手等互聯(lián)網(wǎng)產(chǎn)品中,同時賦能制造、金融、能源、城市治理等多個行業(yè)。
2025年4月,百度發(fā)布文心4.5Turbo和X1Turbo兩大旗艦模型,推理速度提升顯著,價格分別下降80%和50%,在多個權(quán)威評測中達到SOTA水平。近期發(fā)布的IDC報告顯示,文心大模型在8大維度調(diào)研中獨占7項滿分,綜合實力最強。
2025年6月,百度正式開源文心4.5系列模型,覆蓋47B、3B等參數(shù)規(guī)模,提供MoE與稠密結(jié)構(gòu)版本,成為國內(nèi)少有的完全開源的通用大模型。這一系列進展不僅體現(xiàn)百度在模型層的技術(shù)領先,也為推動AI大模型的普惠化和產(chǎn)業(yè)落地提供了堅實支撐。
與傳統(tǒng)的「技術(shù)炫技」不同,百度的AI全棧架構(gòu)始終聚焦于如何將技術(shù)應用于實際需求中,并且通過靈活的技術(shù)整合將AI應用推向更廣泛的市場。正如百度CEO李彥宏所言:「我們不只是要推出一個超級應用,而是要打造數(shù)百萬個超級有用的應用。」
越來越多的實踐證明,百度「AI超級有用」的道路是對的,且越走越寬了。隨著全棧架構(gòu)持續(xù)演進,百度的目標不止于打造明星產(chǎn)品,而是讓AI真正「飛入尋常百姓家」,成為驅(qū)動現(xiàn)實場景創(chuàng)新的底層動力。
文中視頻鏈接:
https://mp.weixin.qq.com/s/HL5zFg4QPz49BJSKW5Ps8A
編輯精選《大佬,小媳婦要被你寵壞啦!》,明目張膽的偏愛劇情,花式...
編輯精選最甜小說《大佬,小媳婦要被你寵壞啦!》,怒刷N+1遍都值得!
重磅作品《大佬,小媳婦要被你寵壞啦!》,陪你走過春夏秋冬