機(jī)器之心報(bào)道
楊文、澤南
AI超級(jí)實(shí)用的落地,只有這家玩明白了。
前幾天,奧特曼在采訪中透露,親自體驗(yàn)GPT-5后,被其強(qiáng)大的能力嚇到。有個(gè)自己都搞不懂的問(wèn)題,模型卻能一下答出來(lái),那一刻他甚至覺(jué)得自己在擅長(zhǎng)的領(lǐng)域也有些「無(wú)力」。
盡管AI進(jìn)展飛快,但總有人質(zhì)疑:真正落地的AI不多,很多所謂的新技術(shù),可能只是炒作。
目光轉(zhuǎn)向剛剛開(kāi)幕的世界人工智能大會(huì)WAIC,我們會(huì)發(fā)現(xiàn)AI實(shí)用化的落地應(yīng)用其實(shí)并不少。
智駕正被全網(wǎng)熱議,會(huì)場(chǎng)內(nèi)外,有很多無(wú)人駕駛車(chē)輛忙碌的身影,它們是大會(huì)的官方接駁車(chē)輛。
走進(jìn)展區(qū),數(shù)字人主播正在與人們互動(dòng),TA們語(yǔ)氣自然,知識(shí)淵博,反應(yīng)比你還快,可以說(shuō)已經(jīng)達(dá)到了頂級(jí)主播的水準(zhǔn)。
這一波展示,像是把我們一下拉進(jìn)了未來(lái)世界。更有意思的是,這些貼近我們生活且有用的AI技術(shù)都來(lái)自一家公司,而且是全棧自研的。
中國(guó)最火RoboTaxi出海,半年拿下兩城
在今年的世界人工智能大會(huì)(WAIC)上,百度蘿卜快跑入選「中國(guó)人工智能產(chǎn)業(yè)創(chuàng)新成果展」,成為本屆大會(huì)的「國(guó)家隊(duì)」代表之一。此外,大會(huì)還傳來(lái)好消息——百度等一批科技公司獲得了上海智能網(wǎng)聯(lián)汽車(chē)示范運(yùn)營(yíng)牌照,Robotaxi正式駛?cè)肫謻|核心區(qū)。
不知從何時(shí)開(kāi)始,國(guó)內(nèi)大街上穿梭的蘿卜快跑成為了稀松平常的事物。在社交網(wǎng)絡(luò)上一些有關(guān)新鮮事物的話題下,不時(shí)可以看到對(duì)于無(wú)人出租的好評(píng)。
出行服務(wù)是自動(dòng)駕駛商業(yè)化落地的關(guān)鍵場(chǎng)景,就在今年,全球無(wú)人駕駛行業(yè)展現(xiàn)出了前所未有的發(fā)展速度,Waymo、特斯拉、蘿卜快跑等玩家的進(jìn)展不斷。轟轟烈烈的RoboTaxi大潮中,蘿卜快跑做到了覆蓋范圍廣,用戶口碑好。
截至目前,蘿卜快跑已為全球用戶提供了超過(guò)1100萬(wàn)次出行服務(wù),僅在國(guó)內(nèi),他們的無(wú)人駕駛車(chē)隊(duì)就已駛?cè)氡本?、深圳、武漢、重慶等十多個(gè)城市,如果拉出一條最近業(yè)務(wù)擴(kuò)展的時(shí)間線,你會(huì)發(fā)現(xiàn)它的發(fā)展速度很快。
今年3月,蘿卜快跑首次出海,宣布與迪拜道路交通局(RTA)簽署戰(zhàn)略合作協(xié)議,在迪拜市區(qū)開(kāi)展無(wú)人駕駛規(guī)模化測(cè)試和服務(wù)。雙方計(jì)劃在迪拜部署超過(guò)1000輛無(wú)人駕駛汽車(chē)。蘿卜快跑還宣布與阿聯(lián)酋自動(dòng)駕駛出行公司Autogo達(dá)成戰(zhàn)略合作,打造阿布扎比地區(qū)規(guī)模最大的無(wú)人車(chē)隊(duì)。
6月,香港特別行政區(qū)運(yùn)輸署發(fā)布消息稱,蘿卜快跑已獲批在香港東涌的指定路段和時(shí)段開(kāi)展測(cè)試,進(jìn)?步豐富其自動(dòng)駕駛應(yīng)用場(chǎng)景。這是自去年11月蘿卜快跑獲批香港首個(gè)自動(dòng)駕駛車(chē)輛先導(dǎo)牌照后在港發(fā)展的最新進(jìn)展。
短短半年內(nèi),蘿卜快跑的測(cè)試范圍從最初的機(jī)場(chǎng)周邊逐步延伸至北大嶼山核心區(qū)域,如今已深入東涌城市生活圈,測(cè)試范圍已延伸至交通情境更復(fù)雜的道路。
蘿卜快跑在香港已開(kāi)始測(cè)試。
就在7月15日,蘿卜快跑與Uber達(dá)成了戰(zhàn)略合作伙伴關(guān)系,計(jì)劃未來(lái)將無(wú)人駕駛出行服務(wù)拓展至美國(guó)及中國(guó)內(nèi)地以外的全球多個(gè)市場(chǎng)。
這就意味著以后RoboTaxi會(huì)無(wú)縫融入人們的日常生活。服務(wù)上線后,乘客將可以用UberApp呼叫到由蘿卜快跑提供服務(wù)的無(wú)人駕駛車(chē)輛。數(shù)千輛蘿卜快跑會(huì)接入U(xiǎn)ber的全球出行網(wǎng)絡(luò)。據(jù)介紹在今年年底前,雙方將率先在亞洲和中東地區(qū)部署蘿卜快跑第六代無(wú)人駕駛車(chē),未來(lái)將逐步擴(kuò)展至全球更多市場(chǎng)。
在技術(shù)逐漸成熟,政策支持的加持下,蘿卜快跑的商業(yè)模式已經(jīng)獲得了進(jìn)一步驗(yàn)證,預(yù)示著中國(guó)自動(dòng)駕駛技術(shù)已經(jīng)具備快速?gòu)?fù)制和落地的能力。
也許再過(guò)不了多久,我們的出行方式就會(huì)因?yàn)镽oboTaxi發(fā)生轉(zhuǎn)變。
AI老羅帶貨5500萬(wàn)后,百度又放大招
除了蘿卜快跑,百度還在數(shù)字人上下足了功夫。
前不久的618大促,百度的羅永浩數(shù)字人在社交平臺(tái)刷屏。
直播間里,AI老羅和AI朱蕭木插科打諢、段子頻出,叭叭地講了6個(gè)多小時(shí),共吸引超1300萬(wàn)人次觀看,GMV更是突破5500萬(wàn)元,一度創(chuàng)下數(shù)字?直播帶貨新紀(jì)錄。
沒(méi)想到,短短一個(gè)月,百度的數(shù)字人技術(shù)又升級(jí)了。
這次WAIC上,百度發(fā)布新一代數(shù)字人技術(shù)NOVA,預(yù)計(jì)在今年10月份上線,超頭主播能力復(fù)刻將進(jìn)入規(guī)?;慨a(chǎn)時(shí)代。這也意味著,普通用戶也能像大主播一樣專(zhuān)業(yè)帶貨了。
NOVA的技術(shù)亮點(diǎn)之一就是劇本模式的升級(jí)
過(guò)去,數(shù)字人主播只能照著腳本念臺(tái)詞,語(yǔ)氣生硬、表情刻板,但現(xiàn)在的NOVA依托文心4.5Turbo的大師級(jí)劇本模式,將普通腳本升級(jí)為劇本,可以根據(jù)商品信息、參考知識(shí)以及人設(shè)要求等,實(shí)時(shí)調(diào)整主播的語(yǔ)調(diào)、表情和動(dòng)作。
前段時(shí)間刷到馮唐的視頻號(hào),越看越不對(duì)勁,里面的動(dòng)作來(lái)來(lái)回回就那幾個(gè),點(diǎn)頭、擺手,還一卡一卡的。說(shuō)實(shí)話,傳統(tǒng)數(shù)字人之所以一眼假,很大程度上是因?yàn)閯?dòng)作僵硬。
NOVA數(shù)字人在動(dòng)作生成上也進(jìn)行了改進(jìn),不再是簡(jiǎn)單的動(dòng)作復(fù)制,而是能夠貼合話術(shù)場(chǎng)景精準(zhǔn)生成符合語(yǔ)義的復(fù)雜動(dòng)作,甚至在業(yè)界首次實(shí)現(xiàn)雙人互動(dòng)。直播中,倆數(shù)字人可以隨時(shí)插話、打斷而不穿幫。
此外,NOVA的語(yǔ)音克隆技術(shù)也達(dá)到了新的高度,能夠完美復(fù)刻主播的聲音和氣口,甚至連口頭禪都能準(zhǔn)確捕捉。
就以羅永浩數(shù)字人為例,它在直播中時(shí)不時(shí)蹦出一句老羅經(jīng)典口頭禪「聽(tīng)懂了沒(méi)?」「明白了吧?」,隨便拋出的金句也都是熟悉的老羅的味道。
在雙人講品中,倆數(shù)字人也可以默契配合,無(wú)縫接話,不會(huì)說(shuō)了下句忘了上句。講到激動(dòng)處它們可以手舞足蹈、語(yǔ)速加快;商品賣(mài)爆時(shí)能興奮到聲調(diào)拔高,已經(jīng)達(dá)到與真人主播難辨真假的程度。
據(jù)了解,這樣的高效復(fù)刻能力,僅需要10分鐘的真人樣本。也就說(shuō),你傳10分鐘自己的視頻,NOVA能還你一個(gè)超真實(shí)的數(shù)字人,實(shí)現(xiàn)聲音、動(dòng)作與氛圍的精準(zhǔn)匹配。
Nova數(shù)字人技術(shù)的另一大突破就是AI大腦的升級(jí),讓數(shù)字人能夠向頂級(jí)主播水平進(jìn)階——搭載的AI大腦可實(shí)時(shí)接收直播數(shù)據(jù)并自主決策,調(diào)度多智能體完成問(wèn)答互動(dòng),并結(jié)合熱點(diǎn)輸出風(fēng)格化內(nèi)容。
在問(wèn)答環(huán)節(jié),AI大腦的高效性和精準(zhǔn)度又讓數(shù)字人能夠快速回應(yīng)觀眾提問(wèn)。同時(shí),基于用戶的歷史行為,AI大腦能夠主動(dòng)發(fā)起問(wèn)題,引導(dǎo)觀眾在直播中互動(dòng),并通過(guò)多輪追問(wèn)和解答有效引導(dǎo)用戶的購(gòu)買(mǎi)意向。
AI大腦還通過(guò)智能決策和多智能體協(xié)同,實(shí)現(xiàn)了更為靈活的互動(dòng)方式。比如,基于直播間實(shí)時(shí)熱度及轉(zhuǎn)化情況,靈活調(diào)度助播專(zhuān)家、運(yùn)營(yíng)專(zhuān)家、場(chǎng)控專(zhuān)家等多個(gè)角色智能體,實(shí)現(xiàn)智能發(fā)福袋、開(kāi)價(jià)、控庫(kù)存等玩法,提升帶貨轉(zhuǎn)化。
對(duì)于觀眾和直播者來(lái)說(shuō),數(shù)字人技術(shù)帶來(lái)了真正實(shí)用級(jí)的體驗(yàn)。
百度全棧自研背后
要打造「數(shù)百萬(wàn)個(gè)超級(jí)應(yīng)用」
不論是加速出海的智駕,還是不斷制造爆款的數(shù)字人,百度的AI應(yīng)用背后都是一套全棧自研的技術(shù)體系在提供支撐。值得一提的是,本次WAIC,百度的智算集群和飛槳深度學(xué)習(xí)平臺(tái),與蘿卜快跑一起入選了「中國(guó)人工智能產(chǎn)業(yè)創(chuàng)新成果展」,這無(wú)疑也是對(duì)百度AI全棧能力的又一強(qiáng)力肯定。
從AI掀起第一個(gè)浪頭時(shí),百度就意識(shí)到了AI的真正價(jià)值在于應(yīng)用,而不僅僅是技術(shù)的炫技。
基于這一戰(zhàn)略思維,百度成功布局了一個(gè)龐大的AI應(yīng)用矩陣。
除了蘿卜快跑和Nova數(shù)字人這兩大代表成果外,百度還在傳統(tǒng)搜索、網(wǎng)盤(pán)以及智能辦公等多個(gè)領(lǐng)域,實(shí)現(xiàn)AI應(yīng)用的全面落地。
例如,今年3月份百度正式上線的秒噠平臺(tái),以「?句話做應(yīng)用+多智能體協(xié)作+多工具調(diào)用」的技術(shù)組合,顛覆了傳統(tǒng)開(kāi)發(fā)流程。用戶可以通過(guò)自然語(yǔ)言描述需求,自動(dòng)生成完整功能代碼,極大提升了開(kāi)發(fā)效率。
而百度文庫(kù)和百度網(wǎng)盤(pán)的升級(jí)版,則通過(guò)多模態(tài)的AI能力提升了內(nèi)容管理、知識(shí)創(chuàng)作和共享的效率,推動(dòng)了AI技術(shù)在傳統(tǒng)產(chǎn)品中的深度應(yīng)用。
百度之所以能夠在AI應(yīng)用層面持續(xù)推進(jìn),正是依托其強(qiáng)大的AI全棧自研架構(gòu)。作為國(guó)內(nèi)最早投身AI研發(fā)的企業(yè)之一,百度從算力、框架、模型到應(yīng)用構(gòu)建起一個(gè)完整的AI生態(tài)系統(tǒng)
百度的AI全棧架構(gòu)首先在算力層面實(shí)現(xiàn)關(guān)鍵突破,核心支撐來(lái)自自研的昆侖芯P800和百舸AI異構(gòu)計(jì)算平臺(tái)。
今年,百度成功點(diǎn)亮國(guó)內(nèi)首個(gè)全自研三萬(wàn)卡集群,支持多個(gè)千億參數(shù)大模型全量訓(xùn)練,同時(shí)滿足千家客戶百億參數(shù)大模型的高效精調(diào)需求。這一成果不僅保障了國(guó)產(chǎn)算力供給,還顯著降低了訓(xùn)練與推理成本。在算力管理方面,百舸平臺(tái)通過(guò)兼容多芯片、適配主流框架、異構(gòu)資源調(diào)度等方式,實(shí)現(xiàn)了高達(dá)99.5%的有效訓(xùn)練時(shí)長(zhǎng),并優(yōu)化了推理效率與穩(wěn)定性。
在框架層,飛槳作為國(guó)內(nèi)首個(gè)自主研發(fā)的深度學(xué)習(xí)平臺(tái),成為了國(guó)內(nèi)外多個(gè)行業(yè)的技術(shù)基礎(chǔ)。飛槳框架具備高度的靈活性,能夠支持大規(guī)模的AI模型訓(xùn)練和推理任務(wù),同時(shí)與百度的其他技術(shù)組件深度融合,提升了模型訓(xùn)練的效率。飛槳不僅支持多種硬件平臺(tái),還為開(kāi)發(fā)者提供了簡(jiǎn)潔易用的接口,極大降低了AI技術(shù)的應(yīng)用門(mén)檻。
此外,飛槳還是中國(guó)市場(chǎng)上唯一可與全球兩大主流深度學(xué)習(xí)框架美國(guó)TensorFlow、PyTorch正面交鋒的深度學(xué)習(xí)框架,這意味著中國(guó)打造了自主可控的人工智能操作系統(tǒng)。
在模型層,百度構(gòu)建了以文心大模型為核心的多層次模型體系,持續(xù)推動(dòng)生成式AI能力向產(chǎn)業(yè)落地。文心大模型具備跨模態(tài)、強(qiáng)推理、低成本等核心特性,廣泛應(yīng)用于搜索、推薦、智能助手等互聯(lián)網(wǎng)產(chǎn)品中,同時(shí)賦能制造、金融、能源、城市治理等多個(gè)行業(yè)。
2025年4月,百度發(fā)布文心4.5Turbo和X1Turbo兩大旗艦?zāi)P停评硭俣忍嵘@著,價(jià)格分別下降80%和50%,在多個(gè)權(quán)威評(píng)測(cè)中達(dá)到SOTA水平。近期發(fā)布的IDC報(bào)告顯示,文心大模型在8大維度調(diào)研中獨(dú)占7項(xiàng)滿分,綜合實(shí)力最強(qiáng)。
2025年6月,百度正式開(kāi)源文心4.5系列模型,覆蓋47B、3B等參數(shù)規(guī)模,提供MoE與稠密結(jié)構(gòu)版本,成為國(guó)內(nèi)少有的完全開(kāi)源的通用大模型。這一系列進(jìn)展不僅體現(xiàn)百度在模型層的技術(shù)領(lǐng)先,也為推動(dòng)AI大模型的普惠化和產(chǎn)業(yè)落地提供了堅(jiān)實(shí)支撐。
與傳統(tǒng)的「技術(shù)炫技」不同,百度的AI全棧架構(gòu)始終聚焦于如何將技術(shù)應(yīng)用于實(shí)際需求中,并且通過(guò)靈活的技術(shù)整合將AI應(yīng)用推向更廣泛的市場(chǎng)。正如百度CEO李彥宏所言:「我們不只是要推出一個(gè)超級(jí)應(yīng)用,而是要打造數(shù)百萬(wàn)個(gè)超級(jí)有用的應(yīng)用?!?/p>
越來(lái)越多的實(shí)踐證明,百度「AI超級(jí)有用」的道路是對(duì)的,且越走越寬了。隨著全棧架構(gòu)持續(xù)演進(jìn),百度的目標(biāo)不止于打造明星產(chǎn)品,而是讓AI真正「飛入尋常百姓家」,成為驅(qū)動(dòng)現(xiàn)實(shí)場(chǎng)景創(chuàng)新的底層動(dòng)力。
文中視頻鏈接:
https://mp.weixin.qq.com/s/HL5zFg4QPz49BJSKW5Ps8A
強(qiáng)烈推薦的《百煉成神》,最讓人難忘的篇章,狂刷百遍看不膩!
羅承運(yùn)從椅子上站起來(lái)走了兩步,說(shuō)道:“沛然堂哥此前說(shuō)留羅征一條性命,就是讓他活著,讓他看著。不過(guò)他羅征也不是什么要緊人物,如今沛然堂哥馬上就要啟程去青云宗,我就幫沛然堂哥處理掉他吧!”黃格一聽(tīng),那張不成形狀的嘴巴咧開(kāi)說(shuō)道:“多謝承運(yùn)少爺!”“不過(guò)這事情,還要等等,”羅承運(yùn)摸了摸腦袋,說(shuō)道:“我剛剛吞服了家族的 1.百煉成神作者:恩賜解脫偶然在錦書(shū)小說(shuō)的排行榜中看到了《百煉成神》,總體來(lái)講應(yīng)該是一本比較有意思的無(wú)腦爽文,標(biāo)準(zhǔn)的東方玄幻小說(shuō)風(fēng)格,作者對(duì)文章的框架設(shè)定非常有趣,恢弘的世界觀也吸引到了我2.斗破蒼穹作者:天蠶土豆相信喜歡看玄幻小說(shuō)的書(shū)迷對(duì)《斗破蒼穹》都不陌生,這本書(shū)絕對(duì)能稱得上巔峰神作,..百煉成神十大最強(qiáng)人物