功夫CG·日向花火[武當(dāng)宗師]全技能爆料,拂塵掃落葉,太極生兩儀!
徐州“寶馬MINI致1死7傷案”一審:肇事司機(jī)獲刑兩年八個(gè)月
伊朗正制定關(guān)鍵系統(tǒng)、設(shè)備定位服務(wù)遷移計(jì)劃,逐步將定位系統(tǒng)從 GPS 遷移至中國(guó)北斗導(dǎo)航系統(tǒng),你有何感想?
2015年,PingCAP(平凱星辰)創(chuàng)業(yè)第一天記錄下第一行代碼時(shí),“開(kāi)源”就成為這家分布式數(shù)據(jù)庫(kù)廠商最大的標(biāo)簽。此后十年時(shí)間里,PingCAP服務(wù)了超過(guò)45個(gè)國(guó)家的4000家企業(yè),創(chuàng)立的分布式數(shù)據(jù)庫(kù)產(chǎn)品TiDB,更是在GitHub上總計(jì)獲得超過(guò)37000顆星,是數(shù)據(jù)庫(kù)領(lǐng)域有著極大影響力的開(kāi)源項(xiàng)目。
正因?yàn)樾欧铋_(kāi)源,PingCAP企業(yè)文化中的決策民主、開(kāi)放自由吸引了很多人加入,其中就包括PingCAP副總裁劉松。
作為軟件行業(yè)20多年的從業(yè)者,劉松先后在Oracle、阿里云任職,他給自己的標(biāo)簽是“互聯(lián)網(wǎng)原教旨主義者”和“AI降臨派”。很多人把AI看作今天一個(gè)新的技術(shù)范式,劉松卻覺(jué)得AI技術(shù)是互聯(lián)網(wǎng)技術(shù)的延伸,正是得益于互聯(lián)網(wǎng)過(guò)去沉淀的數(shù)據(jù)和云基礎(chǔ)設(shè)施,AI才變得如此強(qiáng)大。
所以面對(duì)這波AI技術(shù)浪潮,劉松想到了不同的隱喻。他認(rèn)為AI帶著“弒父”的技術(shù)屬性的同時(shí),也因?yàn)槿狈?chǎng)景、用戶(hù)、流量等,不可避免背著“丫鬟命”。
而對(duì)數(shù)據(jù)庫(kù)行業(yè)而言,劉松判斷AI會(huì)成為“云+全球化+開(kāi)源”以外的第四足,將來(lái)不僅會(huì)重新改寫(xiě)數(shù)據(jù)庫(kù)廠商的估值,也會(huì)重塑整個(gè)行業(yè)的競(jìng)爭(zhēng)格局。
信通院發(fā)布的《數(shù)據(jù)庫(kù)發(fā)展研究報(bào)告(2025年)》顯示,過(guò)去一年,中國(guó)的數(shù)據(jù)庫(kù)廠商減少了64家,競(jìng)爭(zhēng)在加劇,面對(duì)Oracle等傳統(tǒng)巨頭,PingCAP拒絕做簡(jiǎn)單的平替,而是希望靠產(chǎn)品力和生態(tài)勝出。而經(jīng)過(guò)十年打磨,PingCAP的產(chǎn)品無(wú)論在國(guó)內(nèi)還是全球,都得到了驗(yàn)證。不僅在國(guó)內(nèi)市場(chǎng)中殺出一條血路,也在海外市場(chǎng)的商業(yè)化方面獲得巨大突破。
近日,劉松接受了「創(chuàng)·問(wèn)」編輯部的訪談,談到了他對(duì)數(shù)據(jù)庫(kù)與AI融合的趨勢(shì)判斷,也分享了PingCAP如何深耕國(guó)內(nèi)市場(chǎng)的同時(shí),還走出了一條高度本地化的出海之路。
如果說(shuō)上一代互聯(lián)網(wǎng)公司改變了中國(guó)人的生活和運(yùn)用技術(shù)的方式,那劉松希望PingCAP能塑造一種新的公司范式——成為世界上最好且最受尊敬的基礎(chǔ)軟件公司。
全文分享如下:
Q:華創(chuàng)資本
A:PingCAP副總裁劉松
01AI技術(shù)的屬性是弒父
華創(chuàng)資本:你在今年1月就預(yù)測(cè)DeepSeek會(huì)帶來(lái)重大轉(zhuǎn)折,后來(lái)的確應(yīng)驗(yàn)了,從你的視角觀察,這一波AI技術(shù)的浪潮意味著什么?
劉松:關(guān)于這一代AI,我有兩個(gè)隱喻。
第一個(gè)是“弒父”,新的技術(shù)只要一出來(lái),原有的技術(shù),不管是“爺爺”還是“父親”全部都沒(méi)有意義了,就像GPT對(duì)于NLP的顛覆一樣,之后下一代出來(lái)的東西很有可能也會(huì)把當(dāng)前GPT的模式完全殺掉,所以這種“弒父”屬性,讓AI具備了特別強(qiáng)的顛覆能力。
第二個(gè)是“丫鬟命”,AI技術(shù)就算再?gòu)?qiáng)大,目前也只是工具型的技術(shù),它自己本身并不構(gòu)成一個(gè)用戶(hù)層級(jí)的賽道,還需要找到一個(gè)有場(chǎng)景、有用戶(hù)、有流量的“豪門(mén)”,這也是為什么扎克伯格要花1億美金去OpenAI挖人的原因。所以我認(rèn)為五年之內(nèi),AI+流量還是AI應(yīng)用的主航道。尤其對(duì)于AI領(lǐng)域的創(chuàng)業(yè)者,如果想不清楚AI技術(shù)模式和流量怎么疊加,那后續(xù)的商業(yè)模式也會(huì)很難。
華創(chuàng)資本:那你怎么看待AI這兩年給軟件行業(yè)帶來(lái)的沖擊?
劉松:在大模型出現(xiàn)之前,數(shù)字化互聯(lián)網(wǎng)解決的其實(shí)是信息不對(duì)稱(chēng)、協(xié)同效率等問(wèn)題,而結(jié)合了高質(zhì)量數(shù)據(jù)的大模型,帶來(lái)的是一場(chǎng)認(rèn)知革命。
過(guò)去我們熟悉的移動(dòng)互聯(lián)網(wǎng),本質(zhì)上還是數(shù)據(jù)+算法驅(qū)動(dòng),無(wú)論刷淘寶還是刷抖音,都是依靠推薦算法、依賴(lài)數(shù)據(jù)庫(kù)技術(shù)而不是腦力。但推理大模型本身就具備了認(rèn)知能力,它在很多方面都比人做得更好。相比之下,人的優(yōu)勢(shì)可能只剩下一些隱含式的經(jīng)驗(yàn)了。
所以AI帶來(lái)最大的變革,是從上一代的云計(jì)算時(shí)代的數(shù)據(jù)驅(qū)動(dòng),走向了認(rèn)知革命。
華創(chuàng)資本:隨著AI和大模型融合發(fā)展,“數(shù)據(jù)庫(kù)”的角色是否也正在發(fā)生變化?
劉松:我認(rèn)為會(huì)發(fā)生根本性的變化。我們CTO黃東旭說(shuō)過(guò)一個(gè)基本邏輯:“未來(lái)的數(shù)據(jù)庫(kù)一定是面向Agent的,因?yàn)橹暗臄?shù)據(jù)庫(kù)是面向數(shù)據(jù)工程師和DBA的?!?/p>
每個(gè)Agent就是一個(gè)智能代理,它的上層是UI,下面是知識(shí)檢索,中間有流程引擎、知識(shí)圖譜,基礎(chǔ)是數(shù)據(jù)。有了這樣的Agent,很多助理、運(yùn)營(yíng)、營(yíng)銷(xiāo)、客服等崗位做的事情,就很容易被自動(dòng)化。我們做了兩件事來(lái)提升RAG效果:第一,構(gòu)建動(dòng)態(tài)知識(shí)圖譜;第二,通過(guò)定向訓(xùn)練模型的思維鏈,來(lái)動(dòng)態(tài)規(guī)劃RAGFlow(開(kāi)源項(xiàng)目StackVM),我們認(rèn)為未來(lái)的Agent會(huì)是:定向訓(xùn)練的推理模型+上下文工程+工具調(diào)用+記憶。
當(dāng)業(yè)務(wù)Agent去訪問(wèn)數(shù)據(jù)時(shí),數(shù)據(jù)庫(kù)越來(lái)越成為一個(gè)大的記憶體,那它如何跟業(yè)務(wù)Agent有效交互呢?CEO們都希望把自然語(yǔ)言變成SQL,然后自動(dòng)獲得一個(gè)答案。但這會(huì)面臨一個(gè)難題:CEO們問(wèn)的問(wèn)題空間是無(wú)窮的,但它轉(zhuǎn)化成SQL能理解的范圍以及數(shù)據(jù)里面已有的準(zhǔn)備是有限的,而且今天這個(gè)問(wèn)答的準(zhǔn)確率最多也就到85%,甚至不到90%。
所以Agent在從ToC到ToB的逐步演進(jìn)里,如果能從dothingright到dorightthing,就說(shuō)明它變得越來(lái)越成熟、越來(lái)越靠譜了,也就像人類(lèi)一樣,形成了感知、理解、規(guī)劃、決策、執(zhí)行的閉環(huán)。
華創(chuàng)資本:PingCAP服務(wù)的客戶(hù)來(lái)自各行各業(yè),從他們的需求來(lái)看,AI在企業(yè)中落地的最大推動(dòng)力和變化是什么?
劉松:我見(jiàn)了很多互聯(lián)網(wǎng)、金融等行業(yè)的客戶(hù),不管是證券、保險(xiǎn)還是醫(yī)療,在以前,AI項(xiàng)目基本是IT人的活兒,其他人是不太在意的。
但從今年2月份開(kāi)始,我看到最大的變化是所有業(yè)務(wù)人員都認(rèn)為我要做好自己的AI,他們突然都變得非常積極,追著IT人員說(shuō)我要上AI項(xiàng)目。他們已經(jīng)看到能用AI解決生活中的很多問(wèn)題,為什么工作上不能呢?所以就希望IT部門(mén)幫他們訓(xùn)一個(gè)Agent,提升精確度。好的業(yè)務(wù)Agent需要業(yè)務(wù)人員輸入自己的專(zhuān)業(yè)知識(shí),培養(yǎng)出一個(gè)“老專(zhuān)家”,這樣就能減少自己日常的工作量,這是AI解決的知識(shí)自動(dòng)化的問(wèn)題。
就像當(dāng)年APP盛行的時(shí)候一樣,之所以2012年成為一個(gè)拐點(diǎn),就是所有人都開(kāi)始用智能手機(jī)來(lái)解決生活問(wèn)題,然后解決工作問(wèn)題?,F(xiàn)在Agent就是那一代的升級(jí)版,只是有了推理能力后,變成了一個(gè)更加自動(dòng)化的腦力工具。它的形態(tài)就是在APP上疊加了一層更快速地自動(dòng)分析和執(zhí)行的邏輯。
未來(lái)最理想的情況就是大家都能把自己的數(shù)字分身——行業(yè)Agent模型訓(xùn)出來(lái),然后把常規(guī)的工作都交給AI,人只負(fù)責(zé)規(guī)劃和創(chuàng)意,我覺(jué)得這可能是值得期待的未來(lái)。因?yàn)閷?duì)于中國(guó)的職場(chǎng)人,最現(xiàn)實(shí)的事情不就兩個(gè):不被AI替代以及不用加班,后者是未來(lái)五年最值得努力的目標(biāo)。
作為一個(gè)“降臨派”,我覺(jué)得AI首要的意義是解放人,而對(duì)中國(guó)社會(huì)的正面目標(biāo)在于:第一,不加班也不裁員;第二,增加工作的意義和樂(lè)趣;第三,老有所養(yǎng);第四,給弱者公平且非歧視性的幸福權(quán)利。
華創(chuàng)資本:AI時(shí)代到來(lái)后,你剛剛提到的那些客戶(hù),對(duì)數(shù)據(jù)庫(kù)是不是也提出了一些新的要求?
劉松:最近我剛在上海見(jiàn)了一個(gè)客戶(hù)就很有前瞻性,首先他們說(shuō)根本不關(guān)心應(yīng)用,因?yàn)榉址昼娍梢宰龀鰜?lái),真正的護(hù)城河其實(shí)是數(shù)據(jù)。其次,做出來(lái)的Agent雖然效果也不錯(cuò),但他們更關(guān)心如何把精度從75%提升到95%。而背后的技術(shù)關(guān)鍵點(diǎn)其實(shí)就在數(shù)據(jù)庫(kù)和RAG里面。
因?yàn)楝F(xiàn)在一個(gè)基本的Agent組合,在大多數(shù)企業(yè)里面,上面有一個(gè)開(kāi)發(fā)框架,像Dify;中間有一層RAG,比如我們現(xiàn)在做的是有一層開(kāi)源的框架,叫AutoFlow,這是一套GraphRAG框架,開(kāi)發(fā)者可以直接使用AutoFlow提供的封裝好的組件,組合使用,提高開(kāi)發(fā)效率;再下面一層,是一個(gè)All-in-One的Database,支持向量/全文/圖數(shù)據(jù)等多模態(tài)存儲(chǔ)。
今天,全球TOP10的數(shù)據(jù)庫(kù)公司里已經(jīng)有6家是All-in-One架構(gòu),這意味著SQLDatabase已經(jīng)整合了向量檢索、全文檢索和圖數(shù)據(jù)處理功能,這種四庫(kù)合一All-in-One的Database在底層,通過(guò)統(tǒng)一的存儲(chǔ)引擎實(shí)現(xiàn)多模態(tài)數(shù)據(jù)管理。
未來(lái)可能的演進(jìn)是下一代的DataAgent,這一層一定是靠AI技術(shù)和數(shù)據(jù)技術(shù)結(jié)合的。而這一層做好了,就成為回答業(yè)務(wù)Agent的一個(gè)代理人。比如業(yè)務(wù)Agent問(wèn)一個(gè)問(wèn)題:未來(lái)五天北京到大理,國(guó)航的機(jī)票,時(shí)間最好的,哪一天最便宜?那這個(gè)DataAgent將自動(dòng)完成:跨數(shù)據(jù)庫(kù)檢索、多維度條件過(guò)濾、結(jié)果智能比對(duì)。業(yè)務(wù)Agent無(wú)需關(guān)心底層是SQL、向量數(shù)據(jù)庫(kù)還是圖數(shù)據(jù)庫(kù),這些都被中間這層屏蔽了。所以,可能數(shù)據(jù)庫(kù)的邊界也會(huì)發(fā)生變化,數(shù)據(jù)庫(kù)包括大數(shù)據(jù)技術(shù),在原有的范式里,它留在了存儲(chǔ)和CRUD,就是我都存儲(chǔ)好了,你用SQL來(lái)問(wèn),這種模式可能不夠了。因?yàn)闃I(yè)務(wù)Agent要用自然語(yǔ)言來(lái)問(wèn)問(wèn)題,所以中間這層——DataAgent這層會(huì)越來(lái)越厚,現(xiàn)在的雛形就是RAG和GraphRAG。
GraphRAG解決什么問(wèn)題呢?舉個(gè)例子,我們有一個(gè)TiDB知識(shí)問(wèn)答機(jī)器人,叫TiDB.AI(https://tidb.ai/),可以用來(lái)問(wèn)有關(guān)TiDB的任何問(wèn)題。我們把過(guò)去10年1萬(wàn)份技術(shù)文檔都丟進(jìn)去訓(xùn),當(dāng)我們南美的客戶(hù)碰到問(wèn)題,他只需要問(wèn)TiDB.AI就能解決,不需要專(zhuān)門(mén)的運(yùn)維工程師去解答。
這里面的學(xué)問(wèn)在于,這一萬(wàn)份文檔在不斷更新,丟進(jìn)去以后,文檔里面的知識(shí)點(diǎn)是怎么動(dòng)態(tài)地被重新連接起來(lái)的?比如在數(shù)據(jù)庫(kù)運(yùn)維場(chǎng)景里面,要把TiDB從7.5升級(jí)到8.1,我能不能用Agent的問(wèn)答來(lái)執(zhí)行?它是不是把所有嚴(yán)肅性的邊界條件都check到了?我能不能相信它給我的建議和診斷?在這樣一個(gè)問(wèn)題里面,要的是絕對(duì)知識(shí)的精度,所以?xún)H僅用向量數(shù)據(jù)庫(kù)就不夠了,因?yàn)橄蛄繑?shù)據(jù)庫(kù)是以圖搜圖、找近似回答的邏輯。要考慮每個(gè)知識(shí)點(diǎn)的連接、嚴(yán)謹(jǐn)性和動(dòng)態(tài)性,所以我們通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練一個(gè)小模型,在知識(shí)圖譜上進(jìn)行有效的檢索來(lái)提升精度。
這是個(gè)工程問(wèn)題,概括來(lái)說(shuō)就是GraphRAG可能比樸素的RAG稍微走遠(yuǎn)了一層,它將分散的知識(shí)點(diǎn)關(guān)聯(lián)在一起形成知識(shí)圖譜。而我們更進(jìn)一步,通過(guò)訓(xùn)練模型來(lái)不斷優(yōu)化知識(shí)圖譜的結(jié)構(gòu),以及在檢索時(shí)通過(guò)模型推理更精準(zhǔn)地查找答案。
華創(chuàng)資本:假設(shè)Agent以后非常智能,它能繞過(guò)一般SQL或向量搜索,直接從數(shù)據(jù)庫(kù)中拿到想要的查詢(xún)結(jié)果嗎?
劉松:從長(zhǎng)遠(yuǎn)看來(lái),有可能會(huì)實(shí)現(xiàn),但這里有一個(gè)“悖論”。想要那樣聰明的“老師傅”Agent出現(xiàn),首先還是要把老師傅的經(jīng)驗(yàn)和知識(shí)教給它才行。換句話說(shuō),要實(shí)現(xiàn)你說(shuō)的“直取數(shù)據(jù)”,恰恰需要數(shù)據(jù)庫(kù)架構(gòu)師、工程師把DataAgent給做出來(lái)。
表面上,用戶(hù)用自然語(yǔ)言一問(wèn),數(shù)據(jù)就自動(dòng)出來(lái)了,好像跳過(guò)了數(shù)據(jù)庫(kù)。但其實(shí),背后的存取過(guò)程一個(gè)步驟都沒(méi)少,只是被自動(dòng)化以及對(duì)用戶(hù)隱藏了。這背后涉及海量的專(zhuān)業(yè)“竅門(mén)”:數(shù)據(jù)是怎么分布的?不同類(lèi)型的數(shù)據(jù)怎么關(guān)聯(lián)?如何把一個(gè)看似簡(jiǎn)單的查詢(xún),用最高效的方式執(zhí)行出來(lái)?這樣大量的Know-How,不在大模型的腦子里,還是在數(shù)據(jù)庫(kù)這一群人的腦子里。
所以,用自然語(yǔ)言直取數(shù)據(jù)方式的最終實(shí)現(xiàn),解鈴還須系鈴人。以用戶(hù)角度思考,Agent什么時(shí)候能變得我想要的那么聰明?還得那個(gè)行業(yè)領(lǐng)域的人把聰明和認(rèn)知裝在里面,把推理能力、數(shù)據(jù)能力包括知識(shí)的動(dòng)態(tài)更新的機(jī)制,全部做成一個(gè)真正的知識(shí)型的Agent才可以。
表面上看,DataAgent把撈數(shù)或者是一個(gè)任意自然語(yǔ)言問(wèn)答自動(dòng)化了,但這個(gè)過(guò)程本身很復(fù)雜。隨著它自己越來(lái)越智能和自動(dòng)化,AI的能力需要更深入地與數(shù)據(jù)層結(jié)合。
然后再往底層,數(shù)據(jù)庫(kù)自己未來(lái)肯定也需要讓AI降臨,比如優(yōu)化查詢(xún)速度、自動(dòng)管理數(shù)據(jù)分布(像TiDB的自動(dòng)分片、自動(dòng)伸縮、Serverless能力),甚至用AI來(lái)改進(jìn)數(shù)據(jù)庫(kù)內(nèi)核(這就是所謂的“AIforDB”)。
目前最關(guān)鍵的環(huán)節(jié)是怎么讓數(shù)據(jù)庫(kù)更好地服務(wù)業(yè)務(wù)Agent。大家普遍認(rèn)為,需要一個(gè)中間的DataAgent或者叫“數(shù)據(jù)智能體”來(lái)充當(dāng)橋梁,解決數(shù)據(jù)訪問(wèn)的智能化問(wèn)題,這一層現(xiàn)在尤為重要。
華創(chuàng)資本:數(shù)據(jù)庫(kù)在AIAgent系統(tǒng)中扮演什么角色?是“記憶體”、“知識(shí)庫(kù)”還是“決策引擎”?
劉松:都有。原來(lái)數(shù)據(jù)庫(kù)的邊界,最下層可以被認(rèn)為是一個(gè)總體的數(shù)據(jù)存儲(chǔ),或者多模態(tài)的數(shù)據(jù)存儲(chǔ)。
而中間這一層——DataAgent這一層,這幾個(gè)角色都有。它離具體業(yè)務(wù)很近,理解業(yè)務(wù)輸入和安全邊界,同時(shí)又能利用大模型的能力。這一層的核心任務(wù),是把原始數(shù)據(jù)變成真正有用的業(yè)務(wù)知識(shí)。它不僅僅是加工數(shù)據(jù),要考慮在這一層,怎么能夠在數(shù)據(jù)和知識(shí)的處理、優(yōu)化、沉淀方面提升,從而提煉出數(shù)據(jù)背后的“知識(shí)”;最終目標(biāo)是實(shí)現(xiàn)更高級(jí)的“認(rèn)知”,讓系統(tǒng)能像人一樣理解和推理。這一層直接服務(wù)于上層的業(yè)務(wù)Agent,不是原來(lái)的數(shù)據(jù)庫(kù)產(chǎn)品覆蓋的。
廣義來(lái)看,我們把它定義為“數(shù)據(jù)智能體”,它會(huì)跟上一層的應(yīng)用層——業(yè)務(wù)Agent去打交道,會(huì)變得越來(lái)越厚、功能越來(lái)越豐富,包括MCP等能力都可能集成進(jìn)來(lái),甚至可能催生新的協(xié)議和行業(yè)標(biāo)準(zhǔn)。
在公有云環(huán)境里,它一定是以API的形式出現(xiàn),且是一個(gè)組合。就像AWS發(fā)布的Agent智能體開(kāi)發(fā)套件那樣,既提供構(gòu)建上層業(yè)務(wù)Agent的工具和流程,也包括底層的數(shù)據(jù)處理和安全保障能力。
這一層廠商現(xiàn)在還沒(méi)有定義,大家都會(huì)去做,邊界還沒(méi)有那么清晰。數(shù)據(jù)庫(kù)、云、大模型的公司都會(huì)想要參與,因?yàn)檫@一層是現(xiàn)在的剛需。
02拒絕簡(jiǎn)單的平替
華創(chuàng)資本:近日,Oracle市值盤(pán)中突破7000億美元,這個(gè)一度被人認(rèn)為“傳統(tǒng)”的數(shù)據(jù)庫(kù)巨頭,用AI+云的組合拳打破了增長(zhǎng)天花板。你怎么解讀這一現(xiàn)象?
劉松:我在Oracle有過(guò)十年的工作經(jīng)歷,所以我非常理解拉里·埃里森(Oracle董事長(zhǎng)兼CTO)的思維,作為一個(gè)創(chuàng)始人,當(dāng)他面對(duì)一項(xiàng)新的技術(shù)比如大模型時(shí),他的取舍是什么?轉(zhuǎn)化方式是什么?其實(shí)本質(zhì)上就是這兩件事情。他的取舍是不做大模型,但做大模型必須的AIInfra,為此他又做了三件事:第一,找老黃(英偉達(dá)聯(lián)合創(chuàng)始人兼首席執(zhí)行官黃仁勛)買(mǎi)了很多GPU,構(gòu)建出一個(gè)AIInfra。Oracle的云一直排第四,但它借助GPUCloud拉來(lái)了更多的客戶(hù),因?yàn)椴还茏龃竽P偷挠?xùn)練還是推理,總得用GPU吧?這里面有一個(gè)基本的認(rèn)知——AI的應(yīng)用只有在云上才會(huì)進(jìn)化得更快,因?yàn)樵剖墙裉燔浖夹g(shù)的集大成者。
第二,除了GPU以外,肯定還需要數(shù)據(jù)庫(kù),在這方面,本來(lái)就有大量用戶(hù)用的是Oracle,原本他們并不想搬到云上,但Oracle為用戶(hù)提供了一個(gè)更全面的云平臺(tái)。所以AI帶動(dòng)了Oracle云從線下向線上的加速遷移。
第三,Oracle原來(lái)的SaaS類(lèi)別以FusionCloudERP和NetSuiteCloudERP等后臺(tái)解決方案為主導(dǎo),只有在公有云上才會(huì)使用,很多SaaS還需要疊加大模型的能力,于是Oracle就把它進(jìn)行了改造,所以O(shè)racle反而變成這波AI里完全不在大模型上做投入,但僅僅圍繞AIInfra做了最好轉(zhuǎn)化的一家公司。
華創(chuàng)資本:這是否反映了市場(chǎng)對(duì)擁有深厚企業(yè)客戶(hù)根基和完整數(shù)據(jù)棧的傳統(tǒng)巨頭在AI時(shí)代變現(xiàn)潛力的重新評(píng)估?
劉松:我覺(jué)得這里面很多東西值得思考,如果不做大模型,怎么去定義大模型需要的東西?怎么結(jié)合你原來(lái)的優(yōu)勢(shì)?對(duì)Oracle來(lái)說(shuō),GPU不是優(yōu)勢(shì),但有云這個(gè)基礎(chǔ);數(shù)據(jù)庫(kù)是原來(lái)的優(yōu)勢(shì),但它們需要轉(zhuǎn)化;整個(gè)應(yīng)用或者SaaS,需要疊加AI。
其實(shí)Salesforce也一樣,它也不做大模型,但加了AI后,對(duì)客戶(hù)的效率也提升了很多,所以在整個(gè)ToB領(lǐng)域,本質(zhì)上是轉(zhuǎn)化、疊加的邏輯,而在ToC一側(cè),可能是顛覆邏輯。
所以每一個(gè)傳統(tǒng)IT廠商,其實(shí)最重要的思考就是在大模型改變未來(lái)范式的時(shí)候,那個(gè)客戶(hù)需要的、不變的東西是什么?我需要+AI把它呈現(xiàn)出來(lái),然后這個(gè)客戶(hù)就會(huì)繼續(xù)用我的產(chǎn)品。
AI到來(lái)之后,任何一個(gè)ToB領(lǐng)域的CEO、創(chuàng)始人,都應(yīng)該思考的問(wèn)題就是我的取舍、我的邊界以及既有的客戶(hù)資產(chǎn)是不是發(fā)生了變化?這三樣?xùn)|西想清楚了以后,模型怎么跑跟我無(wú)關(guān),但模型能力越強(qiáng),就能越變成我的拉力,然后才能轉(zhuǎn)化成商業(yè)模式,所以我覺(jué)得Oracle這個(gè)例子很值得思考。
這里面還隱含了一個(gè)邏輯:在ToB領(lǐng)域,無(wú)論推理能力多么強(qiáng)大,永遠(yuǎn)離不開(kāi)流程、數(shù)據(jù),以及很關(guān)鍵的安全。比如在模型問(wèn)答方面,客戶(hù)得到的回答是否超過(guò)了他的權(quán)限?怎么確保他問(wèn)到的問(wèn)題里面是有護(hù)欄能夠識(shí)別的?可以暴露給他多少信息,這些都需要做好。
華創(chuàng)資本:對(duì)于PingCAP這樣的新興廠商,在AI時(shí)代與傳統(tǒng)數(shù)據(jù)庫(kù)巨頭的競(jìng)爭(zhēng)焦點(diǎn)會(huì)是什么?
劉松:作為原生分布式的廠商,PingCAP獨(dú)立研發(fā)的新型數(shù)據(jù)庫(kù)產(chǎn)品TiDB,最大的標(biāo)簽就是高擴(kuò)展性,其次是HTAP混合負(fù)載、云原生,這兩年又增加了AI,我們本身服務(wù)的都是數(shù)據(jù)量大、高速增長(zhǎng),并且有混合負(fù)載需求的客戶(hù),場(chǎng)景更多集中于泛互聯(lián)網(wǎng)和金融。在All-in-One方面,我們既有的客戶(hù)想增加AI的能力,我們可以讓他不用修改習(xí)慣就能夠做AI相關(guān)的事情,這是我們一個(gè)很大的甜點(diǎn)。
我過(guò)去半年在國(guó)內(nèi)觀察到一個(gè)很有意思的現(xiàn)象,在ToB垂直領(lǐng)域,有大概50%的AI項(xiàng)目的負(fù)責(zé)人,原來(lái)可能都是管數(shù)據(jù)庫(kù)的,因?yàn)榇竽P捅旧硪呀?jīng)很強(qiáng)了,要想把一個(gè)ToB的項(xiàng)目做好,花在數(shù)據(jù)上的時(shí)間可能要接近60%,通常數(shù)據(jù)的臟活累活最多。
雖然行業(yè)都在吃這塊甜點(diǎn),但我們的定位會(huì)有差異。我經(jīng)常用一個(gè)比喻:集中式數(shù)據(jù)庫(kù)Oracle已經(jīng)是頂峰了,它相當(dāng)于是油車(chē),而PingCAP這種分布式的架構(gòu)相當(dāng)于電車(chē)。同樣都是開(kāi)車(chē),解決的問(wèn)題最終是一樣的,但引擎的處理方式不一樣。分布式架構(gòu)就像電車(chē)一樣,你的性能上限是更容易達(dá)到的。我們很多國(guó)內(nèi)的大客戶(hù),如銀行、保險(xiǎn)、證券、運(yùn)營(yíng)商、能源、醫(yī)療等行業(yè),有大量客戶(hù)從Oracle、MySQL改用TiDB的,總體成本肯定會(huì)更低、擴(kuò)展性和混合分析的能力也會(huì)更強(qiáng),這是技術(shù)的紅利。
華創(chuàng)資本:基于這樣的技術(shù)紅利,PingCAP要做些什么事情來(lái)持續(xù)深耕中國(guó)市場(chǎng)?
劉松:全世界沒(méi)有任何一個(gè)市場(chǎng)像中國(guó)這樣,對(duì)于數(shù)據(jù)處理有這么極致的要求。美國(guó)也沒(méi)有雙十一這樣體量的購(gòu)物節(jié),沒(méi)有像中國(guó)的銀行業(yè)這么龐大的客戶(hù)體量,7×24小時(shí)的服務(wù),還有手機(jī)銀行、數(shù)字支付、即時(shí)到賬、內(nèi)部報(bào)表等等各種對(duì)數(shù)據(jù)極致的需求。
所以無(wú)論從交易數(shù)據(jù)量、分析能力、互聯(lián)網(wǎng)化等方面,中國(guó)在整個(gè)數(shù)據(jù)市場(chǎng)里面都是一座珠穆朗瑪峰,連Oracle都覺(jué)得中國(guó)市場(chǎng)的需求是他們創(chuàng)新的一個(gè)源泉。
對(duì)于PingCAP來(lái)說(shuō)更是如此,我們成立這十年來(lái)最看家的本事,有七成都是國(guó)內(nèi)市場(chǎng)最重要的金融和互聯(lián)網(wǎng)客戶(hù)教會(huì)我們的,而且我們前五年大部分的商業(yè)化貢獻(xiàn),也是來(lái)自國(guó)內(nèi)廣義的互聯(lián)網(wǎng)和金融機(jī)構(gòu),我們才得以到今天這樣的市場(chǎng)地位。
所以,我們到了美國(guó)、日本、歐洲,都是降維打擊,就是因?yàn)檫^(guò)去十年,在中國(guó)這個(gè)最卷的技術(shù)市場(chǎng),有最多的工程師紅利、最挑剔的客戶(hù)場(chǎng)景和最嚴(yán)格的合規(guī)規(guī)定,在這樣的環(huán)境中,PingCAP殺出了一條血路。
如果想做一家世界級(jí)的數(shù)據(jù)庫(kù)公司,中國(guó)無(wú)疑是一個(gè)需求的大本營(yíng),也始終是我們競(jìng)爭(zhēng)力的基石,而且PingCAP大部分研發(fā)工程師都在中國(guó)境內(nèi),我們希望把自己在國(guó)內(nèi)打磨的產(chǎn)品、積累的經(jīng)驗(yàn)延伸到海外。
最近針對(duì)國(guó)內(nèi)特有的單機(jī)部署需求,我們平凱數(shù)據(jù)庫(kù)(TiDB企業(yè)版)做出了敏捷模式,未來(lái)針對(duì)中國(guó)市場(chǎng)還會(huì)推出新的版本。
華創(chuàng)資本:對(duì)數(shù)據(jù)庫(kù)廠商來(lái)說(shuō),當(dāng)下是國(guó)產(chǎn)化替代的紅利嗎?
劉松:數(shù)據(jù)庫(kù)“國(guó)產(chǎn)化”不是簡(jiǎn)單的平替,我們也拒絕這樣的平替,因?yàn)槠教鎸?duì)客戶(hù)除了合規(guī)的意義外,沒(méi)有帶來(lái)新的價(jià)值。
PingCAP創(chuàng)業(yè)到現(xiàn)在,除了互聯(lián)網(wǎng)和金融外,也有很多其他行業(yè)的客戶(hù),比如運(yùn)營(yíng)商、能源、醫(yī)療、交通,都對(duì)數(shù)據(jù)量要求很高。其實(shí)早在三四年前,就有大量醫(yī)療行業(yè)的客戶(hù)已經(jīng)從MySQL遷移到TiDB了,因?yàn)樗鼣?shù)據(jù)量很大,我們單體的醫(yī)療客戶(hù)就有100個(gè)TB這樣的級(jí)別,所以醫(yī)療也是未來(lái)我們非??粗氐念I(lǐng)域。此外,還有交通等領(lǐng)域,也對(duì)7×24小時(shí)高可用有很大的需求。
所以,我們做的事情,更重要的意義在于給這些行業(yè)創(chuàng)造價(jià)值,是不是讓數(shù)據(jù)庫(kù)能夠處理更大的數(shù)據(jù)量?是不是有更好地?cái)?shù)據(jù)共享能力,并且也能支持AI的應(yīng)用?從這個(gè)角度看,不僅不是簡(jiǎn)單的平替,反而還可能會(huì)增加成本。尤其單機(jī)部署的數(shù)據(jù)庫(kù),因?yàn)闆](méi)有足夠的靈活性,在處理AI應(yīng)用方面會(huì)遇到很大瓶頸,所以未來(lái)面對(duì)數(shù)據(jù)量越來(lái)越大、AI需求涌現(xiàn),這二者結(jié)合時(shí)會(huì)對(duì)新一代數(shù)據(jù)庫(kù)提出更高的要求,這也是未來(lái)三、五年行業(yè)一個(gè)比較大的變化。事實(shí)上,市場(chǎng)已經(jīng)在收縮了,最近《數(shù)據(jù)庫(kù)發(fā)展研究報(bào)告(2025年)》顯示,過(guò)去一年中國(guó)的數(shù)據(jù)庫(kù)廠商從167家變成了103家,減少了64家。
華創(chuàng)資本:為什么會(huì)有這么大的收縮?
劉松:因?yàn)閿?shù)據(jù)庫(kù)在國(guó)產(chǎn)化的過(guò)程中,第一批客戶(hù)已經(jīng)開(kāi)始能夠分出好壞了,我們已經(jīng)接到了大量二次替代的要求。
TiDB一直靠開(kāi)源社區(qū)打磨,有些客戶(hù)在前期試用時(shí)就能體會(huì)到好用。過(guò)去幾年,很多客戶(hù)先后用過(guò)Oracle、MySQL,后來(lái)發(fā)現(xiàn)不管是數(shù)據(jù)量還是合規(guī)的角度,這些數(shù)據(jù)庫(kù)已經(jīng)不能滿(mǎn)足他們的需求,希望能換成像PingCAP這樣更新一代的數(shù)據(jù)庫(kù)。
所以未來(lái)兩三年數(shù)據(jù)庫(kù)國(guó)產(chǎn)化進(jìn)程中,廠商比拼的還是“好用”這個(gè)關(guān)鍵點(diǎn)。因?yàn)橐粋€(gè)客戶(hù)有上百個(gè)系統(tǒng),需要7×24小時(shí)地跑,每天應(yīng)用的調(diào)用次數(shù)可能是上千萬(wàn)甚至上億次,所以未來(lái)要從替代走向好用。此外,在AI這個(gè)時(shí)代,數(shù)據(jù)庫(kù)都要開(kāi)始做到AIready,解決面向AI的擴(kuò)展性的問(wèn)題。這些因素疊加,都會(huì)導(dǎo)致市場(chǎng)競(jìng)爭(zhēng)格局的變化。
數(shù)量收斂對(duì)產(chǎn)業(yè)總體來(lái)說(shuō)是一件好事,因?yàn)槿澜绲臄?shù)據(jù)庫(kù)現(xiàn)在也就不到400家,美國(guó)和中國(guó)就分別有146家和103家。未來(lái)誰(shuí)能勝出,首先一定要靠產(chǎn)品力,其次是生態(tài),包括上下游的生態(tài)和人才的生態(tài)。所以我們打磨了十年的開(kāi)源產(chǎn)品,是經(jīng)過(guò)了中國(guó)和全球用戶(hù)的驗(yàn)證,才慢慢轉(zhuǎn)化成我們的客戶(hù)的。
03全球化需要高度本地化
華創(chuàng)資本:如果拿TiDB的成功經(jīng)驗(yàn)來(lái)說(shuō),在海外為什么能這么成功?做到了什么?劉松:數(shù)據(jù)庫(kù)這個(gè)軟件本身是通用的,這是一個(gè)基礎(chǔ)。然后要去看數(shù)據(jù)庫(kù)全球市場(chǎng)份額哪個(gè)國(guó)家大,就先去哪。美國(guó)占40%,日本可能有15%,歐洲也得布局,這是我們出海的基本邏輯,就是你的產(chǎn)品邊界決定了你全球的重心。
在全球化的成功路徑上,對(duì)我們來(lái)說(shuō)最重要的、決定性的意義就是開(kāi)源+云。
TiDB以開(kāi)源為主,出海的時(shí)候面對(duì)復(fù)雜的地緣政治,我們作為一個(gè)完全開(kāi)源的產(chǎn)品,客戶(hù)信任這個(gè)最難的問(wèn)題已經(jīng)解決了。接下來(lái),云解決了商業(yè)模式的問(wèn)題,因?yàn)樵茢?shù)據(jù)庫(kù)在2018年以后已經(jīng)被驗(yàn)證了,只要你能做出一個(gè)云數(shù)據(jù)庫(kù),客戶(hù)就愿意采買(mǎi),你只需要證明自己在某方面比亞馬遜、谷歌、微軟做得更好就可以。所以如果沒(méi)有這兩個(gè),全球化就會(huì)很難。
此外,還有一個(gè)關(guān)鍵就是完全的本土化,比如我們?cè)谌毡镜膯T工,可能70%都只會(huì)說(shuō)日語(yǔ);我們?cè)谟《纫灿幸粋€(gè)很小的分部,也都是印度人。
包括我們的文化是Remote-Friendly,遠(yuǎn)程友好,這對(duì)于我們?cè)诤M庹衅竵嗰R遜、Snowflake等硅谷大廠人才時(shí)是一個(gè)很有吸引力的選項(xiàng)。
從成立第一天起,PingCAP的企業(yè)文化就是技術(shù)文化、工程師的文化,全世界的程序員們都希望晚點(diǎn)起、盡量不去公司,很自由,才有創(chuàng)作靈感,這就很世界大同。
華創(chuàng)資本:但管理上的挑戰(zhàn)是不是會(huì)更復(fù)雜,會(huì)影響效率嗎?
劉松:如果只用一個(gè)詞來(lái)形容PingCAP,就是“分布式”,連我們?nèi)齻€(gè)創(chuàng)始人都是三副本的,他們各司其職,形成了一個(gè)小閉環(huán)。美國(guó)的同事就解決美國(guó)的問(wèn)題,日本同事解決日本的問(wèn)題,印度同事解決印度的問(wèn)題,決策時(shí)尊重每位員工的意見(jiàn)。所以在我們公司里面可能有一個(gè)傳統(tǒng),任何一件事情,不管什么情況,只要有一個(gè)員工提出反對(duì)意見(jiàn),我們都要嚴(yán)肅地去聽(tīng)他的理由是什么?就像我們數(shù)據(jù)庫(kù)的共識(shí)算法一樣,最終達(dá)成一致才能繼續(xù)往下執(zhí)行。因?yàn)橐櫦氨M量多人的意見(jiàn),可能決策效率沒(méi)有那么快,但肯定也屏蔽了很多快速?zèng)Q策的坑。這可能很適合數(shù)據(jù)庫(kù)公司,因?yàn)檫@個(gè)賽道是長(zhǎng)期主義的,我們不追求絕對(duì)的快,數(shù)據(jù)庫(kù)已經(jīng)被很多人用起來(lái)了,穩(wěn)定是第一位的,其次是在這個(gè)基礎(chǔ)上再增加很多功能,這是我們行業(yè)的業(yè)態(tài)決定的。
所以回頭看,這十年P(guān)ingCAP做過(guò)的明顯錯(cuò)誤的決定比較少,我們不會(huì)因?yàn)槎唐诶嫒プ龀鲆粋€(gè)快速的決策,這可能也是文化上的差異吧。
華創(chuàng)資本:我們看到一個(gè)現(xiàn)象,很多AInative的軟件創(chuàng)業(yè)公司在成立第一天就選擇了出海,這跟上一代大多數(shù)軟件創(chuàng)業(yè)者非常不一樣。你說(shuō)過(guò),出海這件事,選擇大于努力,那在數(shù)據(jù)庫(kù)領(lǐng)域如何具象化?劉松:數(shù)據(jù)庫(kù)和AI可能還不太一樣,在中國(guó)是能打磨出一個(gè)世界級(jí)數(shù)據(jù)庫(kù)產(chǎn)品的,而AI首先要解決快速獲得流量以及技術(shù)棧的低成本問(wèn)題。
選擇大于努力的意思是即使出海,有些國(guó)家就是更容易成功,比如做數(shù)據(jù)庫(kù),就不得不做美國(guó)這個(gè)市場(chǎng),因?yàn)樗畲螅坏绻鯝I游戲,可能在東南亞更容易成功,畢竟文化壁壘更小。
今天中國(guó)消費(fèi)類(lèi)互聯(lián)網(wǎng)的玩法,比如小紅書(shū)、抖音,和美國(guó)、歐洲都是有區(qū)別的,這背后還不是一個(gè)簡(jiǎn)單的選擇,里面有好多參數(shù),尤其做應(yīng)用,涉及到文化、習(xí)慣、宗教、合規(guī)、隱私保護(hù)等等,所以壁壘還是比較多的。
華創(chuàng)資本:你曾說(shuō)“云+全球化+開(kāi)源”是數(shù)據(jù)庫(kù)公司持續(xù)成功的鐵三角——但AI時(shí)代來(lái)了,這個(gè)鐵律要改寫(xiě)嗎?
劉松:我認(rèn)為要再加一個(gè)AI,現(xiàn)在是這四樣?xùn)|西在塑造,甚至直白點(diǎn)說(shuō),五年以后數(shù)據(jù)庫(kù)廠商的估值就跟這四個(gè)東西有關(guān)。
其實(shí)數(shù)據(jù)庫(kù)是一個(gè)接近50年歷史的賽道了,它古老而年輕,最開(kāi)始解決的問(wèn)題很簡(jiǎn)單,就是ERP時(shí)代的存儲(chǔ)問(wèn)題,為什么又年輕了呢?因?yàn)閿?shù)據(jù)的需求不斷在改變。
第二,它是“四世同堂”的,就是幾代技術(shù)都還活著,Oracle在,我們這種新一代的公司也在,但過(guò)去十年,數(shù)據(jù)庫(kù)主要是被開(kāi)源和云定義的,云數(shù)據(jù)庫(kù)的崛起以及開(kāi)源數(shù)據(jù)庫(kù)變成了主流的方向。因?yàn)殚_(kāi)源數(shù)據(jù)庫(kù)可以跑得更快,現(xiàn)在又疊加了AI,“開(kāi)源+AI+云”三者形態(tài)又有一個(gè)化學(xué)反應(yīng)。
反過(guò)來(lái)講,這兩年大模型開(kāi)源也是個(gè)話題,DeepSeek就證明開(kāi)源大模型會(huì)跑得更快,所以AI+的領(lǐng)域都要考慮這四樣。
華創(chuàng)資本:作為軟件行業(yè)過(guò)去20多年的一個(gè)親歷者和觀察者,從Oracle、阿里云到PingCAP,你的技術(shù)和商業(yè)視角有什么轉(zhuǎn)變?對(duì)行業(yè)的理解有哪些認(rèn)知上的變化?
劉松:2007年時(shí),我還在Oracle,但我那個(gè)時(shí)候就對(duì)互聯(lián)網(wǎng)比較感興趣,決定開(kāi)始寫(xiě)blog?!安┛汀边@個(gè)詞現(xiàn)在已經(jīng)很古老了,但那是我互聯(lián)網(wǎng)原教旨主義的起點(diǎn),你只有變成一個(gè)blogger,寫(xiě)了三四百篇文章,你才能知道互聯(lián)網(wǎng)是怎樣一個(gè)世界,我的網(wǎng)感就是那個(gè)時(shí)候培養(yǎng)出來(lái)的。
我當(dāng)時(shí)算是外企IT人里面一直在關(guān)注互聯(lián)網(wǎng)技術(shù)和模式的,當(dāng)時(shí)我就認(rèn)為互聯(lián)網(wǎng)是先進(jìn)生產(chǎn)力。后來(lái)“棱鏡門(mén)”事件發(fā)生,再加上公有云已經(jīng)開(kāi)始,我覺(jué)得應(yīng)該靠近一個(gè)互聯(lián)網(wǎng)公司,所以后來(lái)就去了阿里云,讓我對(duì)互聯(lián)網(wǎng)積累了很多Know-How。
這幾段職業(yè)經(jīng)歷,讓我意識(shí)到公有云始終是所有新一代IT技術(shù)的集大成者,哪怕AI,也要基于云才能有力量。因?yàn)槟撤N意義上講,大模型要做Agent,也需要用底層的云資源,要用數(shù)據(jù)、開(kāi)發(fā)工具、算力、GPU等。
云最大的價(jià)值,就是回到互聯(lián)網(wǎng)原教旨主義,相信一個(gè)絕對(duì)低的門(mén)檻,通過(guò)網(wǎng)絡(luò)的東西會(huì)帶來(lái)奇跡。所以過(guò)去十年,其實(shí)是公有云推動(dòng)了整個(gè)中國(guó)互聯(lián)網(wǎng)的發(fā)展和全球化。
華創(chuàng)資本:你覺(jué)得數(shù)據(jù)庫(kù)行業(yè)未來(lái)最重要的技術(shù)上的拐點(diǎn)可能會(huì)是什么?
劉松:從云的角度,放眼全球,Serverless肯定是一個(gè)關(guān)鍵的技術(shù),它會(huì)越來(lái)越普及,因?yàn)樗衔磥?lái)更靈活、更高擴(kuò)展性的一體化的消費(fèi)模式;第二,是AI與數(shù)據(jù)庫(kù)的結(jié)合,Data+AI,尤其是DataAgent,肯定是未來(lái)非常關(guān)鍵的賽道,它甚至獨(dú)立于數(shù)據(jù)庫(kù)本身;最后一點(diǎn)就是數(shù)據(jù)庫(kù)未來(lái)的形態(tài),5年以后的數(shù)據(jù)庫(kù),是不是能很好地服務(wù)Agent,我覺(jué)得這幾個(gè)是未來(lái)最關(guān)鍵的拐點(diǎn)。
小工人一次粗心,卻獲得異能,還撿個(gè)了美女老婆的4本都市修真文
完爆榜單的夢(mèng)幻之作《三界微信群》,給作者點(diǎn)一萬(wàn)個(gè)贊!
值得收藏的五本現(xiàn)代修真爆款小說(shuō),資深書(shū)蟲(chóng)也折服