八卦城「古陣法」VS 現(xiàn)代科技,10 萬級智能輔助駕駛能達到怎樣的程度?
2015年,PingCAP(平凱星辰)創(chuàng)業(yè)第一天記錄下第一行代碼時,“開源”就成為這家分布式數(shù)據(jù)庫廠商最大的標簽。此后十年時間里,PingCAP服務(wù)了超過45個國家的4000家企業(yè),創(chuàng)立的分布式數(shù)據(jù)庫產(chǎn)品TiDB,更是在GitHub上總計獲得超過37000顆星,是數(shù)據(jù)庫領(lǐng)域有著極大影響力的開源項目。
正因為信奉開源,PingCAP企業(yè)文化中的決策民主、開放自由吸引了很多人加入,其中就包括PingCAP副總裁劉松。
作為軟件行業(yè)20多年的從業(yè)者,劉松先后在Oracle、阿里云任職,他給自己的標簽是“互聯(lián)網(wǎng)原教旨主義者”和“AI降臨派”。很多人把AI看作今天一個新的技術(shù)范式,劉松卻覺得AI技術(shù)是互聯(lián)網(wǎng)技術(shù)的延伸,正是得益于互聯(lián)網(wǎng)過去沉淀的數(shù)據(jù)和云基礎(chǔ)設(shè)施,AI才變得如此強大。
所以面對這波AI技術(shù)浪潮,劉松想到了不同的隱喻。他認為AI帶著“弒父”的技術(shù)屬性的同時,也因為缺乏場景、用戶、流量等,不可避免背著“丫鬟命”。
而對數(shù)據(jù)庫行業(yè)而言,劉松判斷AI會成為“云+全球化+開源”以外的第四足,將來不僅會重新改寫數(shù)據(jù)庫廠商的估值,也會重塑整個行業(yè)的競爭格局。
信通院發(fā)布的《數(shù)據(jù)庫發(fā)展研究報告(2025年)》顯示,過去一年,中國的數(shù)據(jù)庫廠商減少了64家,競爭在加劇,面對Oracle等傳統(tǒng)巨頭,PingCAP拒絕做簡單的平替,而是希望靠產(chǎn)品力和生態(tài)勝出。而經(jīng)過十年打磨,PingCAP的產(chǎn)品無論在國內(nèi)還是全球,都得到了驗證。不僅在國內(nèi)市場中殺出一條血路,也在海外市場的商業(yè)化方面獲得巨大突破。
近日,劉松接受了「創(chuàng)·問」編輯部的訪談,談到了他對數(shù)據(jù)庫與AI融合的趨勢判斷,也分享了PingCAP如何深耕國內(nèi)市場的同時,還走出了一條高度本地化的出海之路。
如果說上一代互聯(lián)網(wǎng)公司改變了中國人的生活和運用技術(shù)的方式,那劉松希望PingCAP能塑造一種新的公司范式——成為世界上最好且最受尊敬的基礎(chǔ)軟件公司。
全文分享如下:
Q:華創(chuàng)資本
A:PingCAP副總裁劉松
01AI技術(shù)的屬性是弒父
華創(chuàng)資本:你在今年1月就預(yù)測DeepSeek會帶來重大轉(zhuǎn)折,后來的確應(yīng)驗了,從你的視角觀察,這一波AI技術(shù)的浪潮意味著什么?
劉松:關(guān)于這一代AI,我有兩個隱喻。
第一個是“弒父”,新的技術(shù)只要一出來,原有的技術(shù),不管是“爺爺”還是“父親”全部都沒有意義了,就像GPT對于NLP的顛覆一樣,之后下一代出來的東西很有可能也會把當前GPT的模式完全殺掉,所以這種“弒父”屬性,讓AI具備了特別強的顛覆能力。
第二個是“丫鬟命”,AI技術(shù)就算再強大,目前也只是工具型的技術(shù),它自己本身并不構(gòu)成一個用戶層級的賽道,還需要找到一個有場景、有用戶、有流量的“豪門”,這也是為什么扎克伯格要花1億美金去OpenAI挖人的原因。所以我認為五年之內(nèi),AI+流量還是AI應(yīng)用的主航道。尤其對于AI領(lǐng)域的創(chuàng)業(yè)者,如果想不清楚AI技術(shù)模式和流量怎么疊加,那后續(xù)的商業(yè)模式也會很難。
華創(chuàng)資本:那你怎么看待AI這兩年給軟件行業(yè)帶來的沖擊?
劉松:在大模型出現(xiàn)之前,數(shù)字化互聯(lián)網(wǎng)解決的其實是信息不對稱、協(xié)同效率等問題,而結(jié)合了高質(zhì)量數(shù)據(jù)的大模型,帶來的是一場認知革命。
過去我們熟悉的移動互聯(lián)網(wǎng),本質(zhì)上還是數(shù)據(jù)+算法驅(qū)動,無論刷淘寶還是刷抖音,都是依靠推薦算法、依賴數(shù)據(jù)庫技術(shù)而不是腦力。但推理大模型本身就具備了認知能力,它在很多方面都比人做得更好。相比之下,人的優(yōu)勢可能只剩下一些隱含式的經(jīng)驗了。
所以AI帶來最大的變革,是從上一代的云計算時代的數(shù)據(jù)驅(qū)動,走向了認知革命。
華創(chuàng)資本:隨著AI和大模型融合發(fā)展,“數(shù)據(jù)庫”的角色是否也正在發(fā)生變化?
劉松:我認為會發(fā)生根本性的變化。我們CTO黃東旭說過一個基本邏輯:“未來的數(shù)據(jù)庫一定是面向Agent的,因為之前的數(shù)據(jù)庫是面向數(shù)據(jù)工程師和DBA的。”
每個Agent就是一個智能代理,它的上層是UI,下面是知識檢索,中間有流程引擎、知識圖譜,基礎(chǔ)是數(shù)據(jù)。有了這樣的Agent,很多助理、運營、營銷、客服等崗位做的事情,就很容易被自動化。我們做了兩件事來提升RAG效果:第一,構(gòu)建動態(tài)知識圖譜;第二,通過定向訓練模型的思維鏈,來動態(tài)規(guī)劃RAGFlow(開源項目StackVM),我們認為未來的Agent會是:定向訓練的推理模型+上下文工程+工具調(diào)用+記憶。
當業(yè)務(wù)Agent去訪問數(shù)據(jù)時,數(shù)據(jù)庫越來越成為一個大的記憶體,那它如何跟業(yè)務(wù)Agent有效交互呢?CEO們都希望把自然語言變成SQL,然后自動獲得一個答案。但這會面臨一個難題:CEO們問的問題空間是無窮的,但它轉(zhuǎn)化成SQL能理解的范圍以及數(shù)據(jù)里面已有的準備是有限的,而且今天這個問答的準確率最多也就到85%,甚至不到90%。
所以Agent在從ToC到ToB的逐步演進里,如果能從dothingright到dorightthing,就說明它變得越來越成熟、越來越靠譜了,也就像人類一樣,形成了感知、理解、規(guī)劃、決策、執(zhí)行的閉環(huán)。
華創(chuàng)資本:PingCAP服務(wù)的客戶來自各行各業(yè),從他們的需求來看,AI在企業(yè)中落地的最大推動力和變化是什么?
劉松:我見了很多互聯(lián)網(wǎng)、金融等行業(yè)的客戶,不管是證券、保險還是醫(yī)療,在以前,AI項目基本是IT人的活兒,其他人是不太在意的。
但從今年2月份開始,我看到最大的變化是所有業(yè)務(wù)人員都認為我要做好自己的AI,他們突然都變得非常積極,追著IT人員說我要上AI項目。他們已經(jīng)看到能用AI解決生活中的很多問題,為什么工作上不能呢?所以就希望IT部門幫他們訓一個Agent,提升精確度。好的業(yè)務(wù)Agent需要業(yè)務(wù)人員輸入自己的專業(yè)知識,培養(yǎng)出一個“老專家”,這樣就能減少自己日常的工作量,這是AI解決的知識自動化的問題。
就像當年APP盛行的時候一樣,之所以2012年成為一個拐點,就是所有人都開始用智能手機來解決生活問題,然后解決工作問題?,F(xiàn)在Agent就是那一代的升級版,只是有了推理能力后,變成了一個更加自動化的腦力工具。它的形態(tài)就是在APP上疊加了一層更快速地自動分析和執(zhí)行的邏輯。
未來最理想的情況就是大家都能把自己的數(shù)字分身——行業(yè)Agent模型訓出來,然后把常規(guī)的工作都交給AI,人只負責規(guī)劃和創(chuàng)意,我覺得這可能是值得期待的未來。因為對于中國的職場人,最現(xiàn)實的事情不就兩個:不被AI替代以及不用加班,后者是未來五年最值得努力的目標。
作為一個“降臨派”,我覺得AI首要的意義是解放人,而對中國社會的正面目標在于:第一,不加班也不裁員;第二,增加工作的意義和樂趣;第三,老有所養(yǎng);第四,給弱者公平且非歧視性的幸福權(quán)利。
華創(chuàng)資本:AI時代到來后,你剛剛提到的那些客戶,對數(shù)據(jù)庫是不是也提出了一些新的要求?
劉松:最近我剛在上海見了一個客戶就很有前瞻性,首先他們說根本不關(guān)心應(yīng)用,因為分分鐘可以做出來,真正的護城河其實是數(shù)據(jù)。其次,做出來的Agent雖然效果也不錯,但他們更關(guān)心如何把精度從75%提升到95%。而背后的技術(shù)關(guān)鍵點其實就在數(shù)據(jù)庫和RAG里面。
因為現(xiàn)在一個基本的Agent組合,在大多數(shù)企業(yè)里面,上面有一個開發(fā)框架,像Dify;中間有一層RAG,比如我們現(xiàn)在做的是有一層開源的框架,叫AutoFlow,這是一套GraphRAG框架,開發(fā)者可以直接使用AutoFlow提供的封裝好的組件,組合使用,提高開發(fā)效率;再下面一層,是一個All-in-One的Database,支持向量/全文/圖數(shù)據(jù)等多模態(tài)存儲。
今天,全球TOP10的數(shù)據(jù)庫公司里已經(jīng)有6家是All-in-One架構(gòu),這意味著SQLDatabase已經(jīng)整合了向量檢索、全文檢索和圖數(shù)據(jù)處理功能,這種四庫合一All-in-One的Database在底層,通過統(tǒng)一的存儲引擎實現(xiàn)多模態(tài)數(shù)據(jù)管理。
未來可能的演進是下一代的DataAgent,這一層一定是靠AI技術(shù)和數(shù)據(jù)技術(shù)結(jié)合的。而這一層做好了,就成為回答業(yè)務(wù)Agent的一個代理人。比如業(yè)務(wù)Agent問一個問題:未來五天北京到大理,國航的機票,時間最好的,哪一天最便宜?那這個DataAgent將自動完成:跨數(shù)據(jù)庫檢索、多維度條件過濾、結(jié)果智能比對。業(yè)務(wù)Agent無需關(guān)心底層是SQL、向量數(shù)據(jù)庫還是圖數(shù)據(jù)庫,這些都被中間這層屏蔽了。所以,可能數(shù)據(jù)庫的邊界也會發(fā)生變化,數(shù)據(jù)庫包括大數(shù)據(jù)技術(shù),在原有的范式里,它留在了存儲和CRUD,就是我都存儲好了,你用SQL來問,這種模式可能不夠了。因為業(yè)務(wù)Agent要用自然語言來問問題,所以中間這層——DataAgent這層會越來越厚,現(xiàn)在的雛形就是RAG和GraphRAG。
GraphRAG解決什么問題呢?舉個例子,我們有一個TiDB知識問答機器人,叫TiDB.AI(https://tidb.ai/),可以用來問有關(guān)TiDB的任何問題。我們把過去10年1萬份技術(shù)文檔都丟進去訓,當我們南美的客戶碰到問題,他只需要問TiDB.AI就能解決,不需要專門的運維工程師去解答。
這里面的學問在于,這一萬份文檔在不斷更新,丟進去以后,文檔里面的知識點是怎么動態(tài)地被重新連接起來的?比如在數(shù)據(jù)庫運維場景里面,要把TiDB從7.5升級到8.1,我能不能用Agent的問答來執(zhí)行?它是不是把所有嚴肅性的邊界條件都check到了?我能不能相信它給我的建議和診斷?在這樣一個問題里面,要的是絕對知識的精度,所以僅僅用向量數(shù)據(jù)庫就不夠了,因為向量數(shù)據(jù)庫是以圖搜圖、找近似回答的邏輯。要考慮每個知識點的連接、嚴謹性和動態(tài)性,所以我們通過強化學習訓練一個小模型,在知識圖譜上進行有效的檢索來提升精度。
這是個工程問題,概括來說就是GraphRAG可能比樸素的RAG稍微走遠了一層,它將分散的知識點關(guān)聯(lián)在一起形成知識圖譜。而我們更進一步,通過訓練模型來不斷優(yōu)化知識圖譜的結(jié)構(gòu),以及在檢索時通過模型推理更精準地查找答案。
華創(chuàng)資本:假設(shè)Agent以后非常智能,它能繞過一般SQL或向量搜索,直接從數(shù)據(jù)庫中拿到想要的查詢結(jié)果嗎?
劉松:從長遠看來,有可能會實現(xiàn),但這里有一個“悖論”。想要那樣聰明的“老師傅”Agent出現(xiàn),首先還是要把老師傅的經(jīng)驗和知識教給它才行。換句話說,要實現(xiàn)你說的“直取數(shù)據(jù)”,恰恰需要數(shù)據(jù)庫架構(gòu)師、工程師把DataAgent給做出來。
表面上,用戶用自然語言一問,數(shù)據(jù)就自動出來了,好像跳過了數(shù)據(jù)庫。但其實,背后的存取過程一個步驟都沒少,只是被自動化以及對用戶隱藏了。這背后涉及海量的專業(yè)“竅門”:數(shù)據(jù)是怎么分布的?不同類型的數(shù)據(jù)怎么關(guān)聯(lián)?如何把一個看似簡單的查詢,用最高效的方式執(zhí)行出來?這樣大量的Know-How,不在大模型的腦子里,還是在數(shù)據(jù)庫這一群人的腦子里。
所以,用自然語言直取數(shù)據(jù)方式的最終實現(xiàn),解鈴還須系鈴人。以用戶角度思考,Agent什么時候能變得我想要的那么聰明?還得那個行業(yè)領(lǐng)域的人把聰明和認知裝在里面,把推理能力、數(shù)據(jù)能力包括知識的動態(tài)更新的機制,全部做成一個真正的知識型的Agent才可以。
表面上看,DataAgent把撈數(shù)或者是一個任意自然語言問答自動化了,但這個過程本身很復雜。隨著它自己越來越智能和自動化,AI的能力需要更深入地與數(shù)據(jù)層結(jié)合。
然后再往底層,數(shù)據(jù)庫自己未來肯定也需要讓AI降臨,比如優(yōu)化查詢速度、自動管理數(shù)據(jù)分布(像TiDB的自動分片、自動伸縮、Serverless能力),甚至用AI來改進數(shù)據(jù)庫內(nèi)核(這就是所謂的“AIforDB”)。
目前最關(guān)鍵的環(huán)節(jié)是怎么讓數(shù)據(jù)庫更好地服務(wù)業(yè)務(wù)Agent。大家普遍認為,需要一個中間的DataAgent或者叫“數(shù)據(jù)智能體”來充當橋梁,解決數(shù)據(jù)訪問的智能化問題,這一層現(xiàn)在尤為重要。
華創(chuàng)資本:數(shù)據(jù)庫在AIAgent系統(tǒng)中扮演什么角色?是“記憶體”、“知識庫”還是“決策引擎”?
劉松:都有。原來數(shù)據(jù)庫的邊界,最下層可以被認為是一個總體的數(shù)據(jù)存儲,或者多模態(tài)的數(shù)據(jù)存儲。
而中間這一層——DataAgent這一層,這幾個角色都有。它離具體業(yè)務(wù)很近,理解業(yè)務(wù)輸入和安全邊界,同時又能利用大模型的能力。這一層的核心任務(wù),是把原始數(shù)據(jù)變成真正有用的業(yè)務(wù)知識。它不僅僅是加工數(shù)據(jù),要考慮在這一層,怎么能夠在數(shù)據(jù)和知識的處理、優(yōu)化、沉淀方面提升,從而提煉出數(shù)據(jù)背后的“知識”;最終目標是實現(xiàn)更高級的“認知”,讓系統(tǒng)能像人一樣理解和推理。這一層直接服務(wù)于上層的業(yè)務(wù)Agent,不是原來的數(shù)據(jù)庫產(chǎn)品覆蓋的。
廣義來看,我們把它定義為“數(shù)據(jù)智能體”,它會跟上一層的應(yīng)用層——業(yè)務(wù)Agent去打交道,會變得越來越厚、功能越來越豐富,包括MCP等能力都可能集成進來,甚至可能催生新的協(xié)議和行業(yè)標準。
在公有云環(huán)境里,它一定是以API的形式出現(xiàn),且是一個組合。就像AWS發(fā)布的Agent智能體開發(fā)套件那樣,既提供構(gòu)建上層業(yè)務(wù)Agent的工具和流程,也包括底層的數(shù)據(jù)處理和安全保障能力。
這一層廠商現(xiàn)在還沒有定義,大家都會去做,邊界還沒有那么清晰。數(shù)據(jù)庫、云、大模型的公司都會想要參與,因為這一層是現(xiàn)在的剛需。
02拒絕簡單的平替
華創(chuàng)資本:近日,Oracle市值盤中突破7000億美元,這個一度被人認為“傳統(tǒng)”的數(shù)據(jù)庫巨頭,用AI+云的組合拳打破了增長天花板。你怎么解讀這一現(xiàn)象?
劉松:我在Oracle有過十年的工作經(jīng)歷,所以我非常理解拉里·埃里森(Oracle董事長兼CTO)的思維,作為一個創(chuàng)始人,當他面對一項新的技術(shù)比如大模型時,他的取舍是什么?轉(zhuǎn)化方式是什么?其實本質(zhì)上就是這兩件事情。他的取舍是不做大模型,但做大模型必須的AIInfra,為此他又做了三件事:第一,找老黃(英偉達聯(lián)合創(chuàng)始人兼首席執(zhí)行官黃仁勛)買了很多GPU,構(gòu)建出一個AIInfra。Oracle的云一直排第四,但它借助GPUCloud拉來了更多的客戶,因為不管做大模型的訓練還是推理,總得用GPU吧?這里面有一個基本的認知——AI的應(yīng)用只有在云上才會進化得更快,因為云是今天軟件技術(shù)的集大成者。
第二,除了GPU以外,肯定還需要數(shù)據(jù)庫,在這方面,本來就有大量用戶用的是Oracle,原本他們并不想搬到云上,但Oracle為用戶提供了一個更全面的云平臺。所以AI帶動了Oracle云從線下向線上的加速遷移。
第三,Oracle原來的SaaS類別以FusionCloudERP和NetSuiteCloudERP等后臺解決方案為主導,只有在公有云上才會使用,很多SaaS還需要疊加大模型的能力,于是Oracle就把它進行了改造,所以O(shè)racle反而變成這波AI里完全不在大模型上做投入,但僅僅圍繞AIInfra做了最好轉(zhuǎn)化的一家公司。
華創(chuàng)資本:這是否反映了市場對擁有深厚企業(yè)客戶根基和完整數(shù)據(jù)棧的傳統(tǒng)巨頭在AI時代變現(xiàn)潛力的重新評估?
劉松:我覺得這里面很多東西值得思考,如果不做大模型,怎么去定義大模型需要的東西?怎么結(jié)合你原來的優(yōu)勢?對Oracle來說,GPU不是優(yōu)勢,但有云這個基礎(chǔ);數(shù)據(jù)庫是原來的優(yōu)勢,但它們需要轉(zhuǎn)化;整個應(yīng)用或者SaaS,需要疊加AI。
其實Salesforce也一樣,它也不做大模型,但加了AI后,對客戶的效率也提升了很多,所以在整個ToB領(lǐng)域,本質(zhì)上是轉(zhuǎn)化、疊加的邏輯,而在ToC一側(cè),可能是顛覆邏輯。
所以每一個傳統(tǒng)IT廠商,其實最重要的思考就是在大模型改變未來范式的時候,那個客戶需要的、不變的東西是什么?我需要+AI把它呈現(xiàn)出來,然后這個客戶就會繼續(xù)用我的產(chǎn)品。
AI到來之后,任何一個ToB領(lǐng)域的CEO、創(chuàng)始人,都應(yīng)該思考的問題就是我的取舍、我的邊界以及既有的客戶資產(chǎn)是不是發(fā)生了變化?這三樣東西想清楚了以后,模型怎么跑跟我無關(guān),但模型能力越強,就能越變成我的拉力,然后才能轉(zhuǎn)化成商業(yè)模式,所以我覺得Oracle這個例子很值得思考。
這里面還隱含了一個邏輯:在ToB領(lǐng)域,無論推理能力多么強大,永遠離不開流程、數(shù)據(jù),以及很關(guān)鍵的安全。比如在模型問答方面,客戶得到的回答是否超過了他的權(quán)限?怎么確保他問到的問題里面是有護欄能夠識別的?可以暴露給他多少信息,這些都需要做好。
華創(chuàng)資本:對于PingCAP這樣的新興廠商,在AI時代與傳統(tǒng)數(shù)據(jù)庫巨頭的競爭焦點會是什么?
劉松:作為原生分布式的廠商,PingCAP獨立研發(fā)的新型數(shù)據(jù)庫產(chǎn)品TiDB,最大的標簽就是高擴展性,其次是HTAP混合負載、云原生,這兩年又增加了AI,我們本身服務(wù)的都是數(shù)據(jù)量大、高速增長,并且有混合負載需求的客戶,場景更多集中于泛互聯(lián)網(wǎng)和金融。在All-in-One方面,我們既有的客戶想增加AI的能力,我們可以讓他不用修改習慣就能夠做AI相關(guān)的事情,這是我們一個很大的甜點。
我過去半年在國內(nèi)觀察到一個很有意思的現(xiàn)象,在ToB垂直領(lǐng)域,有大概50%的AI項目的負責人,原來可能都是管數(shù)據(jù)庫的,因為大模型本身已經(jīng)很強了,要想把一個ToB的項目做好,花在數(shù)據(jù)上的時間可能要接近60%,通常數(shù)據(jù)的臟活累活最多。
雖然行業(yè)都在吃這塊甜點,但我們的定位會有差異。我經(jīng)常用一個比喻:集中式數(shù)據(jù)庫Oracle已經(jīng)是頂峰了,它相當于是油車,而PingCAP這種分布式的架構(gòu)相當于電車。同樣都是開車,解決的問題最終是一樣的,但引擎的處理方式不一樣。分布式架構(gòu)就像電車一樣,你的性能上限是更容易達到的。我們很多國內(nèi)的大客戶,如銀行、保險、證券、運營商、能源、醫(yī)療等行業(yè),有大量客戶從Oracle、MySQL改用TiDB的,總體成本肯定會更低、擴展性和混合分析的能力也會更強,這是技術(shù)的紅利。
華創(chuàng)資本:基于這樣的技術(shù)紅利,PingCAP要做些什么事情來持續(xù)深耕中國市場?
劉松:全世界沒有任何一個市場像中國這樣,對于數(shù)據(jù)處理有這么極致的要求。美國也沒有雙十一這樣體量的購物節(jié),沒有像中國的銀行業(yè)這么龐大的客戶體量,7×24小時的服務(wù),還有手機銀行、數(shù)字支付、即時到賬、內(nèi)部報表等等各種對數(shù)據(jù)極致的需求。
所以無論從交易數(shù)據(jù)量、分析能力、互聯(lián)網(wǎng)化等方面,中國在整個數(shù)據(jù)市場里面都是一座珠穆朗瑪峰,連Oracle都覺得中國市場的需求是他們創(chuàng)新的一個源泉。
對于PingCAP來說更是如此,我們成立這十年來最看家的本事,有七成都是國內(nèi)市場最重要的金融和互聯(lián)網(wǎng)客戶教會我們的,而且我們前五年大部分的商業(yè)化貢獻,也是來自國內(nèi)廣義的互聯(lián)網(wǎng)和金融機構(gòu),我們才得以到今天這樣的市場地位。
所以,我們到了美國、日本、歐洲,都是降維打擊,就是因為過去十年,在中國這個最卷的技術(shù)市場,有最多的工程師紅利、最挑剔的客戶場景和最嚴格的合規(guī)規(guī)定,在這樣的環(huán)境中,PingCAP殺出了一條血路。
如果想做一家世界級的數(shù)據(jù)庫公司,中國無疑是一個需求的大本營,也始終是我們競爭力的基石,而且PingCAP大部分研發(fā)工程師都在中國境內(nèi),我們希望把自己在國內(nèi)打磨的產(chǎn)品、積累的經(jīng)驗延伸到海外。
最近針對國內(nèi)特有的單機部署需求,我們平凱數(shù)據(jù)庫(TiDB企業(yè)版)做出了敏捷模式,未來針對中國市場還會推出新的版本。
華創(chuàng)資本:對數(shù)據(jù)庫廠商來說,當下是國產(chǎn)化替代的紅利嗎?
劉松:數(shù)據(jù)庫“國產(chǎn)化”不是簡單的平替,我們也拒絕這樣的平替,因為平替對客戶除了合規(guī)的意義外,沒有帶來新的價值。
PingCAP創(chuàng)業(yè)到現(xiàn)在,除了互聯(lián)網(wǎng)和金融外,也有很多其他行業(yè)的客戶,比如運營商、能源、醫(yī)療、交通,都對數(shù)據(jù)量要求很高。其實早在三四年前,就有大量醫(yī)療行業(yè)的客戶已經(jīng)從MySQL遷移到TiDB了,因為它數(shù)據(jù)量很大,我們單體的醫(yī)療客戶就有100個TB這樣的級別,所以醫(yī)療也是未來我們非常看重的領(lǐng)域。此外,還有交通等領(lǐng)域,也對7×24小時高可用有很大的需求。
所以,我們做的事情,更重要的意義在于給這些行業(yè)創(chuàng)造價值,是不是讓數(shù)據(jù)庫能夠處理更大的數(shù)據(jù)量?是不是有更好地數(shù)據(jù)共享能力,并且也能支持AI的應(yīng)用?從這個角度看,不僅不是簡單的平替,反而還可能會增加成本。尤其單機部署的數(shù)據(jù)庫,因為沒有足夠的靈活性,在處理AI應(yīng)用方面會遇到很大瓶頸,所以未來面對數(shù)據(jù)量越來越大、AI需求涌現(xiàn),這二者結(jié)合時會對新一代數(shù)據(jù)庫提出更高的要求,這也是未來三、五年行業(yè)一個比較大的變化。事實上,市場已經(jīng)在收縮了,最近《數(shù)據(jù)庫發(fā)展研究報告(2025年)》顯示,過去一年中國的數(shù)據(jù)庫廠商從167家變成了103家,減少了64家。
華創(chuàng)資本:為什么會有這么大的收縮?
劉松:因為數(shù)據(jù)庫在國產(chǎn)化的過程中,第一批客戶已經(jīng)開始能夠分出好壞了,我們已經(jīng)接到了大量二次替代的要求。
TiDB一直靠開源社區(qū)打磨,有些客戶在前期試用時就能體會到好用。過去幾年,很多客戶先后用過Oracle、MySQL,后來發(fā)現(xiàn)不管是數(shù)據(jù)量還是合規(guī)的角度,這些數(shù)據(jù)庫已經(jīng)不能滿足他們的需求,希望能換成像PingCAP這樣更新一代的數(shù)據(jù)庫。
所以未來兩三年數(shù)據(jù)庫國產(chǎn)化進程中,廠商比拼的還是“好用”這個關(guān)鍵點。因為一個客戶有上百個系統(tǒng),需要7×24小時地跑,每天應(yīng)用的調(diào)用次數(shù)可能是上千萬甚至上億次,所以未來要從替代走向好用。此外,在AI這個時代,數(shù)據(jù)庫都要開始做到AIready,解決面向AI的擴展性的問題。這些因素疊加,都會導致市場競爭格局的變化。
數(shù)量收斂對產(chǎn)業(yè)總體來說是一件好事,因為全世界的數(shù)據(jù)庫現(xiàn)在也就不到400家,美國和中國就分別有146家和103家。未來誰能勝出,首先一定要靠產(chǎn)品力,其次是生態(tài),包括上下游的生態(tài)和人才的生態(tài)。所以我們打磨了十年的開源產(chǎn)品,是經(jīng)過了中國和全球用戶的驗證,才慢慢轉(zhuǎn)化成我們的客戶的。
03全球化需要高度本地化
華創(chuàng)資本:如果拿TiDB的成功經(jīng)驗來說,在海外為什么能這么成功?做到了什么?劉松:數(shù)據(jù)庫這個軟件本身是通用的,這是一個基礎(chǔ)。然后要去看數(shù)據(jù)庫全球市場份額哪個國家大,就先去哪。美國占40%,日本可能有15%,歐洲也得布局,這是我們出海的基本邏輯,就是你的產(chǎn)品邊界決定了你全球的重心。
在全球化的成功路徑上,對我們來說最重要的、決定性的意義就是開源+云。
TiDB以開源為主,出海的時候面對復雜的地緣政治,我們作為一個完全開源的產(chǎn)品,客戶信任這個最難的問題已經(jīng)解決了。接下來,云解決了商業(yè)模式的問題,因為云數(shù)據(jù)庫在2018年以后已經(jīng)被驗證了,只要你能做出一個云數(shù)據(jù)庫,客戶就愿意采買,你只需要證明自己在某方面比亞馬遜、谷歌、微軟做得更好就可以。所以如果沒有這兩個,全球化就會很難。
此外,還有一個關(guān)鍵就是完全的本土化,比如我們在日本的員工,可能70%都只會說日語;我們在印度也有一個很小的分部,也都是印度人。
包括我們的文化是Remote-Friendly,遠程友好,這對于我們在海外招聘亞馬遜、Snowflake等硅谷大廠人才時是一個很有吸引力的選項。
從成立第一天起,PingCAP的企業(yè)文化就是技術(shù)文化、工程師的文化,全世界的程序員們都希望晚點起、盡量不去公司,很自由,才有創(chuàng)作靈感,這就很世界大同。
華創(chuàng)資本:但管理上的挑戰(zhàn)是不是會更復雜,會影響效率嗎?
劉松:如果只用一個詞來形容PingCAP,就是“分布式”,連我們?nèi)齻€創(chuàng)始人都是三副本的,他們各司其職,形成了一個小閉環(huán)。美國的同事就解決美國的問題,日本同事解決日本的問題,印度同事解決印度的問題,決策時尊重每位員工的意見。所以在我們公司里面可能有一個傳統(tǒng),任何一件事情,不管什么情況,只要有一個員工提出反對意見,我們都要嚴肅地去聽他的理由是什么?就像我們數(shù)據(jù)庫的共識算法一樣,最終達成一致才能繼續(xù)往下執(zhí)行。因為要顧及盡量多人的意見,可能決策效率沒有那么快,但肯定也屏蔽了很多快速決策的坑。這可能很適合數(shù)據(jù)庫公司,因為這個賽道是長期主義的,我們不追求絕對的快,數(shù)據(jù)庫已經(jīng)被很多人用起來了,穩(wěn)定是第一位的,其次是在這個基礎(chǔ)上再增加很多功能,這是我們行業(yè)的業(yè)態(tài)決定的。
所以回頭看,這十年P(guān)ingCAP做過的明顯錯誤的決定比較少,我們不會因為短期利益去做出一個快速的決策,這可能也是文化上的差異吧。
華創(chuàng)資本:我們看到一個現(xiàn)象,很多AInative的軟件創(chuàng)業(yè)公司在成立第一天就選擇了出海,這跟上一代大多數(shù)軟件創(chuàng)業(yè)者非常不一樣。你說過,出海這件事,選擇大于努力,那在數(shù)據(jù)庫領(lǐng)域如何具象化?劉松:數(shù)據(jù)庫和AI可能還不太一樣,在中國是能打磨出一個世界級數(shù)據(jù)庫產(chǎn)品的,而AI首先要解決快速獲得流量以及技術(shù)棧的低成本問題。
選擇大于努力的意思是即使出海,有些國家就是更容易成功,比如做數(shù)據(jù)庫,就不得不做美國這個市場,因為它最大;但如果做AI游戲,可能在東南亞更容易成功,畢竟文化壁壘更小。
今天中國消費類互聯(lián)網(wǎng)的玩法,比如小紅書、抖音,和美國、歐洲都是有區(qū)別的,這背后還不是一個簡單的選擇,里面有好多參數(shù),尤其做應(yīng)用,涉及到文化、習慣、宗教、合規(guī)、隱私保護等等,所以壁壘還是比較多的。
華創(chuàng)資本:你曾說“云+全球化+開源”是數(shù)據(jù)庫公司持續(xù)成功的鐵三角——但AI時代來了,這個鐵律要改寫嗎?
劉松:我認為要再加一個AI,現(xiàn)在是這四樣東西在塑造,甚至直白點說,五年以后數(shù)據(jù)庫廠商的估值就跟這四個東西有關(guān)。
其實數(shù)據(jù)庫是一個接近50年歷史的賽道了,它古老而年輕,最開始解決的問題很簡單,就是ERP時代的存儲問題,為什么又年輕了呢?因為數(shù)據(jù)的需求不斷在改變。
第二,它是“四世同堂”的,就是幾代技術(shù)都還活著,Oracle在,我們這種新一代的公司也在,但過去十年,數(shù)據(jù)庫主要是被開源和云定義的,云數(shù)據(jù)庫的崛起以及開源數(shù)據(jù)庫變成了主流的方向。因為開源數(shù)據(jù)庫可以跑得更快,現(xiàn)在又疊加了AI,“開源+AI+云”三者形態(tài)又有一個化學反應(yīng)。
反過來講,這兩年大模型開源也是個話題,DeepSeek就證明開源大模型會跑得更快,所以AI+的領(lǐng)域都要考慮這四樣。
華創(chuàng)資本:作為軟件行業(yè)過去20多年的一個親歷者和觀察者,從Oracle、阿里云到PingCAP,你的技術(shù)和商業(yè)視角有什么轉(zhuǎn)變?對行業(yè)的理解有哪些認知上的變化?
劉松:2007年時,我還在Oracle,但我那個時候就對互聯(lián)網(wǎng)比較感興趣,決定開始寫blog?!安┛汀边@個詞現(xiàn)在已經(jīng)很古老了,但那是我互聯(lián)網(wǎng)原教旨主義的起點,你只有變成一個blogger,寫了三四百篇文章,你才能知道互聯(lián)網(wǎng)是怎樣一個世界,我的網(wǎng)感就是那個時候培養(yǎng)出來的。
我當時算是外企IT人里面一直在關(guān)注互聯(lián)網(wǎng)技術(shù)和模式的,當時我就認為互聯(lián)網(wǎng)是先進生產(chǎn)力。后來“棱鏡門”事件發(fā)生,再加上公有云已經(jīng)開始,我覺得應(yīng)該靠近一個互聯(lián)網(wǎng)公司,所以后來就去了阿里云,讓我對互聯(lián)網(wǎng)積累了很多Know-How。
這幾段職業(yè)經(jīng)歷,讓我意識到公有云始終是所有新一代IT技術(shù)的集大成者,哪怕AI,也要基于云才能有力量。因為某種意義上講,大模型要做Agent,也需要用底層的云資源,要用數(shù)據(jù)、開發(fā)工具、算力、GPU等。
云最大的價值,就是回到互聯(lián)網(wǎng)原教旨主義,相信一個絕對低的門檻,通過網(wǎng)絡(luò)的東西會帶來奇跡。所以過去十年,其實是公有云推動了整個中國互聯(lián)網(wǎng)的發(fā)展和全球化。
華創(chuàng)資本:你覺得數(shù)據(jù)庫行業(yè)未來最重要的技術(shù)上的拐點可能會是什么?
劉松:從云的角度,放眼全球,Serverless肯定是一個關(guān)鍵的技術(shù),它會越來越普及,因為它符合未來更靈活、更高擴展性的一體化的消費模式;第二,是AI與數(shù)據(jù)庫的結(jié)合,Data+AI,尤其是DataAgent,肯定是未來非常關(guān)鍵的賽道,它甚至獨立于數(shù)據(jù)庫本身;最后一點就是數(shù)據(jù)庫未來的形態(tài),5年以后的數(shù)據(jù)庫,是不是能很好地服務(wù)Agent,我覺得這幾個是未來最關(guān)鍵的拐點。
推薦十五本好看刺激的極品爽文,得到書友的認同,希望你能喜歡!
16本完結(jié)精品爆兵流小說,英雄無敵、騎砍、全戰(zhàn)、星際、亡靈……
5本完結(jié)文:諸侯三國、黑暗武俠、騎砍領(lǐng)主、修仙諸天、全面戰(zhàn)爭