黃雯堅(jiān)
上月,開(kāi)源列式數(shù)據(jù)庫(kù)廠商ClickHouse宣布完成3.5億美元C輪融資,該輪融資后值達(dá)到63.5億美元,幾乎翻了三倍,引發(fā)了業(yè)內(nèi)一輪不小震動(dòng)。
不光在于融資與估值高低,還在于ClickHouse所在的賽道——AI時(shí)代的大數(shù)據(jù)分析和存儲(chǔ),該領(lǐng)域的客戶需求正日益高漲,同時(shí)對(duì)數(shù)據(jù)庫(kù)的要求也在全面升級(jí)。
ClickHouse作為一款開(kāi)源列式數(shù)據(jù)庫(kù),在處理該類數(shù)據(jù)時(shí)表現(xiàn)出的顯著優(yōu)勢(shì),不僅力壓同類型的列式數(shù)據(jù)庫(kù),也讓云數(shù)倉(cāng)獨(dú)角獸Snowflake,以及老牌大廠產(chǎn)品Redshift、BigQuery等有了一絲緊張之感。
ClickHouse脫胎于俄羅斯第一大搜索引擎Yandex的開(kāi)源項(xiàng)目,于2021年正式獨(dú)立為商業(yè)化公司。如今,ClickHouse發(fā)展勢(shì)頭正盛,通過(guò)向客戶收取云托管費(fèi)用,其業(yè)務(wù)在過(guò)去一年增長(zhǎng)超過(guò)300%,服務(wù)企業(yè)客戶超過(guò)2000家,覆蓋金融科技、交通、消費(fèi)者和醫(yī)療保健等多個(gè)行業(yè)。最近的一些客戶包括AI初創(chuàng)公司Anthropic、特斯拉,以及阿根廷最大電商MercadoLibre等。另?yè)?jù)外媒可參考消息,ClickHouse在第一季度末時(shí)的年經(jīng)常性收入已達(dá)到7000萬(wàn)美元,年化營(yíng)收運(yùn)行率接近1億美元。
ClickHouse越來(lái)越成為一家不可忽視的數(shù)據(jù)庫(kù)廠商。不過(guò),對(duì)于ClickHouse的發(fā)展勢(shì)頭,首先會(huì)存在一個(gè)疑問(wèn):為什么是此時(shí)?以及ClickHouse的市場(chǎng)前景如何?
技術(shù)即是成本護(hù)城河
相對(duì)于行存儲(chǔ)的傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù),列式數(shù)據(jù)庫(kù)意味著數(shù)據(jù)保存在類似電子表格的行、列中,這種列式架構(gòu)可顯著加快分析型任務(wù)的速度。在數(shù)據(jù)處理過(guò)程中,數(shù)據(jù)庫(kù)系統(tǒng)需要同時(shí)從多個(gè)存儲(chǔ)區(qū)域檢索數(shù)據(jù),而數(shù)據(jù)訪問(wèn)速度會(huì)顯著受到存儲(chǔ)位置的影響——從相鄰區(qū)域讀取數(shù)據(jù)的速度要遠(yuǎn)快于從分散區(qū)域讀取。
ClickHouse從設(shè)計(jì)之初就充分利用了這一特性來(lái)優(yōu)化查詢性能。它將同一列的數(shù)據(jù)盡可能存儲(chǔ)在相鄰的物理區(qū)域,這種存儲(chǔ)布局使得列數(shù)據(jù)能夠被連續(xù)讀取,大幅減少了尋址時(shí)間,從而顯著提升掃描效率。這種設(shè)計(jì)特別適合分析型查詢場(chǎng)景,因?yàn)檫@類查詢通常需要快速訪問(wèn)大量列數(shù)據(jù)。
筆者此前與數(shù)據(jù)庫(kù)專家交流獲得一個(gè)觀點(diǎn)是,數(shù)據(jù)驅(qū)動(dòng)的分析應(yīng)用越來(lái)越普遍,要求數(shù)據(jù)庫(kù)技術(shù)棧實(shí)現(xiàn)統(tǒng)一架構(gòu)。在此之前,這些技術(shù)棧彼此獨(dú)立,如MySQL+Teradata+ElasticSearch等多個(gè)系統(tǒng)搭積木的模式,這個(gè)架構(gòu)最大的問(wèn)題在于過(guò)于復(fù)雜,需要搭建一個(gè)集群來(lái)完成數(shù)據(jù)分析的能力,搭建與維護(hù)成本較高。
具體而言,如開(kāi)源的MySQL,這類事務(wù)型數(shù)據(jù)庫(kù)面向OLTP場(chǎng)景設(shè)計(jì),社區(qū)研發(fā)方向側(cè)重于加強(qiáng)其事務(wù)處理的能力,一般無(wú)法擴(kuò)展以應(yīng)對(duì)處理大量、復(fù)雜查詢所需要的分析型任務(wù)。傳統(tǒng)數(shù)倉(cāng)針雖內(nèi)部批量處理密集型用例進(jìn)行了優(yōu)化,但并發(fā)性有限且性能較慢。而類似于ElasticSearch的傳統(tǒng)搜索引擎技術(shù),對(duì)于非結(jié)構(gòu)化數(shù)據(jù)分析而言成本高昂,包括存儲(chǔ)和計(jì)算資源的占用增加,以及無(wú)法實(shí)現(xiàn)快速精準(zhǔn)檢索等因素,限制了其實(shí)際應(yīng)用范圍。
ClickHouse提供了一個(gè)專門的解決方案來(lái)彌補(bǔ)差距——將高性能分析與當(dāng)今智能數(shù)據(jù)驅(qū)動(dòng)應(yīng)用所需的可擴(kuò)展性和并發(fā)性相結(jié)合。作為高性能列式存儲(chǔ),ClickHouse能夠以極低的延遲在海量數(shù)據(jù)集上執(zhí)行交互式分析查詢,非常適合于支持AI和機(jī)器學(xué)習(xí)應(yīng)用,以及實(shí)時(shí)分析、可觀測(cè)性等任務(wù)。
蹭上AI東風(fēng)
除了技術(shù)架構(gòu)的創(chuàng)新,ClickHouse的發(fā)展也離不開(kāi)市場(chǎng)與客戶需求的變化。由于企業(yè)不再只是構(gòu)建BI或批量報(bào)告,而是希望搭建一個(gè)實(shí)時(shí)的智能數(shù)據(jù)平臺(tái),并且同時(shí)為人類和AIAgent所調(diào)取。結(jié)合當(dāng)前AIAgent的設(shè)計(jì)思路,由于生成查詢的速度遠(yuǎn)超人類,面向其設(shè)計(jì)的數(shù)據(jù)平臺(tái)/數(shù)據(jù)庫(kù)必須具備低延遲響應(yīng)、支持交互式分析查詢的能力,同時(shí)還要有更高的吞吐量,以滿足其高效處理數(shù)據(jù)的要求。
以近期大熱的AI編程為例。盡管多數(shù)AI編程助手推出時(shí)間不長(zhǎng),但開(kāi)發(fā)者留存率依然較高。據(jù)研究公司Indagari數(shù)據(jù)顯示,至少72%訂閱了編程助手Cursor的用戶在六個(gè)月后仍繼續(xù)付費(fèi);超過(guò)20%的用戶訂閱了多個(gè)編程助手,且這一比例還在不斷增長(zhǎng)。高留存率反映的是AI編程的強(qiáng)粘性,這也意味著企業(yè)應(yīng)用開(kāi)發(fā)速度正借AI之勢(shì)迎來(lái)快速增長(zhǎng)。
AI需要能夠快速釋放數(shù)據(jù)價(jià)值的數(shù)據(jù)基礎(chǔ)設(shè)施,這件事情已變得緊迫。
近期,ClickHouse分享了Anthropic應(yīng)用其數(shù)據(jù)庫(kù)解決方案的經(jīng)歷。Anthropic團(tuán)隊(duì)技術(shù)人員給了ClickHouse非常高的評(píng)價(jià):“ClickHouse在幫助我們開(kāi)發(fā)和發(fā)布Claude4方面發(fā)揮了重要作用?!睋?jù)其所述,訓(xùn)練高級(jí)模型需要持續(xù)了解性能指標(biāo)和系統(tǒng)行為,ClickHouse在實(shí)時(shí)分析數(shù)據(jù)的速度和靈活性非常高。
對(duì)于Anthropic而言,有三點(diǎn)核心訴求:一是實(shí)時(shí)采集海量數(shù)據(jù),對(duì)半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行快速、多維度分析;二是部署安全;三是可擴(kuò)展性,能與市面上的可觀測(cè)性工具實(shí)現(xiàn)良好兼容。但ClickHouse的開(kāi)源版本并不能完全滿足其上述需求,為此Anthropic選擇在內(nèi)部部署了隔離的ClickHouseCloud云產(chǎn)品。從控制平臺(tái)到數(shù)據(jù)平臺(tái),實(shí)現(xiàn)內(nèi)部隔離。
Anthropic在探索智能分析Agent(agenticanalytics)領(lǐng)域,通過(guò)引入ClickHouse的MCP服務(wù)器,Anthropic可以將其模型(例如AI編程工具ClaudeCode)直接連接到ClickHouse。這意味著,Agent可以通過(guò)編程方式查詢指標(biāo)、詢問(wèn)、檢索答案,而無(wú)需編寫傳統(tǒng)的查詢語(yǔ)言。
一些投資人士指出,在AI興起、市場(chǎng)對(duì)數(shù)據(jù)庫(kù)軟件需求高漲的當(dāng)下,ClickHouse可能會(huì)與Snowflake競(jìng)爭(zhēng),比方說(shuō)ClickHouse的實(shí)時(shí)分析能力會(huì)優(yōu)于Snowflake。雖然有些客戶想要Snowflake提供的“花哨功能”,但ClickHouse速度更快,更便宜,且專注于實(shí)時(shí)分析。
業(yè)內(nèi)將ClickHouse與Snowflake、Redshift、BigQuery反復(fù)拿來(lái)對(duì)比的一個(gè)核心因素,還在于成本。
一些人士認(rèn)為,ClickHouse能夠以25%-40%的成本提供相同或更優(yōu)的性能,基本可以取代Snowflake和BigQuery。比如Snowflake在計(jì)算方面往往相對(duì)昂貴,而B(niǎo)igQuery的按需查詢模型在處理大量數(shù)據(jù)掃描時(shí)可能會(huì)變得昂貴。早在2023年,ClickHouse就曾公開(kāi)發(fā)表言論稱,Snowflake等云數(shù)倉(cāng)產(chǎn)品在滿足客戶需求和性價(jià)比上存在的挑戰(zhàn)。
如今,ClickHouse同樣將市場(chǎng)目光放到了Agent領(lǐng)域。據(jù)ClickHouse首席執(zhí)行官AaronKatz的描述,隨著Agent在數(shù)據(jù)驅(qū)動(dòng)型應(yīng)用、可觀測(cè)、數(shù)據(jù)基礎(chǔ)設(shè)施等領(lǐng)域的蓬勃發(fā)展,像ClickHouse這類面向Agent的數(shù)據(jù)庫(kù)需求已經(jīng)達(dá)到一個(gè)轉(zhuǎn)折點(diǎn)。分析的未來(lái)不僅僅是報(bào)表,而是能夠解讀數(shù)據(jù)、出發(fā)工作流并支持實(shí)時(shí)決策Agent。
一些投資人士認(rèn)為,隨著開(kāi)發(fā)人員轉(zhuǎn)向Agent,即Agent可以通過(guò)客戶瀏覽器或企業(yè)應(yīng)用執(zhí)行復(fù)雜任務(wù),ClickHouse將迎來(lái)更高的需求。
這點(diǎn)也成為風(fēng)投追捧ClickHouse作為下一個(gè)Snowflake繼任者的關(guān)鍵點(diǎn)。畢竟,在數(shù)據(jù)庫(kù)領(lǐng)域,能夠快速發(fā)展的初創(chuàng)型軟件公司,不多了。
三位創(chuàng)始人:CEOAaronKatz;CTOAlexeyMilovidov;產(chǎn)品YuryIzrailevsky
回顧C(jī)lickHouse的發(fā)展,該公司始于俄羅斯科技巨頭Yandex的內(nèi)部需求。2009年,為了高效處理Yandex.Metrica搜索引擎的海量數(shù)據(jù)分析任務(wù),Yandex團(tuán)隊(duì)開(kāi)始研發(fā)一款高性能列式數(shù)據(jù)庫(kù),這便是ClickHouse的雛形。經(jīng)過(guò)多年內(nèi)部?jī)?yōu)化,2016年Yandex將其開(kāi)源,憑借卓越的查詢速度和對(duì)大規(guī)模數(shù)據(jù)分析的天然優(yōu)勢(shì),ClickHouse迅速在開(kāi)發(fā)者社區(qū)走紅,成為OLAP領(lǐng)域的明星項(xiàng)目。
隨著開(kāi)源生態(tài)的壯大,ClickHouse的核心團(tuán)隊(duì)在2021年從Yandex獨(dú)立,并獲得了硅谷風(fēng)投的青睞。公司成立后,團(tuán)隊(duì)在保持開(kāi)源版本活力的同時(shí),開(kāi)始推進(jìn)商業(yè)化,于2022年推出ClickHouseCloud托管服務(wù),并完成數(shù)輪融資,估值一度飆升至20億美元。
古詩(shī)詞中的情思:字字不提相思,句句都是心動(dòng)
平生不會(huì)相思,才會(huì)相思,便害相思。身似浮云,心如飛絮,氣若游絲_。空一縷余香在此,盼千金游子何之。證候來(lái)時(shí),正是何時(shí)? 燈半昏時(shí),月半明時(shí)。全曲描寫一位年輕女子的相思之情,首三句說(shuō)少女陷入了不能自拔的相思之?。淮稳錁O表少女處于相思中的病態(tài)心理與神情舉止;后二句則點(diǎn)出少女害相思病的原因;最后等我繼續(xù)說(shuō)。
10首唯美相思宋詞,穿越千年時(shí)光,一眼美到窒息
平生不會(huì)相思,才會(huì)相思,便害相思。出自元代徐再思《折桂令·春情》平生不會(huì)相思,才會(huì)相思,便害相思。身似浮云,心如飛絮,氣若游絲--??找豢|余香在此,盼千金游子何之_|。證候來(lái)時(shí),正是何時(shí)?燈半昏時(shí),月半明時(shí)--。全詩(shī)大意如下:生下來(lái)以后還不會(huì)相思,才會(huì)相思,便害了相思--。身像飄浮的云,心像紛飛的柳絮,..
“不會(huì)相思,才會(huì)相思,便害相思”,似曾相識(shí),塵封已久
多少的繁華風(fēng)光,卻仍免不了心底的一縷清苦,這才是世間的真相啊——-。人們常將苦苦的蓮心來(lái)形容相思之苦,愛(ài)人最怕分離,再見(jiàn)無(wú)期,而相思最怕被辜負(fù)??扇裟愣覒z我,又何懼世間千難萬(wàn)苦?紅粉靚梳妝,翠蓋低風(fēng)雨。占斷人間六月涼,期月鴛鴦浦。根底藕絲長(zhǎng),花里蓮心苦。只為風(fēng)流有許愁,更襯佳人步?!?.
來(lái)源:紅網(wǎng)
作者:虢咸
編輯:褒秋寒
本文為紅辣椒評(píng)論 原創(chuàng)文章,僅系作者個(gè)人觀點(diǎn),不代表紅網(wǎng)立場(chǎng)。轉(zhuǎn)載請(qǐng)附原文出處鏈接和本聲明。