聞樂發(fā)自凹非寺量子位|公眾號QbitAI
地球的ChatGPT時刻來了!
谷歌DeepMind推出AlphaEarthFoundations模型(下面簡稱AEF),實(shí)現(xiàn)高精度繪制地球。
諾獎得主、谷歌DeepMind首席執(zhí)行官DemisHassabis表示:它將為科學(xué)家提供近乎實(shí)時的地球觀測。
該模型主要是解決了數(shù)據(jù)過載信息不一致兩大難題。簡單來說就是觀測數(shù)據(jù)多但高質(zhì)量標(biāo)注數(shù)據(jù)少,給繪制全球地圖帶來困難。
AEF就像一個虛擬衛(wèi)星,整合了光學(xué)衛(wèi)星圖像、氣候模擬等PB級的海量地球觀測數(shù)據(jù),能夠利用多源、離散的數(shù)據(jù)生成通用的地理空間表示,讓科學(xué)家能夠按需創(chuàng)建地球地圖,毫不費(fèi)力實(shí)現(xiàn)全球測繪和監(jiān)測。
由它生成的衛(wèi)星嵌入數(shù)據(jù)集現(xiàn)已被聯(lián)合國糧農(nóng)組織、哈佛森林等超50個全球組織使用。
實(shí)際上,不只是科學(xué)家,普通人也能通過AlphaEarthFoundations輕松讀懂地球的變化。
從大航海時代到現(xiàn)代,人類花了500年時間繪制地球,而現(xiàn)在AEF的出現(xiàn)讓每天重新繪制地球成為現(xiàn)實(shí)。
這讓前谷歌地圖方面的研究員BilawalSidhu驚呼:谷歌朝著構(gòu)建地球版ChatGPT邁出了重要一步。
來看看它是怎么做到的。
高精度追蹤地球多源信息融合,對時間連續(xù)建模
現(xiàn)在有衛(wèi)星、雷達(dá)、無人機(jī)、氣象站等無數(shù)設(shè)備,每天都在收集地球的圖像、溫度、濕度、地形等數(shù)據(jù)。
但不同國家、機(jī)構(gòu)對于觀測數(shù)據(jù)的標(biāo)注標(biāo)準(zhǔn)可能不一樣,并且地球表面隨時在變化(比如森林被砍伐),但實(shí)地標(biāo)注往往幾年才更新一次,導(dǎo)致標(biāo)注數(shù)據(jù)和實(shí)際情況脫節(jié)。
簡單來說,地球觀測數(shù)據(jù)就像“拍了無數(shù)張地球的照片”,但知道“照片里具體是什么”的標(biāo)注卻很少,這直接卡住了全球地圖的繪制精度和效率。
而AEF的價值,就在于它能在標(biāo)注稀少的情況下,依然用好海量觀測數(shù)據(jù),畫出更準(zhǔn)確的地圖
AEF是一種嵌入場模型,核心是時空精度編碼器(STP),STP通過空間自注意力捕捉地理上的遠(yuǎn)距離關(guān)聯(lián),通過時間軸自注意力解析時序動態(tài),再結(jié)合卷積操作保留局部精細(xì)特征。
通俗一點(diǎn)說就是把地球表面的復(fù)雜信息(如地形、植被、氣候等)壓縮成一組“數(shù)字密碼”(嵌入向量),這些密碼能精準(zhǔn)反映地球表面的時空特征,既能看全局又能抓細(xì)節(jié)。
AEF的另一大創(chuàng)新是對時間的連續(xù)建模能力
它將觀測數(shù)據(jù)的支持期(數(shù)據(jù)實(shí)際采集的時間范圍)與地圖生成的有效期(需要映射的時間范圍)分離,即使在有效期內(nèi)沒有直接觀測數(shù)據(jù),也能通過插值或外推生成連續(xù)的結(jié)果。
比如,如果只有2018年和2020年的衛(wèi)星圖像,模型能可靠推測出2019年某地區(qū)的地表狀態(tài),這解決了傳統(tǒng)模型只能處理固定時間點(diǎn)數(shù)據(jù)的局限。
在數(shù)據(jù)處理上,AEF實(shí)現(xiàn)了多源信息的深度融合
它能接收光學(xué)衛(wèi)星、雷達(dá)、激光雷達(dá)、氣候數(shù)據(jù)甚至地理文本等10多種輸入,打破了數(shù)據(jù)類型的壁壘。通過統(tǒng)一的編碼方式將這些不同類型、不同分辨率的數(shù)據(jù)轉(zhuǎn)化為可兼容的特征。
例如,光學(xué)圖像的植被顏色、雷達(dá)的地表結(jié)構(gòu)信息、氣象站的溫度數(shù)據(jù),都會被整合到同一個嵌入向量中,這個向量僅64字節(jié)
模型的訓(xùn)練機(jī)制也頗具特色。它采用師生模型和對比學(xué)習(xí)策略。同時,引入文本對齊訓(xùn)練,將地理文本描述與對應(yīng)區(qū)域的嵌入向量關(guān)聯(lián),進(jìn)一步豐富特征的語義信息。
最終,AEF生成的嵌入場以10x10米方格形式精確分析地球陸地和沿海水域,同時為每個方格創(chuàng)建高度緊湊摘要,存儲空間需求僅為其他AI系統(tǒng)的十六分之一,降低了分析成本。
并且這些嵌入向量無需重新訓(xùn)練就可直接用于各類映射任務(wù),無論是土地覆蓋分類、農(nóng)作物識別還是森林變化檢測,都能通過簡單的遷移學(xué)習(xí)實(shí)現(xiàn)高精度結(jié)果。
卓越性能
與傳統(tǒng)方法和其他AI測繪系統(tǒng)相比,AEF在不同時間段執(zhí)行多種任務(wù)時,包括識別土地利用和估算地表屬性等,始終保持最高準(zhǔn)確性。
例如在某土地覆蓋分類任務(wù)中,AEF的平衡準(zhǔn)確率達(dá)0.82,而次優(yōu)模型僅0.69。
AEF尤其在標(biāo)簽數(shù)據(jù)稀缺場景下表現(xiàn)出色,平均錯誤率比測試模型低24%,展現(xiàn)出卓越的學(xué)習(xí)效率。
從具體應(yīng)用場景來看,AEF在主題映射(如土地覆蓋分類)、生物物理變量估計(jì)和變化檢測中表現(xiàn)全面。
例如,在年度土地覆蓋變化識別中,它能精準(zhǔn)區(qū)分森林、農(nóng)田、城市等類型,對細(xì)微變化的捕捉誤差遠(yuǎn)低于傳統(tǒng)方法。
衛(wèi)星嵌入數(shù)據(jù)集
在谷歌地球引擎中,由AEF驅(qū)動的衛(wèi)星嵌入數(shù)據(jù)集是同類規(guī)模中最大的數(shù)據(jù)集之一,每年包含超過1.4萬億個潛入足跡。目前已在EarthEngine數(shù)據(jù)目錄發(fā)布。
這一系列年度嵌入數(shù)據(jù)已被全球多個組織采用,其中包括聯(lián)合國糧食及農(nóng)業(yè)組織、哈佛森林、地球觀測組織等。它們借助該數(shù)據(jù)集制作功能強(qiáng)大的自定義地圖。
例如,“全球生態(tài)系統(tǒng)地圖集”這一項(xiàng)目旨在打造首個全面資源,用于繪制和監(jiān)測全球生態(tài)系統(tǒng)。該項(xiàng)目正利用此數(shù)據(jù)集幫助各國將未測繪的生態(tài)系統(tǒng)劃分為海岸灌叢、極端干旱沙漠等類別。
全球生態(tài)系統(tǒng)地圖集全球科學(xué)負(fù)責(zé)人NickMurray說:
衛(wèi)星嵌入數(shù)據(jù)集正在徹底改變我們的工作,它幫助各國繪制未知生態(tài)系統(tǒng)的地圖——這對于精準(zhǔn)定位保護(hù)工作的重點(diǎn)區(qū)域至關(guān)重要。
下圖是展示衛(wèi)星嵌入數(shù)據(jù)集從粗到精的分割的無監(jiān)督聚類動畫
巴西MapBiomas團(tuán)隊(duì)正在測試該數(shù)據(jù)集,以更深入地了解全國范圍內(nèi)的農(nóng)業(yè)和環(huán)境變化,它為亞馬遜雨林等關(guān)鍵生態(tài)系統(tǒng)的保護(hù)策略和可持續(xù)發(fā)展舉措提供了重要依據(jù)。
AEF還有助于解決糧食安全、森林砍伐和水資源等關(guān)鍵問題。
對此,有網(wǎng)友表示:人工智能模型正在成為公共基礎(chǔ)設(shè)施。
畢竟,看懂地球才能更好保護(hù)它。
論文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/alphaearth-foundations.pdf
[1]https://deepmind.google/discover/blog/alphaearth-foundations-helps-map-our-planet-in-unprecedented-detail/[2]https://x.com/GoogleDeepMind/status/1950563700286398965[3]https://x.com/demishassabis/status/1950667643771326784[4]https://x.com/bilawalsidhu/status/1950580970907648234
—完—
4本作者文筆超好只看了一眼就淪陷的小說,忍不住熬夜一口氣看完
DNF:狂戰(zhàn)士、劍魂、鬼泣105級史詩武器如何選擇?傷害高才是硬道理
DNF:黑鴉之境專屬神話推薦!5件CD流神話崛起,重振續(xù)航榮光??莽夫...