AI推動單片SoC專向多芯片。
先進(jìn)封裝正在成為高端手機(jī)市場的關(guān)鍵差異化因素,與片上系統(tǒng)相比,它能夠?qū)崿F(xiàn)更高的性能、更大的靈活性和更快的上市時間。
單片SoC憑借其外形尺寸、成熟的經(jīng)驗和較低的成本,很可能仍將是中低端移動設(shè)備的首選技術(shù)。但多芯片組件提供了更大的靈活性,這對于AI推理以及跟上AI模型和通信標(biāo)準(zhǔn)的快速變化至關(guān)重要。最終,OEM廠商和芯片制造商必須確定如何在設(shè)計周期內(nèi)適應(yīng)變化,以及瞄準(zhǔn)哪些細(xì)分市場。
新思科技移動、汽車和消費(fèi)IP產(chǎn)品管理執(zhí)行總監(jiān)兼MIPI聯(lián)盟主席HeziSaar表示:“不受手機(jī)制造商束縛的SoC供應(yīng)商必須追求具有AI功能的物聯(lián)網(wǎng)SoC低端功能,而這款產(chǎn)品肯定是單片的。如果他們需要進(jìn)軍移動領(lǐng)域的中端市場,那么其功能將比物聯(lián)網(wǎng)更高。它也可能是單片SoC,并可能通過多芯片技術(shù)進(jìn)行擴(kuò)展。當(dāng)你走向高端時,很明顯你不能只采用單片技術(shù)。你需要具備制造多芯片的能力,以適應(yīng)即將發(fā)生的變化和快速的上市時間,因為這才是他們真正賺錢的地方?!?/p>
換句話說,目標(biāo)市場決定了架構(gòu)?!拔覀兛吹蕉嘈酒?D技術(shù)大勢所趨,移動領(lǐng)域也在采用這種技術(shù),但其發(fā)展速度比NVIDIA或AMD的HPC芯片要慢得多,后者在3D和2.5D技術(shù)上投入巨大,系統(tǒng)上多達(dá)12個芯片,”Ansys產(chǎn)品營銷總監(jiān)MarcSwinnen表示?!暗投艘苿釉O(shè)備無法做到這一點(diǎn)。這主要是成本問題。他們必須專注于將盡可能多的功能集成到小尺寸的單芯片中,并實現(xiàn)低功耗和高速度?!?/p>
據(jù)英飛凌稱,單片SoC包含在單個硅片上運(yùn)行系統(tǒng)所需的所有組件,可能包括具有一個或多個處理器內(nèi)核的嵌入式微控制器;內(nèi)存系統(tǒng),如RAM或ROM;外部接口,如電纜端口(USB、HDMI);無線通信(WiFi、藍(lán)牙);圖形處理單元(GPU);以及其他組件,如模擬/數(shù)字轉(zhuǎn)換器、電壓調(diào)節(jié)器和內(nèi)部接口總線。
盡管體積小巧(通常也正因如此),單片SoC卻極其高效,其單處理器性能通常優(yōu)于更復(fù)雜的系統(tǒng)。信號傳輸距離短,驅(qū)動這些信號所需的功率更低,而且只需一個簡單的散熱器即可散熱。許多物聯(lián)網(wǎng)SoC供應(yīng)商都采用單片策略,因為這可以為客戶節(jié)省封裝和集成成本。
Synaptics低功耗邊緣AI高級產(chǎn)品經(jīng)理AnandaRoy表示:“雖然我們很難做到,但把所有功能都放在一個芯片上總是更好的。這為我們帶來了競爭優(yōu)勢,因為我們的一些物聯(lián)網(wǎng)競爭對手把兩個芯片放在一個封裝中,堆疊起來,或者并排放置,并稱之為單芯片解決方案。但實際上,它們只是一個封裝中的兩個不同的芯片。我們有意識地嘗試轉(zhuǎn)向單芯片解決方案,因為從客戶的角度來看,它更容易集成,也更容易融入他們的硬件系統(tǒng)設(shè)計中。我們基本上在單個芯片上構(gòu)建了多種技術(shù)?!?/p>
在高端移動市場,情況則截然不同。該市場使用多個芯片組來提升性能,并使用更多互連來降低電阻和電容。Cadence計算解決方案事業(yè)部高級產(chǎn)品總監(jiān)MickPosner表示:“在這種情況下,計算引擎通過高性能水平芯片間接口和先進(jìn)的封裝技術(shù)進(jìn)行‘鏡像’和連接,以擴(kuò)展計算處理能力。從技術(shù)上講,這可以擴(kuò)展到在3D-IC堆棧中垂直擴(kuò)展芯片的處理能力,從而實現(xiàn)更高的互連帶寬?!?/p>
多芯片組件還能實現(xiàn)計算單元的更大多樣性,包括CPU和GPU的組合,以及高度專業(yè)化的加速器。Posner表示:“3D堆疊并不局限于相同的處理單元。AI或內(nèi)存加速器單元可以成為堆疊的一部分,從而創(chuàng)建高效的特定領(lǐng)域應(yīng)用引擎。利用先進(jìn)的3.5D封裝,還可以使用更傳統(tǒng)的芯片間互連(例如UCIe)水平連接另一個芯片。其他芯片無需與處理節(jié)點(diǎn)位于同一技術(shù)節(jié)點(diǎn)。各種節(jié)點(diǎn)的集成可以在性能和成本之間進(jìn)行權(quán)衡,同時選擇最適合應(yīng)用功能或供應(yīng)鏈彈性的節(jié)點(diǎn)?!?/p>
在千禧年的最初幾十年里,移動市場推動了許多尖端技術(shù)的發(fā)展。然而,隨著finFET時代平面微縮優(yōu)勢的減弱、SRAM無法微縮以及云端對海量計算能力的需求不斷增長,系統(tǒng)公司從單片SoC轉(zhuǎn)向了2.5D系統(tǒng),通過中介層連接多個芯片。雖然移動市場在工藝微縮方面仍處于領(lǐng)先地位,但高端移動市場已經(jīng)超越了這一水平,擴(kuò)展到多芯片組裝——盡管目前尚不清楚移動設(shè)備是否會采用3D-IC,因為它們需要某種先進(jìn)的冷卻系統(tǒng),而這在當(dāng)今的移動設(shè)備中并不實用。
Synopsys的Saar表示:“2.5D速度非???,效率極高,而且距離極短,因此功耗非常高。這些芯片可以采用不同的工藝制造。這個芯片可以是2nm(基礎(chǔ)芯片),而AI加速器可以是其他芯片。它們非常靈活?!?/p>
高端移動設(shè)備正在向2nm全柵(GAA)制造工藝邁進(jìn),以實現(xiàn)高性能,但這種工藝成本高昂且生產(chǎn)時間冗長。Saar表示:“GAA工藝需要X個月才能從晶圓廠返回。你需要壓縮所有這些時間,這是最大的挑戰(zhàn)。你正在流片的東西在過去是值得量產(chǎn)的。這一次,你知道你至少需要再進(jìn)行一次流片,而且在你進(jìn)行流片的同時,規(guī)格可能還會再次演變。我原先認(rèn)為我需要70億個參數(shù)?,F(xiàn)在我需要140億個參數(shù),因為手機(jī)的用例已經(jīng)發(fā)生了變化。未來我不知道會是什么樣子,但他們在引入這些功能時需要考慮到這一點(diǎn)。這就是為什么多裸片似乎是解決靈活性、不確定性和規(guī)格持續(xù)演變以及你必須采取的市場風(fēng)險緩解措施的正確答案?!?/p>
Saar指出,每家手機(jī)廠商都可以根據(jù)其想要占領(lǐng)的市場數(shù)量來決定如何部署AI。“你可以集成一個AI加速器,也可以把它放在單獨(dú)的芯片里,也可以是專用芯片,甚至可能是幾個專用的AI加速器。這取決于你想要的性能。假設(shè)我想要一個用于功能手機(jī)的基礎(chǔ)芯片。我添加了一個AI加速器芯片,這相當(dāng)于兩者之間的3D連接?,F(xiàn)在,我又在芯片側(cè)面添加了一個芯片,比如說,用于I/O擴(kuò)展,因為我想進(jìn)軍多媒體市場。現(xiàn)在我需要更多的顯示功能。我需要EDP(電子數(shù)據(jù)處理)。SoC廠商可以將基礎(chǔ)芯片(獨(dú)立的、單片的)賣給功能手機(jī)市場。他們可以添加加速器?,F(xiàn)在它變成了智能手機(jī)配置,他們可以在芯片側(cè)面添加另一個芯片。然后,它就變成了消費(fèi)設(shè)備、超級機(jī)器人或PC,他們可以運(yùn)用所有這些配置,從而進(jìn)軍不同的市場。”
通過將AI加速器放在第二個芯片上,供應(yīng)商可以獲得更好的性能,因為它在仍然使用相同基礎(chǔ)的同時進(jìn)行了優(yōu)化?!艾F(xiàn)在,它不再需要花費(fèi)數(shù)億美元反復(fù)旋轉(zhuǎn)硅片,而是更加穩(wěn)定了,”Saar說。
采用多芯片的另一個原因是考慮到模擬和數(shù)字信號。例如,Synaptics用于可折疊移動OLED顯示屏的觸摸控制器可以區(qū)分握持設(shè)備、口袋撥號、水滴或汗水等情況?!拔覀兊男酒粋€模擬芯片和一個數(shù)字芯片,模擬芯片直接連接到傳感器,數(shù)字芯片處理所有這些信息,”Synaptics產(chǎn)品營銷總監(jiān)SamToba表示。“在數(shù)字芯片內(nèi)部,我們有一個MCU內(nèi)核,之前我們有一個內(nèi)部定制的MCU內(nèi)核,這確實有很多優(yōu)勢。但是一旦涉及到這些可折疊設(shè)備,需要處理的信息量就會變得非常非常大,因此我們決定采用RISC-V。Si-Five的E7是一個非常強(qiáng)大的MCU內(nèi)核,非常適合高水平處理,我們的矢量協(xié)處理器就位于它的外部?!?/p>
然后,AI/ML算法可以判斷環(huán)境并檢測真實的手指觸摸?!拔覀兊男酒B接到觸摸傳感器,檢測所有信號,將模擬信號輸入模擬芯片,然后在數(shù)字芯片上進(jìn)行處理,”Toba說道?!霸摂?shù)字芯片包含E7、Hydra、所有算法和內(nèi)存。一旦芯片確定觸摸是有意義的、有意的,它就會向主機(jī)SoC報告?!?/p>
內(nèi)存和通信的復(fù)雜性
與人工智能一樣,內(nèi)存也在不斷變化,并且會隨著不同的市場而變化。Saar表示,如果一家SoC供應(yīng)商瞄準(zhǔn)所有市場,他們有幾種方法可以實現(xiàn)?!八麄兛梢宰鰡纹酒?。但是,他們?nèi)绾芜m應(yīng)硅片的多次自旋?他們現(xiàn)在有LPDDR6,它已經(jīng)定義好了,但它會繼續(xù)發(fā)展。UFS5.0現(xiàn)在已經(jīng)定義好了,但它會繼續(xù)發(fā)展。那么,他們會再自旋一次2nm硅片嗎?還是會將其限制在其他方面?”
還有各種各樣的網(wǎng)絡(luò)需要考慮。手機(jī)芯片需要足夠靈活,才能支持新的5G/6G協(xié)議,同時繼續(xù)支持舊技術(shù)?!霸趩蝹€系統(tǒng)中支持額外的帶寬會增加數(shù)據(jù)處理的復(fù)雜性,也意味著大量的功耗,所以你必須非常高效地實現(xiàn)它,”弗勞恩霍夫IIS/EAS高效電子部門負(fù)責(zé)人AndyHeinig表示?!胺駝t,一方面,移動設(shè)備會在很短的時間內(nèi)耗盡電池電量。另一方面,你還必須散熱。你有這些多物理場要求,你需要非常高效的加速器、非常高效的DSP實現(xiàn)、數(shù)據(jù)處理等等。這就是為什么每個人都越來越多地談?wù)搶S锰幚砥鞯脑??!?/p>
在前沿設(shè)計中,這在很大程度上涉及芯片集和異構(gòu)集成。在智能手機(jī)的模擬/混合信號領(lǐng)域,這可以幫助抵消多芯片組件帶來的部分額外成本。根據(jù)Cadence的白皮書,這種方法可以“靈活地為IP選擇最佳工藝節(jié)點(diǎn)——尤其是對于SerDesI/O、RF和模擬IP,這些IP無需位于‘核心’工藝節(jié)點(diǎn)上”。
電源、電池和散熱考慮因素
在高端移動市場,供應(yīng)商正在競相支持AI。西門子數(shù)字工業(yè)軟件解決方案網(wǎng)絡(luò)專家RonSquiers表示:“iPhone15和16在板載處理中添加了AI硬件,許多智能和硬件正在硅片級別融入這些芯片中。NVIDIA等其他公司正在打造GPU。Arm正在打造Zen5[CPU],它充當(dāng)平臺上AI硬件的協(xié)調(diào)器。亞馬遜正在開發(fā)他們的Trainium訓(xùn)練和推理芯片,因此超大規(guī)模計算廠商和移動開發(fā)者都在做這件事。”
雖然移動設(shè)備始終需要GPU進(jìn)行圖形處理,但最新版本的GPU也能出色地處理AI工作負(fù)載。例如,ImaginationTechnologies在其E系列GPU中,極大地改變了ALU流水線中工作負(fù)載的調(diào)度和執(zhí)行方式(見下圖5)。
Imagination技術(shù)洞察副總裁KristofBeets表示:“它曾經(jīng)擁有非常復(fù)雜、非常深的流水線,流水線級數(shù)眾多,而且流水線延遲很長。我們一直從一個非常大的寄存器存儲器(GPU中0.5MB大小的SRAM)中持續(xù)提供數(shù)據(jù)——因此,這是一個非常大容量、緊密耦合的大型內(nèi)存。問題是,如果你在每個周期都不斷地從中獲取大量數(shù)據(jù),然后將其推送到這個流水線,并且在每個周期都寫出結(jié)果,那會非常耗電?!?/p>
新設(shè)計采用了更輕量級的流水線,只有兩級流水線,并且可以在本地重用更多數(shù)據(jù)?!拔覀儾粫粩嘣L問龐大的SRAM,而是嘗試重用我們附近的已有數(shù)據(jù)。這些數(shù)據(jù)可以是之前的結(jié)果,也可以是相鄰流水線中的數(shù)據(jù)。因為如果你觀察很多人工智能案例,就會發(fā)現(xiàn)你經(jīng)常會通過一系列處理操作來對數(shù)據(jù)進(jìn)行混洗和傳輸,并從相鄰的流水線中獲取數(shù)據(jù)。”
由此帶來的幀/秒/瓦效率提升可以轉(zhuǎn)化為更長的手機(jī)電池續(xù)航時間。“這可能會影響運(yùn)營成本,但我們在移動領(lǐng)域可以做的另一件有趣的事情是,將額外的功耗節(jié)省轉(zhuǎn)化為更高的時鐘頻率和性能,因為我們可以保持相同的功耗和熱預(yù)算,”Beets說道。
無論設(shè)計師如何實現(xiàn)更佳性能,功耗仍然是一個關(guān)鍵問題?!叭缃?,每個人都對功耗很感興趣,甚至連數(shù)據(jù)中心的人員也不例外,但移動設(shè)備的傳統(tǒng)業(yè)務(wù)歷史更為悠久,而且它們采用電池供電,因此它們在低功耗方面的需求更為突出,”Ansys的Swinnen說道。
除了每日電池續(xù)航時間,手機(jī)制造商還必須考慮電池壽命。手機(jī)的每個方面都會產(chǎn)生影響,包括SIM卡。為此,英飛凌開發(fā)了一款微型28納米eSIM卡,其功耗遠(yuǎn)低于傳統(tǒng)SIM卡。eSIM卡允許用戶輕松切換不同的服務(wù)提供商,同時由于無需物理訪問,制造商在設(shè)計方面也更加靈活。
結(jié)論
手機(jī)供應(yīng)商根據(jù)他們所針對的價格層級以及他們現(xiàn)在或?qū)硐胍獙崿F(xiàn)的AI功能和通信標(biāo)準(zhǔn),采取不同的芯片設(shè)計方法。
Synopsys的Saar指出,設(shè)計決策通常歸結(jié)于商業(yè)原因?!斑@就像你問為什么一個特定的標(biāo)準(zhǔn)會流行起來,而不是一個技術(shù)上可能更優(yōu)越的標(biāo)準(zhǔn)。原因有很多,現(xiàn)在這個或那個并不重要。如果一家供應(yīng)商控制著整個垂直產(chǎn)業(yè)鏈,他們就不必使用標(biāo)準(zhǔn)的現(xiàn)成的虛擬制作(VP)攝像頭接口或任何存儲接口。他們可以創(chuàng)建自己的接口,即使質(zhì)量較差。在他們看來,他們可以獲得各種程度的利益,也許是更高水平的集成和卓越的運(yùn)營?!?/p>
與此同時,許多新進(jìn)入者正在這個競爭激烈的細(xì)分市場中開辟自己的道路?!八麄冞^去只做手機(jī),現(xiàn)在也做SoC,”Saar說道。“對他們來說,情況完全不同。他們可以進(jìn)行不同的優(yōu)化。他們不必涉足廣泛領(lǐng)域,因為他們只關(guān)心自己的手機(jī)。他們只關(guān)心自己的用例。有些公司在整個市場,而不僅僅是移動市場,都擁有AI地位。我們正在制定超越硬件的企業(yè)戰(zhàn)略或全球戰(zhàn)略。也許混合戰(zhàn)略對他們來說確實有意義,因為我希望手機(jī)能夠連接到云端的AI引擎,因為現(xiàn)在我有了差異化。你買我的手機(jī),你連接到我的云端,你連接到我的電子郵件。一般的SoC沒有這些。他們賣的是硬件。”
*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個人觀點(diǎn),我方轉(zhuǎn)載僅為分享與討論,不代表我方贊成或認(rèn)同,如有異議,請聯(lián)系后臺。
想要獲取半導(dǎo)體產(chǎn)業(yè)的前沿洞見、技術(shù)速遞、趨勢解析,關(guān)注我們!
獨(dú)家好書《穿梭時空的俠客》,亂我心者,皆是浮云!
熱血巨作《穿梭時空的俠客》,不做咸魚,從崇拜神一樣的偶像起步!
穿梭時空的俠客,身份角色不停變換,在諸天萬界綻放俠之光芒