挑戰(zhàn)!你可能不認(rèn)識(shí)我但一定聽過我的歌~
AI推動(dòng)單片SoC專向多芯片。
先進(jìn)封裝正在成為高端手機(jī)市場(chǎng)的關(guān)鍵差異化因素,與片上系統(tǒng)相比,它能夠?qū)崿F(xiàn)更高的性能、更大的靈活性和更快的上市時(shí)間。
單片SoC憑借其外形尺寸、成熟的經(jīng)驗(yàn)和較低的成本,很可能仍將是中低端移動(dòng)設(shè)備的首選技術(shù)。但多芯片組件提供了更大的靈活性,這對(duì)于AI推理以及跟上AI模型和通信標(biāo)準(zhǔn)的快速變化至關(guān)重要。最終,OEM廠商和芯片制造商必須確定如何在設(shè)計(jì)周期內(nèi)適應(yīng)變化,以及瞄準(zhǔn)哪些細(xì)分市場(chǎng)。
新思科技移動(dòng)、汽車和消費(fèi)IP產(chǎn)品管理執(zhí)行總監(jiān)兼MIPI聯(lián)盟主席HeziSaar表示:“不受手機(jī)制造商束縛的SoC供應(yīng)商必須追求具有AI功能的物聯(lián)網(wǎng)SoC低端功能,而這款產(chǎn)品肯定是單片的。如果他們需要進(jìn)軍移動(dòng)領(lǐng)域的中端市場(chǎng),那么其功能將比物聯(lián)網(wǎng)更高。它也可能是單片SoC,并可能通過多芯片技術(shù)進(jìn)行擴(kuò)展。當(dāng)你走向高端時(shí),很明顯你不能只采用單片技術(shù)。你需要具備制造多芯片的能力,以適應(yīng)即將發(fā)生的變化和快速的上市時(shí)間,因?yàn)檫@才是他們真正賺錢的地方。”
換句話說,目標(biāo)市場(chǎng)決定了架構(gòu)?!拔覀兛吹蕉嘈酒?D技術(shù)大勢(shì)所趨,移動(dòng)領(lǐng)域也在采用這種技術(shù),但其發(fā)展速度比NVIDIA或AMD的HPC芯片要慢得多,后者在3D和2.5D技術(shù)上投入巨大,系統(tǒng)上多達(dá)12個(gè)芯片,”Ansys產(chǎn)品營(yíng)銷總監(jiān)MarcSwinnen表示。“低端移動(dòng)設(shè)備無法做到這一點(diǎn)。這主要是成本問題。他們必須專注于將盡可能多的功能集成到小尺寸的單芯片中,并實(shí)現(xiàn)低功耗和高速度?!?/p>
據(jù)英飛凌稱,單片SoC包含在單個(gè)硅片上運(yùn)行系統(tǒng)所需的所有組件,可能包括具有一個(gè)或多個(gè)處理器內(nèi)核的嵌入式微控制器;內(nèi)存系統(tǒng),如RAM或ROM;外部接口,如電纜端口(USB、HDMI);無線通信(WiFi、藍(lán)牙);圖形處理單元(GPU);以及其他組件,如模擬/數(shù)字轉(zhuǎn)換器、電壓調(diào)節(jié)器和內(nèi)部接口總線。
盡管體積小巧(通常也正因如此),單片SoC卻極其高效,其單處理器性能通常優(yōu)于更復(fù)雜的系統(tǒng)。信號(hào)傳輸距離短,驅(qū)動(dòng)這些信號(hào)所需的功率更低,而且只需一個(gè)簡(jiǎn)單的散熱器即可散熱。許多物聯(lián)網(wǎng)SoC供應(yīng)商都采用單片策略,因?yàn)檫@可以為客戶節(jié)省封裝和集成成本。
Synaptics低功耗邊緣AI高級(jí)產(chǎn)品經(jīng)理AnandaRoy表示:“雖然我們很難做到,但把所有功能都放在一個(gè)芯片上總是更好的。這為我們帶來了競(jìng)爭(zhēng)優(yōu)勢(shì),因?yàn)槲覀兊囊恍┪锫?lián)網(wǎng)競(jìng)爭(zhēng)對(duì)手把兩個(gè)芯片放在一個(gè)封裝中,堆疊起來,或者并排放置,并稱之為單芯片解決方案。但實(shí)際上,它們只是一個(gè)封裝中的兩個(gè)不同的芯片。我們有意識(shí)地嘗試轉(zhuǎn)向單芯片解決方案,因?yàn)閺目蛻舻慕嵌葋砜?,它更容易集成,也更容易融入他們的硬件系統(tǒng)設(shè)計(jì)中。我們基本上在單個(gè)芯片上構(gòu)建了多種技術(shù)?!?/p>
在高端移動(dòng)市場(chǎng),情況則截然不同。該市場(chǎng)使用多個(gè)芯片組來提升性能,并使用更多互連來降低電阻和電容。Cadence計(jì)算解決方案事業(yè)部高級(jí)產(chǎn)品總監(jiān)MickPosner表示:“在這種情況下,計(jì)算引擎通過高性能水平芯片間接口和先進(jìn)的封裝技術(shù)進(jìn)行‘鏡像’和連接,以擴(kuò)展計(jì)算處理能力。從技術(shù)上講,這可以擴(kuò)展到在3D-IC堆棧中垂直擴(kuò)展芯片的處理能力,從而實(shí)現(xiàn)更高的互連帶寬?!?/p>
多芯片組件還能實(shí)現(xiàn)計(jì)算單元的更大多樣性,包括CPU和GPU的組合,以及高度專業(yè)化的加速器。Posner表示:“3D堆疊并不局限于相同的處理單元。AI或內(nèi)存加速器單元可以成為堆疊的一部分,從而創(chuàng)建高效的特定領(lǐng)域應(yīng)用引擎。利用先進(jìn)的3.5D封裝,還可以使用更傳統(tǒng)的芯片間互連(例如UCIe)水平連接另一個(gè)芯片。其他芯片無需與處理節(jié)點(diǎn)位于同一技術(shù)節(jié)點(diǎn)。各種節(jié)點(diǎn)的集成可以在性能和成本之間進(jìn)行權(quán)衡,同時(shí)選擇最適合應(yīng)用功能或供應(yīng)鏈彈性的節(jié)點(diǎn)?!?/p>
在千禧年的最初幾十年里,移動(dòng)市場(chǎng)推動(dòng)了許多尖端技術(shù)的發(fā)展。然而,隨著finFET時(shí)代平面微縮優(yōu)勢(shì)的減弱、SRAM無法微縮以及云端對(duì)海量計(jì)算能力的需求不斷增長(zhǎng),系統(tǒng)公司從單片SoC轉(zhuǎn)向了2.5D系統(tǒng),通過中介層連接多個(gè)芯片。雖然移動(dòng)市場(chǎng)在工藝微縮方面仍處于領(lǐng)先地位,但高端移動(dòng)市場(chǎng)已經(jīng)超越了這一水平,擴(kuò)展到多芯片組裝——盡管目前尚不清楚移動(dòng)設(shè)備是否會(huì)采用3D-IC,因?yàn)樗鼈冃枰撤N先進(jìn)的冷卻系統(tǒng),而這在當(dāng)今的移動(dòng)設(shè)備中并不實(shí)用。
Synopsys的Saar表示:“2.5D速度非???,效率極高,而且距離極短,因此功耗非常高。這些芯片可以采用不同的工藝制造。這個(gè)芯片可以是2nm(基礎(chǔ)芯片),而AI加速器可以是其他芯片。它們非常靈活?!?/p>
高端移動(dòng)設(shè)備正在向2nm全柵(GAA)制造工藝邁進(jìn),以實(shí)現(xiàn)高性能,但這種工藝成本高昂且生產(chǎn)時(shí)間冗長(zhǎng)。Saar表示:“GAA工藝需要X個(gè)月才能從晶圓廠返回。你需要壓縮所有這些時(shí)間,這是最大的挑戰(zhàn)。你正在流片的東西在過去是值得量產(chǎn)的。這一次,你知道你至少需要再進(jìn)行一次流片,而且在你進(jìn)行流片的同時(shí),規(guī)格可能還會(huì)再次演變。我原先認(rèn)為我需要70億個(gè)參數(shù)?,F(xiàn)在我需要140億個(gè)參數(shù),因?yàn)槭謾C(jī)的用例已經(jīng)發(fā)生了變化。未來我不知道會(huì)是什么樣子,但他們?cè)谝脒@些功能時(shí)需要考慮到這一點(diǎn)。這就是為什么多裸片似乎是解決靈活性、不確定性和規(guī)格持續(xù)演變以及你必須采取的市場(chǎng)風(fēng)險(xiǎn)緩解措施的正確答案?!?/p>
Saar指出,每家手機(jī)廠商都可以根據(jù)其想要占領(lǐng)的市場(chǎng)數(shù)量來決定如何部署AI?!澳憧梢约梢粋€(gè)AI加速器,也可以把它放在單獨(dú)的芯片里,也可以是專用芯片,甚至可能是幾個(gè)專用的AI加速器。這取決于你想要的性能。假設(shè)我想要一個(gè)用于功能手機(jī)的基礎(chǔ)芯片。我添加了一個(gè)AI加速器芯片,這相當(dāng)于兩者之間的3D連接?,F(xiàn)在,我又在芯片側(cè)面添加了一個(gè)芯片,比如說,用于I/O擴(kuò)展,因?yàn)槲蚁脒M(jìn)軍多媒體市場(chǎng)。現(xiàn)在我需要更多的顯示功能。我需要EDP(電子數(shù)據(jù)處理)。SoC廠商可以將基礎(chǔ)芯片(獨(dú)立的、單片的)賣給功能手機(jī)市場(chǎng)。他們可以添加加速器。現(xiàn)在它變成了智能手機(jī)配置,他們可以在芯片側(cè)面添加另一個(gè)芯片。然后,它就變成了消費(fèi)設(shè)備、超級(jí)機(jī)器人或PC,他們可以運(yùn)用所有這些配置,從而進(jìn)軍不同的市場(chǎng)?!?/p>
通過將AI加速器放在第二個(gè)芯片上,供應(yīng)商可以獲得更好的性能,因?yàn)樗谌匀皇褂孟嗤A(chǔ)的同時(shí)進(jìn)行了優(yōu)化?!艾F(xiàn)在,它不再需要花費(fèi)數(shù)億美元反復(fù)旋轉(zhuǎn)硅片,而是更加穩(wěn)定了,”Saar說。
采用多芯片的另一個(gè)原因是考慮到模擬和數(shù)字信號(hào)。例如,Synaptics用于可折疊移動(dòng)OLED顯示屏的觸摸控制器可以區(qū)分握持設(shè)備、口袋撥號(hào)、水滴或汗水等情況。“我們的芯片包含一個(gè)模擬芯片和一個(gè)數(shù)字芯片,模擬芯片直接連接到傳感器,數(shù)字芯片處理所有這些信息,”Synaptics產(chǎn)品營(yíng)銷總監(jiān)SamToba表示。“在數(shù)字芯片內(nèi)部,我們有一個(gè)MCU內(nèi)核,之前我們有一個(gè)內(nèi)部定制的MCU內(nèi)核,這確實(shí)有很多優(yōu)勢(shì)。但是一旦涉及到這些可折疊設(shè)備,需要處理的信息量就會(huì)變得非常非常大,因此我們決定采用RISC-V。Si-Five的E7是一個(gè)非常強(qiáng)大的MCU內(nèi)核,非常適合高水平處理,我們的矢量協(xié)處理器就位于它的外部?!?/p>
然后,AI/ML算法可以判斷環(huán)境并檢測(cè)真實(shí)的手指觸摸?!拔覀兊男酒B接到觸摸傳感器,檢測(cè)所有信號(hào),將模擬信號(hào)輸入模擬芯片,然后在數(shù)字芯片上進(jìn)行處理,”Toba說道。“該數(shù)字芯片包含E7、Hydra、所有算法和內(nèi)存。一旦芯片確定觸摸是有意義的、有意的,它就會(huì)向主機(jī)SoC報(bào)告。”
內(nèi)存和通信的復(fù)雜性
與人工智能一樣,內(nèi)存也在不斷變化,并且會(huì)隨著不同的市場(chǎng)而變化。Saar表示,如果一家SoC供應(yīng)商瞄準(zhǔn)所有市場(chǎng),他們有幾種方法可以實(shí)現(xiàn)。“他們可以做單片芯片。但是,他們?nèi)绾芜m應(yīng)硅片的多次自旋?他們現(xiàn)在有LPDDR6,它已經(jīng)定義好了,但它會(huì)繼續(xù)發(fā)展。UFS5.0現(xiàn)在已經(jīng)定義好了,但它會(huì)繼續(xù)發(fā)展。那么,他們會(huì)再自旋一次2nm硅片嗎?還是會(huì)將其限制在其他方面?”
還有各種各樣的網(wǎng)絡(luò)需要考慮。手機(jī)芯片需要足夠靈活,才能支持新的5G/6G協(xié)議,同時(shí)繼續(xù)支持舊技術(shù)?!霸趩蝹€(gè)系統(tǒng)中支持額外的帶寬會(huì)增加數(shù)據(jù)處理的復(fù)雜性,也意味著大量的功耗,所以你必須非常高效地實(shí)現(xiàn)它,”弗勞恩霍夫IIS/EAS高效電子部門負(fù)責(zé)人AndyHeinig表示?!胺駝t,一方面,移動(dòng)設(shè)備會(huì)在很短的時(shí)間內(nèi)耗盡電池電量。另一方面,你還必須散熱。你有這些多物理場(chǎng)要求,你需要非常高效的加速器、非常高效的DSP實(shí)現(xiàn)、數(shù)據(jù)處理等等。這就是為什么每個(gè)人都越來越多地談?wù)搶S锰幚砥鞯脑?。?/p>
在前沿設(shè)計(jì)中,這在很大程度上涉及芯片集和異構(gòu)集成。在智能手機(jī)的模擬/混合信號(hào)領(lǐng)域,這可以幫助抵消多芯片組件帶來的部分額外成本。根據(jù)Cadence的白皮書,這種方法可以“靈活地為IP選擇最佳工藝節(jié)點(diǎn)——尤其是對(duì)于SerDesI/O、RF和模擬IP,這些IP無需位于‘核心’工藝節(jié)點(diǎn)上”。
電源、電池和散熱考慮因素
在高端移動(dòng)市場(chǎng),供應(yīng)商正在競(jìng)相支持AI。西門子數(shù)字工業(yè)軟件解決方案網(wǎng)絡(luò)專家RonSquiers表示:“iPhone15和16在板載處理中添加了AI硬件,許多智能和硬件正在硅片級(jí)別融入這些芯片中。NVIDIA等其他公司正在打造GPU。Arm正在打造Zen5[CPU],它充當(dāng)平臺(tái)上AI硬件的協(xié)調(diào)器。亞馬遜正在開發(fā)他們的Trainium訓(xùn)練和推理芯片,因此超大規(guī)模計(jì)算廠商和移動(dòng)開發(fā)者都在做這件事?!?/p>
雖然移動(dòng)設(shè)備始終需要GPU進(jìn)行圖形處理,但最新版本的GPU也能出色地處理AI工作負(fù)載。例如,ImaginationTechnologies在其E系列GPU中,極大地改變了ALU流水線中工作負(fù)載的調(diào)度和執(zhí)行方式(見下圖5)。
Imagination技術(shù)洞察副總裁KristofBeets表示:“它曾經(jīng)擁有非常復(fù)雜、非常深的流水線,流水線級(jí)數(shù)眾多,而且流水線延遲很長(zhǎng)。我們一直從一個(gè)非常大的寄存器存儲(chǔ)器(GPU中0.5MB大小的SRAM)中持續(xù)提供數(shù)據(jù)——因此,這是一個(gè)非常大容量、緊密耦合的大型內(nèi)存。問題是,如果你在每個(gè)周期都不斷地從中獲取大量數(shù)據(jù),然后將其推送到這個(gè)流水線,并且在每個(gè)周期都寫出結(jié)果,那會(huì)非常耗電?!?/p>
新設(shè)計(jì)采用了更輕量級(jí)的流水線,只有兩級(jí)流水線,并且可以在本地重用更多數(shù)據(jù)。“我們不會(huì)不斷訪問龐大的SRAM,而是嘗試重用我們附近的已有數(shù)據(jù)。這些數(shù)據(jù)可以是之前的結(jié)果,也可以是相鄰流水線中的數(shù)據(jù)。因?yàn)槿绻阌^察很多人工智能案例,就會(huì)發(fā)現(xiàn)你經(jīng)常會(huì)通過一系列處理操作來對(duì)數(shù)據(jù)進(jìn)行混洗和傳輸,并從相鄰的流水線中獲取數(shù)據(jù)?!?/p>
由此帶來的幀/秒/瓦效率提升可以轉(zhuǎn)化為更長(zhǎng)的手機(jī)電池續(xù)航時(shí)間?!斑@可能會(huì)影響運(yùn)營(yíng)成本,但我們?cè)谝苿?dòng)領(lǐng)域可以做的另一件有趣的事情是,將額外的功耗節(jié)省轉(zhuǎn)化為更高的時(shí)鐘頻率和性能,因?yàn)槲覀兛梢员3窒嗤墓暮蜔犷A(yù)算,”Beets說道。
無論設(shè)計(jì)師如何實(shí)現(xiàn)更佳性能,功耗仍然是一個(gè)關(guān)鍵問題?!叭缃?,每個(gè)人都對(duì)功耗很感興趣,甚至連數(shù)據(jù)中心的人員也不例外,但移動(dòng)設(shè)備的傳統(tǒng)業(yè)務(wù)歷史更為悠久,而且它們采用電池供電,因此它們?cè)诘凸姆矫娴男枨蟾鼮橥怀觯盇nsys的Swinnen說道。
除了每日電池續(xù)航時(shí)間,手機(jī)制造商還必須考慮電池壽命。手機(jī)的每個(gè)方面都會(huì)產(chǎn)生影響,包括SIM卡。為此,英飛凌開發(fā)了一款微型28納米eSIM卡,其功耗遠(yuǎn)低于傳統(tǒng)SIM卡。eSIM卡允許用戶輕松切換不同的服務(wù)提供商,同時(shí)由于無需物理訪問,制造商在設(shè)計(jì)方面也更加靈活。
結(jié)論
手機(jī)供應(yīng)商根據(jù)他們所針對(duì)的價(jià)格層級(jí)以及他們現(xiàn)在或?qū)硐胍獙?shí)現(xiàn)的AI功能和通信標(biāo)準(zhǔn),采取不同的芯片設(shè)計(jì)方法。
Synopsys的Saar指出,設(shè)計(jì)決策通常歸結(jié)于商業(yè)原因?!斑@就像你問為什么一個(gè)特定的標(biāo)準(zhǔn)會(huì)流行起來,而不是一個(gè)技術(shù)上可能更優(yōu)越的標(biāo)準(zhǔn)。原因有很多,現(xiàn)在這個(gè)或那個(gè)并不重要。如果一家供應(yīng)商控制著整個(gè)垂直產(chǎn)業(yè)鏈,他們就不必使用標(biāo)準(zhǔn)的現(xiàn)成的虛擬制作(VP)攝像頭接口或任何存儲(chǔ)接口。他們可以創(chuàng)建自己的接口,即使質(zhì)量較差。在他們看來,他們可以獲得各種程度的利益,也許是更高水平的集成和卓越的運(yùn)營(yíng)。”
與此同時(shí),許多新進(jìn)入者正在這個(gè)競(jìng)爭(zhēng)激烈的細(xì)分市場(chǎng)中開辟自己的道路。“他們過去只做手機(jī),現(xiàn)在也做SoC,”Saar說道。“對(duì)他們來說,情況完全不同。他們可以進(jìn)行不同的優(yōu)化。他們不必涉足廣泛領(lǐng)域,因?yàn)樗麄冎魂P(guān)心自己的手機(jī)。他們只關(guān)心自己的用例。有些公司在整個(gè)市場(chǎng),而不僅僅是移動(dòng)市場(chǎng),都擁有AI地位。我們正在制定超越硬件的企業(yè)戰(zhàn)略或全球戰(zhàn)略。也許混合戰(zhàn)略對(duì)他們來說確實(shí)有意義,因?yàn)槲蚁M謾C(jī)能夠連接到云端的AI引擎,因?yàn)楝F(xiàn)在我有了差異化。你買我的手機(jī),你連接到我的云端,你連接到我的電子郵件。一般的SoC沒有這些。他們賣的是硬件。”
*聲明:本文系原作者創(chuàng)作。文章內(nèi)容系其個(gè)人觀點(diǎn),我方轉(zhuǎn)載僅為分享與討論,不代表我方贊成或認(rèn)同,如有異議,請(qǐng)聯(lián)系后臺(tái)。
想要獲取半導(dǎo)體產(chǎn)業(yè)的前沿洞見、技術(shù)速遞、趨勢(shì)解析,關(guān)注我們!