吳淑媛
AI推動單片SoC專向多芯片。
先進封裝正在成為高端手機市場的關鍵差異化因素,與片上系統(tǒng)相比,它能夠實現更高的性能、更大的靈活性和更快的上市時間。
單片SoC憑借其外形尺寸、成熟的經驗和較低的成本,很可能仍將是中低端移動設備的首選技術。但多芯片組件提供了更大的靈活性,這對于AI推理以及跟上AI模型和通信標準的快速變化至關重要。最終,OEM廠商和芯片制造商必須確定如何在設計周期內適應變化,以及瞄準哪些細分市場。
新思科技移動、汽車和消費IP產品管理執(zhí)行總監(jiān)兼MIPI聯盟主席HeziSaar表示:“不受手機制造商束縛的SoC供應商必須追求具有AI功能的物聯網SoC低端功能,而這款產品肯定是單片的。如果他們需要進軍移動領域的中端市場,那么其功能將比物聯網更高。它也可能是單片SoC,并可能通過多芯片技術進行擴展。當你走向高端時,很明顯你不能只采用單片技術。你需要具備制造多芯片的能力,以適應即將發(fā)生的變化和快速的上市時間,因為這才是他們真正賺錢的地方?!?/p>
換句話說,目標市場決定了架構?!拔覀兛吹蕉嘈酒?D技術大勢所趨,移動領域也在采用這種技術,但其發(fā)展速度比NVIDIA或AMD的HPC芯片要慢得多,后者在3D和2.5D技術上投入巨大,系統(tǒng)上多達12個芯片,”Ansys產品營銷總監(jiān)MarcSwinnen表示?!暗投艘苿釉O備無法做到這一點。這主要是成本問題。他們必須專注于將盡可能多的功能集成到小尺寸的單芯片中,并實現低功耗和高速度。”
據英飛凌稱,單片SoC包含在單個硅片上運行系統(tǒng)所需的所有組件,可能包括具有一個或多個處理器內核的嵌入式微控制器;內存系統(tǒng),如RAM或ROM;外部接口,如電纜端口(USB、HDMI);無線通信(WiFi、藍牙);圖形處理單元(GPU);以及其他組件,如模擬/數字轉換器、電壓調節(jié)器和內部接口總線。
盡管體積小巧(通常也正因如此),單片SoC卻極其高效,其單處理器性能通常優(yōu)于更復雜的系統(tǒng)。信號傳輸距離短,驅動這些信號所需的功率更低,而且只需一個簡單的散熱器即可散熱。許多物聯網SoC供應商都采用單片策略,因為這可以為客戶節(jié)省封裝和集成成本。
Synaptics低功耗邊緣AI高級產品經理AnandaRoy表示:“雖然我們很難做到,但把所有功能都放在一個芯片上總是更好的。這為我們帶來了競爭優(yōu)勢,因為我們的一些物聯網競爭對手把兩個芯片放在一個封裝中,堆疊起來,或者并排放置,并稱之為單芯片解決方案。但實際上,它們只是一個封裝中的兩個不同的芯片。我們有意識地嘗試轉向單芯片解決方案,因為從客戶的角度來看,它更容易集成,也更容易融入他們的硬件系統(tǒng)設計中。我們基本上在單個芯片上構建了多種技術?!?/p>
在高端移動市場,情況則截然不同。該市場使用多個芯片組來提升性能,并使用更多互連來降低電阻和電容。Cadence計算解決方案事業(yè)部高級產品總監(jiān)MickPosner表示:“在這種情況下,計算引擎通過高性能水平芯片間接口和先進的封裝技術進行‘鏡像’和連接,以擴展計算處理能力。從技術上講,這可以擴展到在3D-IC堆棧中垂直擴展芯片的處理能力,從而實現更高的互連帶寬?!?/p>
多芯片組件還能實現計算單元的更大多樣性,包括CPU和GPU的組合,以及高度專業(yè)化的加速器。Posner表示:“3D堆疊并不局限于相同的處理單元。AI或內存加速器單元可以成為堆疊的一部分,從而創(chuàng)建高效的特定領域應用引擎。利用先進的3.5D封裝,還可以使用更傳統(tǒng)的芯片間互連(例如UCIe)水平連接另一個芯片。其他芯片無需與處理節(jié)點位于同一技術節(jié)點。各種節(jié)點的集成可以在性能和成本之間進行權衡,同時選擇最適合應用功能或供應鏈彈性的節(jié)點。”
在千禧年的最初幾十年里,移動市場推動了許多尖端技術的發(fā)展。然而,隨著finFET時代平面微縮優(yōu)勢的減弱、SRAM無法微縮以及云端對海量計算能力的需求不斷增長,系統(tǒng)公司從單片SoC轉向了2.5D系統(tǒng),通過中介層連接多個芯片。雖然移動市場在工藝微縮方面仍處于領先地位,但高端移動市場已經超越了這一水平,擴展到多芯片組裝——盡管目前尚不清楚移動設備是否會采用3D-IC,因為它們需要某種先進的冷卻系統(tǒng),而這在當今的移動設備中并不實用。
Synopsys的Saar表示:“2.5D速度非??欤蕵O高,而且距離極短,因此功耗非常高。這些芯片可以采用不同的工藝制造。這個芯片可以是2nm(基礎芯片),而AI加速器可以是其他芯片。它們非常靈活?!?/p>
高端移動設備正在向2nm全柵(GAA)制造工藝邁進,以實現高性能,但這種工藝成本高昂且生產時間冗長。Saar表示:“GAA工藝需要X個月才能從晶圓廠返回。你需要壓縮所有這些時間,這是最大的挑戰(zhàn)。你正在流片的東西在過去是值得量產的。這一次,你知道你至少需要再進行一次流片,而且在你進行流片的同時,規(guī)格可能還會再次演變。我原先認為我需要70億個參數?,F在我需要140億個參數,因為手機的用例已經發(fā)生了變化。未來我不知道會是什么樣子,但他們在引入這些功能時需要考慮到這一點。這就是為什么多裸片似乎是解決靈活性、不確定性和規(guī)格持續(xù)演變以及你必須采取的市場風險緩解措施的正確答案?!?/p>
Saar指出,每家手機廠商都可以根據其想要占領的市場數量來決定如何部署AI。“你可以集成一個AI加速器,也可以把它放在單獨的芯片里,也可以是專用芯片,甚至可能是幾個專用的AI加速器。這取決于你想要的性能。假設我想要一個用于功能手機的基礎芯片。我添加了一個AI加速器芯片,這相當于兩者之間的3D連接。現在,我又在芯片側面添加了一個芯片,比如說,用于I/O擴展,因為我想進軍多媒體市場?,F在我需要更多的顯示功能。我需要EDP(電子數據處理)。SoC廠商可以將基礎芯片(獨立的、單片的)賣給功能手機市場。他們可以添加加速器?,F在它變成了智能手機配置,他們可以在芯片側面添加另一個芯片。然后,它就變成了消費設備、超級機器人或PC,他們可以運用所有這些配置,從而進軍不同的市場?!?/p>
通過將AI加速器放在第二個芯片上,供應商可以獲得更好的性能,因為它在仍然使用相同基礎的同時進行了優(yōu)化?!艾F在,它不再需要花費數億美元反復旋轉硅片,而是更加穩(wěn)定了,”Saar說。
采用多芯片的另一個原因是考慮到模擬和數字信號。例如,Synaptics用于可折疊移動OLED顯示屏的觸摸控制器可以區(qū)分握持設備、口袋撥號、水滴或汗水等情況?!拔覀兊男酒粋€模擬芯片和一個數字芯片,模擬芯片直接連接到傳感器,數字芯片處理所有這些信息,”Synaptics產品營銷總監(jiān)SamToba表示。“在數字芯片內部,我們有一個MCU內核,之前我們有一個內部定制的MCU內核,這確實有很多優(yōu)勢。但是一旦涉及到這些可折疊設備,需要處理的信息量就會變得非常非常大,因此我們決定采用RISC-V。Si-Five的E7是一個非常強大的MCU內核,非常適合高水平處理,我們的矢量協處理器就位于它的外部。”
然后,AI/ML算法可以判斷環(huán)境并檢測真實的手指觸摸?!拔覀兊男酒B接到觸摸傳感器,檢測所有信號,將模擬信號輸入模擬芯片,然后在數字芯片上進行處理,”Toba說道?!霸摂底中酒珽7、Hydra、所有算法和內存。一旦芯片確定觸摸是有意義的、有意的,它就會向主機SoC報告?!?/p>
內存和通信的復雜性
與人工智能一樣,內存也在不斷變化,并且會隨著不同的市場而變化。Saar表示,如果一家SoC供應商瞄準所有市場,他們有幾種方法可以實現?!八麄兛梢宰鰡纹酒?。但是,他們如何適應硅片的多次自旋?他們現在有LPDDR6,它已經定義好了,但它會繼續(xù)發(fā)展。UFS5.0現在已經定義好了,但它會繼續(xù)發(fā)展。那么,他們會再自旋一次2nm硅片嗎?還是會將其限制在其他方面?”
還有各種各樣的網絡需要考慮。手機芯片需要足夠靈活,才能支持新的5G/6G協議,同時繼續(xù)支持舊技術?!霸趩蝹€系統(tǒng)中支持額外的帶寬會增加數據處理的復雜性,也意味著大量的功耗,所以你必須非常高效地實現它,”弗勞恩霍夫IIS/EAS高效電子部門負責人AndyHeinig表示?!胺駝t,一方面,移動設備會在很短的時間內耗盡電池電量。另一方面,你還必須散熱。你有這些多物理場要求,你需要非常高效的加速器、非常高效的DSP實現、數據處理等等。這就是為什么每個人都越來越多地談論專用處理器的原因?!?/p>
在前沿設計中,這在很大程度上涉及芯片集和異構集成。在智能手機的模擬/混合信號領域,這可以幫助抵消多芯片組件帶來的部分額外成本。根據Cadence的白皮書,這種方法可以“靈活地為IP選擇最佳工藝節(jié)點——尤其是對于SerDesI/O、RF和模擬IP,這些IP無需位于‘核心’工藝節(jié)點上”。
電源、電池和散熱考慮因素
在高端移動市場,供應商正在競相支持AI。西門子數字工業(yè)軟件解決方案網絡專家RonSquiers表示:“iPhone15和16在板載處理中添加了AI硬件,許多智能和硬件正在硅片級別融入這些芯片中。NVIDIA等其他公司正在打造GPU。Arm正在打造Zen5[CPU],它充當平臺上AI硬件的協調器。亞馬遜正在開發(fā)他們的Trainium訓練和推理芯片,因此超大規(guī)模計算廠商和移動開發(fā)者都在做這件事?!?/p>
雖然移動設備始終需要GPU進行圖形處理,但最新版本的GPU也能出色地處理AI工作負載。例如,ImaginationTechnologies在其E系列GPU中,極大地改變了ALU流水線中工作負載的調度和執(zhí)行方式(見下圖5)。
Imagination技術洞察副總裁KristofBeets表示:“它曾經擁有非常復雜、非常深的流水線,流水線級數眾多,而且流水線延遲很長。我們一直從一個非常大的寄存器存儲器(GPU中0.5MB大小的SRAM)中持續(xù)提供數據——因此,這是一個非常大容量、緊密耦合的大型內存。問題是,如果你在每個周期都不斷地從中獲取大量數據,然后將其推送到這個流水線,并且在每個周期都寫出結果,那會非常耗電?!?/p>
新設計采用了更輕量級的流水線,只有兩級流水線,并且可以在本地重用更多數據?!拔覀儾粫粩嘣L問龐大的SRAM,而是嘗試重用我們附近的已有數據。這些數據可以是之前的結果,也可以是相鄰流水線中的數據。因為如果你觀察很多人工智能案例,就會發(fā)現你經常會通過一系列處理操作來對數據進行混洗和傳輸,并從相鄰的流水線中獲取數據?!?/p>
由此帶來的幀/秒/瓦效率提升可以轉化為更長的手機電池續(xù)航時間?!斑@可能會影響運營成本,但我們在移動領域可以做的另一件有趣的事情是,將額外的功耗節(jié)省轉化為更高的時鐘頻率和性能,因為我們可以保持相同的功耗和熱預算,”Beets說道。
無論設計師如何實現更佳性能,功耗仍然是一個關鍵問題?!叭缃?,每個人都對功耗很感興趣,甚至連數據中心的人員也不例外,但移動設備的傳統(tǒng)業(yè)務歷史更為悠久,而且它們采用電池供電,因此它們在低功耗方面的需求更為突出,”Ansys的Swinnen說道。
除了每日電池續(xù)航時間,手機制造商還必須考慮電池壽命。手機的每個方面都會產生影響,包括SIM卡。為此,英飛凌開發(fā)了一款微型28納米eSIM卡,其功耗遠低于傳統(tǒng)SIM卡。eSIM卡允許用戶輕松切換不同的服務提供商,同時由于無需物理訪問,制造商在設計方面也更加靈活。
結論
手機供應商根據他們所針對的價格層級以及他們現在或將來想要實現的AI功能和通信標準,采取不同的芯片設計方法。
Synopsys的Saar指出,設計決策通常歸結于商業(yè)原因?!斑@就像你問為什么一個特定的標準會流行起來,而不是一個技術上可能更優(yōu)越的標準。原因有很多,現在這個或那個并不重要。如果一家供應商控制著整個垂直產業(yè)鏈,他們就不必使用標準的現成的虛擬制作(VP)攝像頭接口或任何存儲接口。他們可以創(chuàng)建自己的接口,即使質量較差。在他們看來,他們可以獲得各種程度的利益,也許是更高水平的集成和卓越的運營?!?/p>
與此同時,許多新進入者正在這個競爭激烈的細分市場中開辟自己的道路?!八麄冞^去只做手機,現在也做SoC,”Saar說道?!皩λ麄儊碚f,情況完全不同。他們可以進行不同的優(yōu)化。他們不必涉足廣泛領域,因為他們只關心自己的手機。他們只關心自己的用例。有些公司在整個市場,而不僅僅是移動市場,都擁有AI地位。我們正在制定超越硬件的企業(yè)戰(zhàn)略或全球戰(zhàn)略。也許混合戰(zhàn)略對他們來說確實有意義,因為我希望手機能夠連接到云端的AI引擎,因為現在我有了差異化。你買我的手機,你連接到我的云端,你連接到我的電子郵件。一般的SoC沒有這些。他們賣的是硬件。”
*聲明:本文系原作者創(chuàng)作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯系后臺。
想要獲取半導體產業(yè)的前沿洞見、技術速遞、趨勢解析,關注我們!
世嘉Sega Fes 2019活動細節(jié)公布 世嘉三四郎回歸!??3DMGAME
但即使世嘉退出了家用機市場,它還是擁有著一批忠實粉絲,土星時代由藤岡弘(假面騎士1號本鄉(xiāng)猛演員)主演的“世嘉三四郎”系列廣告,DC時代由世嘉專務湯川英一本色出演的“湯川專務”系列廣告以及退場后推出的《世嘉嘉嘉》游戲都讓玩家們記住了世嘉的獨特硬派風格,從始至終,世嘉的家用機都面對著核心玩家,并且在退出家用是什么_-。
來源:紅網
作者:賴儒奇
編輯:候景浩
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網立場。轉載請附原文出處鏈接和本聲明。