[ZOL中關村在線原創(chuàng)訪談]生成式人工智能以及大語言模型領域的突破與創(chuàng)新,為各行各業(yè)帶來了新的機遇。尤其是對于PC領域而言,作為兼顧大眾化普及與出色計算能力的平臺,PC已然成為人工智能應用落地與廣泛傳播的核心媒介。人工智能技術與PC逐步融合的過程,快速推動了PC行業(yè)進入全面智能化的時代。
而在此背景之下,這種融合不僅重構了PC軟硬件生態(tài),更催生出了從芯片到算法,從硬件到軟件,從個體應用到全產業(yè)生態(tài)的新的價值鏈。也因此,越來越多致力于通過AI改變生產、生活、工作方式的開發(fā)者與創(chuàng)業(yè)者們,義無反顧地投身其中。
佘洪宇,這位畢業(yè)于全球頂尖設計學府倫敦藝術?學中央圣?丁學院產品設計專業(yè),并曾榮獲IF設計獎的年輕人,正在獨?運營著一個名為"啟問SparkQuery"的AI創(chuàng)業(yè)項?。在眾多AI開發(fā)者、創(chuàng)業(yè)者中,這個項目或許不夠宏大,但卻直擊普通用戶如何正確使用AI的核心痛點。而這個項目的誕生,源自于一次偶然的思維火花綻放。
·架起普通用戶與AI的橋梁:創(chuàng)新的火花常常來自一次偶然的機會
SparkQuery項目的中文名稱叫做“啟問”,這個項目的誕生并非出自一份嚴謹又詳盡的創(chuàng)業(yè)計劃書,佘洪宇說,“年初,我在教??使?AI時,發(fā)現(xiàn)他們總是覺得AI‘不聽話’,難以有效溝通。此時我意識到,問題的根源在于他們?法清晰、準確地表達??的需求。后來,我的父母從他們自己的?作經驗中,受到通過“表單”來規(guī)范化輸入的啟發(fā),和我—起溝通,開發(fā)了這個小工具。它通過—系列提問式交互,引導?戶梳理思路,將模糊的想法轉化為精準的,幫助AI能夠充分理解用戶需求的指令?!?/p>
當佘洪宇將這個免費工具分享給身邊的同事好友之后,它在創(chuàng)作者和文字工作者群體中獲得了出乎意料的積極反饋。顯著的工作效率提升,使得啟問SparkQuery在發(fā)布的第一個月,就累計提供了超過1500次服務,并吸引了數(shù)百位注冊用戶。
其實,不少人與AI很難成功、有效溝通的根本原因在于沒有“產品經理”式的思維方式。這導致用戶無法通過清晰、合理、詳細、甚至專業(yè)的提示詞或指令讓AI充分了解自身需求,以生成真正符合用戶要求,而非大量注水的內容或答案。這是擺在當前AI用戶面前最為核心的問題。
啟問SparkQuery通過提問式交互,一步步引導用戶去完善需求,而不是讓用戶自己去試著如何去完善需求,這種體驗上的差異正是其精髓所在。
此外,啟問SparkQuery也支持企業(yè)本地部署,也就是在不聯(lián)網的狀態(tài)下也能夠順利運行,這使得一些擔心商業(yè)機密、個人隱私泄露的用戶,也能夠放心使用。而要保證啟問SparkQuery在本地運行時也能夠保持良好效果,至少需要在本地部署30B參數(shù)量的Q8量化模型。因此,啟問SparkQuery對于用戶本地硬件性能,尤其是GPU顯存提出了較高要求。
而在當前眾多硬件解決方案里,佘洪宇選擇了更具經濟性的AMD銳龍AIMax+395平臺。
·結緣銳龍AIMax+395:消費級硬件中獨一無二的能力
當PC行業(yè)抓住AI契機全面進入AIPC時代之后,傳統(tǒng)PC硬件率先迎來創(chuàng)新機遇。但在AMD銳龍AIMax+395平臺誕生之前,不少硬件其實只是達到了邁入AI應用門檻的級別,并不能真正滿足用戶對于AI應用的需求。
從大語言模型應用的角度來說,硬件平臺需要提供容量足夠大和速度足夠快的內存配置來加快大參數(shù)量大模型的加載,同時需要有大顯存GPU為生成過程提速。AMD銳龍AIMax+395通過統(tǒng)一內存技術,可以將128GB內存中最高96GB內存分配做顯存使用,完美解決了移動端平臺內存小、顯存低的瓶頸,從而讓迷你電腦、AIPC具備了本地運行32B、70B參數(shù)量稠密大模型,以及235BMoE混合專家大模型的能力。
正因如此,佘洪宇與銳龍AIMax+395結緣,走上了AI創(chuàng)業(yè)的這條路。
在談及自己對銳龍AIMax+395處理器的看法時,佘洪宇坦言,“我的典型?作流是:首先利用最先進的云端大模型(如DeepSeek來快速驗證—個業(yè)務場景的可行性;如果可行,出于成本控制和數(shù)據(jù)安全這兩個核心因素考量,我會轉向在本地部署量化模型進行后續(xù)開發(fā)。這個過程中,—個核心的痛點在于對比測試——不同機構對同—模型的量化方案會產生效果差異,我必須反復對比才能選出最優(yōu)解。在傳統(tǒng)高端顯卡(如RTX5090)上,每次對比都需要重新加載和卸載模型,這個過程非常耗時,嚴重拖慢了開發(fā)迭代的速度。而AMD銳龍AIMax+395平臺則完美地解決了我的痛點,無需反復加載?!?/p>
確實,在筆者實際測試銳龍AIMax+395平臺時也發(fā)現(xiàn),得益于128GB超大統(tǒng)一內存以及內存-顯存分配機制,傳統(tǒng)高端顯卡系統(tǒng)上都比較難實現(xiàn)的多模型加載與切換,在銳龍AIMax+395上實現(xiàn)起來卻非常簡單。下圖是筆者測試時加載Qwen3-235B-A22B-IQ2_S的MoE混合大模型的截圖,內存峰值占用高達63.6GB,如果沒有128GB超大內存支持的話,這基本是不可能完成的任務。
此外,佘洪宇結合自身在創(chuàng)業(yè)過程中的實際應用體驗,總結并分享了銳龍AIMax+395處理器的幾個核心價值:
首先,它擁有顛覆性的模型測試效率。這得益于128GB超大容量的統(tǒng)一內存,這一特性使得佘洪宇能夠在內存中同時加載2到3個30B規(guī)模的量化大模型,并且輕松實現(xiàn)模型間的無縫切換和即時對比,無需等待,節(jié)約大量模型加載時間。佘洪宇說,“僅此—項,就將我的開發(fā)效率提升了?少20-30%?!?/p>
其次,輕松應對多模型復雜應用。在運行RAG(檢索增強生成)、AI繪畫這類需要語言模型、向量模型、繪圖模型等多模型協(xié)同?作的場景時,銳龍AIMax+395平臺也能輕松勝任。它避免了傳統(tǒng)雙顯卡方案的高成本、高功耗和高噪音等弊端,非常適合在桌面或家庭環(huán)境中進行安靜且高效的開發(fā)。
其三,攻克超長上下文處理瓶頸。當需要處理如播客轉錄、長文檔分析等需要超長上下文(例如32K)的任務時,即便是頂級的消費級顯卡也往往難以勝任。而銳龍AIMax+395平臺則可以充分滿足這種需求。佘洪宇表示,“這在目前的消費級硬件中幾乎是獨一無二的能力。”
佘洪宇的工作極度依賴基于GPU進行的模型開發(fā)和推理,同時也需要強大的CPU來支撐相關的軟件開發(fā)、數(shù)據(jù)預處理以及后端服務,AMD銳龍AIMax+395處理器基于AMDZen5架構打造,原生16顆超大核心32線程設計,最高加速頻率5.1GHz,總緩存高達80MB,NPU峰值AI算力為50TOPS。同時它還集成了40個圖形核心、2560個流處理器+64GBLPDDR5顯存的Radeon8060SiGPU,加上128GB超大統(tǒng)一內存以及其中最高96GB容量給顯存分配,自然可以同時勝任AI開發(fā)以及軟件開發(fā)兩種不同的任務,足見銳龍AIMax+395平臺的泛用性與獨特性。
·用銳龍AIMax+395初步構建個人智能數(shù)據(jù)中心:真正安全、私密的個人助理
AI應用可以說是非常典型的入門簡單、精通難。這一點相信很多使用過AIGC生成圖片、或者使用大語言模型生成文檔的朋友都深有體會。正如前面所言,精通AI應用的本質是讓自己的思維從用戶思維轉變?yōu)楫a品經理思維,這一點說起來容易,但做起來真的非常困難。
佘洪宇和他的“啟問SparkQuery”項目其實就是為了打破這種壁壘。“很多人認為AI的上限取決于模型本身,但我認為—個更完整的公式是:(模型算法+訓練數(shù)據(jù)+外部知識庫)x算力x優(yōu)質提示詞。在這個公式里,模型和大部分算力由廠商提供,但高質量的外部知識庫和優(yōu)質提示詞,則越來越依賴于我們個人實時產生的數(shù)據(jù)?!?/p>
然而,這就面臨著老生常談的“數(shù)據(jù)隱私安全”問題。
當用戶使用AI執(zhí)行文檔閱讀、會議紀要、工作總結、記錄生活等任務時,是否放心把這些數(shù)據(jù)交給云端的AI,就成為擺在用戶面前的另一個非常棘手的問題。
在佘洪宇的創(chuàng)業(yè)過程中,不免也會遇到這樣的問題。佘洪宇認為AIPC最終將會成為“個人智能數(shù)據(jù)中心”。它不僅是一臺強大的計算設備,同時更是一個安全、可靠的本地數(shù)據(jù)堡壘,能夠在終端側完成對高度敏感數(shù)據(jù)的處理和分析,并確保用戶數(shù)據(jù)安全與隱私。未來,AIPC將成為真正安全、私密的個人助理。
以前我們常說,“硬件為創(chuàng)新賦能?!钡绾钨x能?或許更多時候只是在一代又一代的游戲畫面和GPU性能螺旋升級中感受得到。
而這一次,銳龍AIMax+395平臺為佘洪宇這樣的AI開發(fā)者所做的賦能,不僅僅在于AI應用本身的驗證與開發(fā),更在于未來有可能借助強勁算力平臺所構建的“個人智能數(shù)據(jù)中心”這樣的全新概念,它改變了我們對于AIPC的慣有看法,單純的AI應用落地和傳播媒介,至少在佘洪宇的概念框架中,已經不足以描述。
當然,為了最終實現(xiàn)“個人智能數(shù)據(jù)中心”這一愿景,佘洪宇也對AMD平臺未來的發(fā)展提出了兩點期待:首先是生態(tài)支持的敏捷性,期待AMD能加速對業(yè)界前沿AI模型的適配與優(yōu)化,讓開發(fā)者能第一時間利用最新的技術;其次是更親民的價格,以降低個人開發(fā)者和小型團隊的門檻,推動高性能AIPC在更廣泛的開發(fā)者和用戶群體中普及,加速生態(tài)成熟。
·結語
佘洪宇的AI創(chuàng)業(yè)項目“啟問SparkQuery”不僅解決了用戶在AI使用過程中的溝通難題,還通過AMD銳龍AIMax+395平臺實現(xiàn)了高效、安全的本地開發(fā),并且基于這一平臺勾勒了一個充滿無限可能的“個人智能數(shù)據(jù)中心”圖景,這一刻,“硬件賦能創(chuàng)新”得到了更為充分的詮釋。而且我們也相信,在像佘洪宇這樣的更多的AI開發(fā)者、創(chuàng)業(yè)者、實踐者們的推動下,AIPC行業(yè)會有一個更加清晰的未來。
獨家好書《仙帝重生混都市》,欺我辱我者,雖遠必誅!
仙帝重生都市,攜無上神通,誓要重回巔峰,再掀風云
仙帝重生歸來,重回都市,橫掃無敵,開啟無敵逆襲之路!