金淑敏
[ZOL中關(guān)村在線原創(chuàng)訪談]生成式人工智能以及大語言模型領(lǐng)域的突破與創(chuàng)新,為各行各業(yè)帶來了新的機遇。尤其是對于PC領(lǐng)域而言,作為兼顧大眾化普及與出色計算能力的平臺,PC已然成為人工智能應(yīng)用落地與廣泛傳播的核心媒介。人工智能技術(shù)與PC逐步融合的過程,快速推動了PC行業(yè)進入全面智能化的時代。
而在此背景之下,這種融合不僅重構(gòu)了PC軟硬件生態(tài),更催生出了從芯片到算法,從硬件到軟件,從個體應(yīng)用到全產(chǎn)業(yè)生態(tài)的新的價值鏈。也因此,越來越多致力于通過AI改變生產(chǎn)、生活、工作方式的開發(fā)者與創(chuàng)業(yè)者們,義無反顧地投身其中。
佘洪宇,這位畢業(yè)于全球頂尖設(shè)計學府倫敦藝術(shù)?學中央圣?丁學院產(chǎn)品設(shè)計專業(yè),并曾榮獲IF設(shè)計獎的年輕人,正在獨?運營著一個名為"啟問SparkQuery"的AI創(chuàng)業(yè)項?。在眾多AI開發(fā)者、創(chuàng)業(yè)者中,這個項目或許不夠宏大,但卻直擊普通用戶如何正確使用AI的核心痛點。而這個項目的誕生,源自于一次偶然的思維火花綻放。
·架起普通用戶與AI的橋梁:創(chuàng)新的火花常常來自一次偶然的機會
SparkQuery項目的中文名稱叫做“啟問”,這個項目的誕生并非出自一份嚴謹又詳盡的創(chuàng)業(yè)計劃書,佘洪宇說,“年初,我在教??使?AI時,發(fā)現(xiàn)他們總是覺得AI‘不聽話’,難以有效溝通。此時我意識到,問題的根源在于他們?法清晰、準確地表達??的需求。后來,我的父母從他們自己的?作經(jīng)驗中,受到通過“表單”來規(guī)范化輸入的啟發(fā),和我—起溝通,開發(fā)了這個小工具。它通過—系列提問式交互,引導?戶梳理思路,將模糊的想法轉(zhuǎn)化為精準的,幫助AI能夠充分理解用戶需求的指令?!?/p>
當佘洪宇將這個免費工具分享給身邊的同事好友之后,它在創(chuàng)作者和文字工作者群體中獲得了出乎意料的積極反饋。顯著的工作效率提升,使得啟問SparkQuery在發(fā)布的第一個月,就累計提供了超過1500次服務(wù),并吸引了數(shù)百位注冊用戶。
其實,不少人與AI很難成功、有效溝通的根本原因在于沒有“產(chǎn)品經(jīng)理”式的思維方式。這導致用戶無法通過清晰、合理、詳細、甚至專業(yè)的提示詞或指令讓AI充分了解自身需求,以生成真正符合用戶要求,而非大量注水的內(nèi)容或答案。這是擺在當前AI用戶面前最為核心的問題。
啟問SparkQuery通過提問式交互,一步步引導用戶去完善需求,而不是讓用戶自己去試著如何去完善需求,這種體驗上的差異正是其精髓所在。
此外,啟問SparkQuery也支持企業(yè)本地部署,也就是在不聯(lián)網(wǎng)的狀態(tài)下也能夠順利運行,這使得一些擔心商業(yè)機密、個人隱私泄露的用戶,也能夠放心使用。而要保證啟問SparkQuery在本地運行時也能夠保持良好效果,至少需要在本地部署30B參數(shù)量的Q8量化模型。因此,啟問SparkQuery對于用戶本地硬件性能,尤其是GPU顯存提出了較高要求。
而在當前眾多硬件解決方案里,佘洪宇選擇了更具經(jīng)濟性的AMD銳龍AIMax+395平臺。
·結(jié)緣銳龍AIMax+395:消費級硬件中獨一無二的能力
當PC行業(yè)抓住AI契機全面進入AIPC時代之后,傳統(tǒng)PC硬件率先迎來創(chuàng)新機遇。但在AMD銳龍AIMax+395平臺誕生之前,不少硬件其實只是達到了邁入AI應(yīng)用門檻的級別,并不能真正滿足用戶對于AI應(yīng)用的需求。
從大語言模型應(yīng)用的角度來說,硬件平臺需要提供容量足夠大和速度足夠快的內(nèi)存配置來加快大參數(shù)量大模型的加載,同時需要有大顯存GPU為生成過程提速。AMD銳龍AIMax+395通過統(tǒng)一內(nèi)存技術(shù),可以將128GB內(nèi)存中最高96GB內(nèi)存分配做顯存使用,完美解決了移動端平臺內(nèi)存小、顯存低的瓶頸,從而讓迷你電腦、AIPC具備了本地運行32B、70B參數(shù)量稠密大模型,以及235BMoE混合專家大模型的能力。
正因如此,佘洪宇與銳龍AIMax+395結(jié)緣,走上了AI創(chuàng)業(yè)的這條路。
在談及自己對銳龍AIMax+395處理器的看法時,佘洪宇坦言,“我的典型?作流是:首先利用最先進的云端大模型(如DeepSeek來快速驗證—個業(yè)務(wù)場景的可行性;如果可行,出于成本控制和數(shù)據(jù)安全這兩個核心因素考量,我會轉(zhuǎn)向在本地部署量化模型進行后續(xù)開發(fā)。這個過程中,—個核心的痛點在于對比測試——不同機構(gòu)對同—模型的量化方案會產(chǎn)生效果差異,我必須反復對比才能選出最優(yōu)解。在傳統(tǒng)高端顯卡(如RTX5090)上,每次對比都需要重新加載和卸載模型,這個過程非常耗時,嚴重拖慢了開發(fā)迭代的速度。而AMD銳龍AIMax+395平臺則完美地解決了我的痛點,無需反復加載。”
確實,在筆者實際測試銳龍AIMax+395平臺時也發(fā)現(xiàn),得益于128GB超大統(tǒng)一內(nèi)存以及內(nèi)存-顯存分配機制,傳統(tǒng)高端顯卡系統(tǒng)上都比較難實現(xiàn)的多模型加載與切換,在銳龍AIMax+395上實現(xiàn)起來卻非常簡單。下圖是筆者測試時加載Qwen3-235B-A22B-IQ2_S的MoE混合大模型的截圖,內(nèi)存峰值占用高達63.6GB,如果沒有128GB超大內(nèi)存支持的話,這基本是不可能完成的任務(wù)。
此外,佘洪宇結(jié)合自身在創(chuàng)業(yè)過程中的實際應(yīng)用體驗,總結(jié)并分享了銳龍AIMax+395處理器的幾個核心價值:
首先,它擁有顛覆性的模型測試效率。這得益于128GB超大容量的統(tǒng)一內(nèi)存,這一特性使得佘洪宇能夠在內(nèi)存中同時加載2到3個30B規(guī)模的量化大模型,并且輕松實現(xiàn)模型間的無縫切換和即時對比,無需等待,節(jié)約大量模型加載時間。佘洪宇說,“僅此—項,就將我的開發(fā)效率提升了?少20-30%。”
其次,輕松應(yīng)對多模型復雜應(yīng)用。在運行RAG(檢索增強生成)、AI繪畫這類需要語言模型、向量模型、繪圖模型等多模型協(xié)同?作的場景時,銳龍AIMax+395平臺也能輕松勝任。它避免了傳統(tǒng)雙顯卡方案的高成本、高功耗和高噪音等弊端,非常適合在桌面或家庭環(huán)境中進行安靜且高效的開發(fā)。
其三,攻克超長上下文處理瓶頸。當需要處理如播客轉(zhuǎn)錄、長文檔分析等需要超長上下文(例如32K)的任務(wù)時,即便是頂級的消費級顯卡也往往難以勝任。而銳龍AIMax+395平臺則可以充分滿足這種需求。佘洪宇表示,“這在目前的消費級硬件中幾乎是獨一無二的能力?!?/p>
佘洪宇的工作極度依賴基于GPU進行的模型開發(fā)和推理,同時也需要強大的CPU來支撐相關(guān)的軟件開發(fā)、數(shù)據(jù)預處理以及后端服務(wù),AMD銳龍AIMax+395處理器基于AMDZen5架構(gòu)打造,原生16顆超大核心32線程設(shè)計,最高加速頻率5.1GHz,總緩存高達80MB,NPU峰值A(chǔ)I算力為50TOPS。同時它還集成了40個圖形核心、2560個流處理器+64GBLPDDR5顯存的Radeon8060SiGPU,加上128GB超大統(tǒng)一內(nèi)存以及其中最高96GB容量給顯存分配,自然可以同時勝任AI開發(fā)以及軟件開發(fā)兩種不同的任務(wù),足見銳龍AIMax+395平臺的泛用性與獨特性。
·用銳龍AIMax+395初步構(gòu)建個人智能數(shù)據(jù)中心:真正安全、私密的個人助理
AI應(yīng)用可以說是非常典型的入門簡單、精通難。這一點相信很多使用過AIGC生成圖片、或者使用大語言模型生成文檔的朋友都深有體會。正如前面所言,精通AI應(yīng)用的本質(zhì)是讓自己的思維從用戶思維轉(zhuǎn)變?yōu)楫a(chǎn)品經(jīng)理思維,這一點說起來容易,但做起來真的非常困難。
佘洪宇和他的“啟問SparkQuery”項目其實就是為了打破這種壁壘。“很多人認為AI的上限取決于模型本身,但我認為—個更完整的公式是:(模型算法+訓練數(shù)據(jù)+外部知識庫)x算力x優(yōu)質(zhì)提示詞。在這個公式里,模型和大部分算力由廠商提供,但高質(zhì)量的外部知識庫和優(yōu)質(zhì)提示詞,則越來越依賴于我們個人實時產(chǎn)生的數(shù)據(jù)。”
然而,這就面臨著老生常談的“數(shù)據(jù)隱私安全”問題。
當用戶使用AI執(zhí)行文檔閱讀、會議紀要、工作總結(jié)、記錄生活等任務(wù)時,是否放心把這些數(shù)據(jù)交給云端的AI,就成為擺在用戶面前的另一個非常棘手的問題。
在佘洪宇的創(chuàng)業(yè)過程中,不免也會遇到這樣的問題。佘洪宇認為AIPC最終將會成為“個人智能數(shù)據(jù)中心”。它不僅是一臺強大的計算設(shè)備,同時更是一個安全、可靠的本地數(shù)據(jù)堡壘,能夠在終端側(cè)完成對高度敏感數(shù)據(jù)的處理和分析,并確保用戶數(shù)據(jù)安全與隱私。未來,AIPC將成為真正安全、私密的個人助理。
以前我們常說,“硬件為創(chuàng)新賦能?!钡绾钨x能?或許更多時候只是在一代又一代的游戲畫面和GPU性能螺旋升級中感受得到。
而這一次,銳龍AIMax+395平臺為佘洪宇這樣的AI開發(fā)者所做的賦能,不僅僅在于AI應(yīng)用本身的驗證與開發(fā),更在于未來有可能借助強勁算力平臺所構(gòu)建的“個人智能數(shù)據(jù)中心”這樣的全新概念,它改變了我們對于AIPC的慣有看法,單純的AI應(yīng)用落地和傳播媒介,至少在佘洪宇的概念框架中,已經(jīng)不足以描述。
當然,為了最終實現(xiàn)“個人智能數(shù)據(jù)中心”這一愿景,佘洪宇也對AMD平臺未來的發(fā)展提出了兩點期待:首先是生態(tài)支持的敏捷性,期待AMD能加速對業(yè)界前沿AI模型的適配與優(yōu)化,讓開發(fā)者能第一時間利用最新的技術(shù);其次是更親民的價格,以降低個人開發(fā)者和小型團隊的門檻,推動高性能AIPC在更廣泛的開發(fā)者和用戶群體中普及,加速生態(tài)成熟。
·結(jié)語
佘洪宇的AI創(chuàng)業(yè)項目“啟問SparkQuery”不僅解決了用戶在AI使用過程中的溝通難題,還通過AMD銳龍AIMax+395平臺實現(xiàn)了高效、安全的本地開發(fā),并且基于這一平臺勾勒了一個充滿無限可能的“個人智能數(shù)據(jù)中心”圖景,這一刻,“硬件賦能創(chuàng)新”得到了更為充分的詮釋。而且我們也相信,在像佘洪宇這樣的更多的AI開發(fā)者、創(chuàng)業(yè)者、實踐者們的推動下,AIPC行業(yè)會有一個更加清晰的未來。
來源:紅網(wǎng)
作者:干笛
編輯:陳瑋弘
本文為紅辣椒評論 原創(chuàng)文章,僅系作者個人觀點,不代表紅網(wǎng)立場。轉(zhuǎn)載請附原文出處鏈接和本聲明。