[ZOL中關(guān)村在線原創(chuàng)訪談]生成式人工智能以及大語言模型領(lǐng)域的突破與創(chuàng)新,為各行各業(yè)帶來了新的機(jī)遇。尤其是對于PC領(lǐng)域而言,作為兼顧大眾化普及與出色計算能力的平臺,PC已然成為人工智能應(yīng)用落地與廣泛傳播的核心媒介。人工智能技術(shù)與PC逐步融合的過程,快速推動了PC行業(yè)進(jìn)入全面智能化的時代。
而在此背景之下,這種融合不僅重構(gòu)了PC軟硬件生態(tài),更催生出了從芯片到算法,從硬件到軟件,從個體應(yīng)用到全產(chǎn)業(yè)生態(tài)的新的價值鏈。也因此,越來越多致力于通過AI改變生產(chǎn)、生活、工作方式的開發(fā)者與創(chuàng)業(yè)者們,義無反顧地投身其中。
佘洪宇,這位畢業(yè)于全球頂尖設(shè)計學(xué)府倫敦藝術(shù)?學(xué)中央圣?丁學(xué)院產(chǎn)品設(shè)計專業(yè),并曾榮獲IF設(shè)計獎的年輕人,正在獨(dú)?運(yùn)營著一個名為"啟問SparkQuery"的AI創(chuàng)業(yè)項?。在眾多AI開發(fā)者、創(chuàng)業(yè)者中,這個項目或許不夠宏大,但卻直擊普通用戶如何正確使用AI的核心痛點(diǎn)。而這個項目的誕生,源自于一次偶然的思維火花綻放。
·架起普通用戶與AI的橋梁:創(chuàng)新的火花常常來自一次偶然的機(jī)會
SparkQuery項目的中文名稱叫做“啟問”,這個項目的誕生并非出自一份嚴(yán)謹(jǐn)又詳盡的創(chuàng)業(yè)計劃書,佘洪宇說,“年初,我在教??使?AI時,發(fā)現(xiàn)他們總是覺得AI‘不聽話’,難以有效溝通。此時我意識到,問題的根源在于他們?法清晰、準(zhǔn)確地表達(dá)??的需求。后來,我的父母從他們自己的?作經(jīng)驗中,受到通過“表單”來規(guī)范化輸入的啟發(fā),和我—起溝通,開發(fā)了這個小工具。它通過—系列提問式交互,引導(dǎo)?戶梳理思路,將模糊的想法轉(zhuǎn)化為精準(zhǔn)的,幫助AI能夠充分理解用戶需求的指令。”
當(dāng)佘洪宇將這個免費(fèi)工具分享給身邊的同事好友之后,它在創(chuàng)作者和文字工作者群體中獲得了出乎意料的積極反饋。顯著的工作效率提升,使得啟問SparkQuery在發(fā)布的第一個月,就累計提供了超過1500次服務(wù),并吸引了數(shù)百位注冊用戶。
其實,不少人與AI很難成功、有效溝通的根本原因在于沒有“產(chǎn)品經(jīng)理”式的思維方式。這導(dǎo)致用戶無法通過清晰、合理、詳細(xì)、甚至專業(yè)的提示詞或指令讓AI充分了解自身需求,以生成真正符合用戶要求,而非大量注水的內(nèi)容或答案。這是擺在當(dāng)前AI用戶面前最為核心的問題。
啟問SparkQuery通過提問式交互,一步步引導(dǎo)用戶去完善需求,而不是讓用戶自己去試著如何去完善需求,這種體驗上的差異正是其精髓所在。
此外,啟問SparkQuery也支持企業(yè)本地部署,也就是在不聯(lián)網(wǎng)的狀態(tài)下也能夠順利運(yùn)行,這使得一些擔(dān)心商業(yè)機(jī)密、個人隱私泄露的用戶,也能夠放心使用。而要保證啟問SparkQuery在本地運(yùn)行時也能夠保持良好效果,至少需要在本地部署30B參數(shù)量的Q8量化模型。因此,啟問SparkQuery對于用戶本地硬件性能,尤其是GPU顯存提出了較高要求。
而在當(dāng)前眾多硬件解決方案里,佘洪宇選擇了更具經(jīng)濟(jì)性的AMD銳龍AIMax+395平臺。
·結(jié)緣銳龍AIMax+395:消費(fèi)級硬件中獨(dú)一無二的能力
當(dāng)PC行業(yè)抓住AI契機(jī)全面進(jìn)入AIPC時代之后,傳統(tǒng)PC硬件率先迎來創(chuàng)新機(jī)遇。但在AMD銳龍AIMax+395平臺誕生之前,不少硬件其實只是達(dá)到了邁入AI應(yīng)用門檻的級別,并不能真正滿足用戶對于AI應(yīng)用的需求。
從大語言模型應(yīng)用的角度來說,硬件平臺需要提供容量足夠大和速度足夠快的內(nèi)存配置來加快大參數(shù)量大模型的加載,同時需要有大顯存GPU為生成過程提速。AMD銳龍AIMax+395通過統(tǒng)一內(nèi)存技術(shù),可以將128GB內(nèi)存中最高96GB內(nèi)存分配做顯存使用,完美解決了移動端平臺內(nèi)存小、顯存低的瓶頸,從而讓迷你電腦、AIPC具備了本地運(yùn)行32B、70B參數(shù)量稠密大模型,以及235BMoE混合專家大模型的能力。
正因如此,佘洪宇與銳龍AIMax+395結(jié)緣,走上了AI創(chuàng)業(yè)的這條路。
在談及自己對銳龍AIMax+395處理器的看法時,佘洪宇坦言,“我的典型?作流是:首先利用最先進(jìn)的云端大模型(如DeepSeek來快速驗證—個業(yè)務(wù)場景的可行性;如果可行,出于成本控制和數(shù)據(jù)安全這兩個核心因素考量,我會轉(zhuǎn)向在本地部署量化模型進(jìn)行后續(xù)開發(fā)。這個過程中,—個核心的痛點(diǎn)在于對比測試——不同機(jī)構(gòu)對同—模型的量化方案會產(chǎn)生效果差異,我必須反復(fù)對比才能選出最優(yōu)解。在傳統(tǒng)高端顯卡(如RTX5090)上,每次對比都需要重新加載和卸載模型,這個過程非常耗時,嚴(yán)重拖慢了開發(fā)迭代的速度。而AMD銳龍AIMax+395平臺則完美地解決了我的痛點(diǎn),無需反復(fù)加載。”
確實,在筆者實際測試銳龍AIMax+395平臺時也發(fā)現(xiàn),得益于128GB超大統(tǒng)一內(nèi)存以及內(nèi)存-顯存分配機(jī)制,傳統(tǒng)高端顯卡系統(tǒng)上都比較難實現(xiàn)的多模型加載與切換,在銳龍AIMax+395上實現(xiàn)起來卻非常簡單。下圖是筆者測試時加載Qwen3-235B-A22B-IQ2_S的MoE混合大模型的截圖,內(nèi)存峰值占用高達(dá)63.6GB,如果沒有128GB超大內(nèi)存支持的話,這基本是不可能完成的任務(wù)。
此外,佘洪宇結(jié)合自身在創(chuàng)業(yè)過程中的實際應(yīng)用體驗,總結(jié)并分享了銳龍AIMax+395處理器的幾個核心價值:
首先,它擁有顛覆性的模型測試效率。這得益于128GB超大容量的統(tǒng)一內(nèi)存,這一特性使得佘洪宇能夠在內(nèi)存中同時加載2到3個30B規(guī)模的量化大模型,并且輕松實現(xiàn)模型間的無縫切換和即時對比,無需等待,節(jié)約大量模型加載時間。佘洪宇說,“僅此—項,就將我的開發(fā)效率提升了?少20-30%。”
其次,輕松應(yīng)對多模型復(fù)雜應(yīng)用。在運(yùn)行RAG(檢索增強(qiáng)生成)、AI繪畫這類需要語言模型、向量模型、繪圖模型等多模型協(xié)同?作的場景時,銳龍AIMax+395平臺也能輕松勝任。它避免了傳統(tǒng)雙顯卡方案的高成本、高功耗和高噪音等弊端,非常適合在桌面或家庭環(huán)境中進(jìn)行安靜且高效的開發(fā)。
其三,攻克超長上下文處理瓶頸。當(dāng)需要處理如播客轉(zhuǎn)錄、長文檔分析等需要超長上下文(例如32K)的任務(wù)時,即便是頂級的消費(fèi)級顯卡也往往難以勝任。而銳龍AIMax+395平臺則可以充分滿足這種需求。佘洪宇表示,“這在目前的消費(fèi)級硬件中幾乎是獨(dú)一無二的能力?!?/p>
佘洪宇的工作極度依賴基于GPU進(jìn)行的模型開發(fā)和推理,同時也需要強(qiáng)大的CPU來支撐相關(guān)的軟件開發(fā)、數(shù)據(jù)預(yù)處理以及后端服務(wù),AMD銳龍AIMax+395處理器基于AMDZen5架構(gòu)打造,原生16顆超大核心32線程設(shè)計,最高加速頻率5.1GHz,總緩存高達(dá)80MB,NPU峰值A(chǔ)I算力為50TOPS。同時它還集成了40個圖形核心、2560個流處理器+64GBLPDDR5顯存的Radeon8060SiGPU,加上128GB超大統(tǒng)一內(nèi)存以及其中最高96GB容量給顯存分配,自然可以同時勝任AI開發(fā)以及軟件開發(fā)兩種不同的任務(wù),足見銳龍AIMax+395平臺的泛用性與獨(dú)特性。
·用銳龍AIMax+395初步構(gòu)建個人智能數(shù)據(jù)中心:真正安全、私密的個人助理
AI應(yīng)用可以說是非常典型的入門簡單、精通難。這一點(diǎn)相信很多使用過AIGC生成圖片、或者使用大語言模型生成文檔的朋友都深有體會。正如前面所言,精通AI應(yīng)用的本質(zhì)是讓自己的思維從用戶思維轉(zhuǎn)變?yōu)楫a(chǎn)品經(jīng)理思維,這一點(diǎn)說起來容易,但做起來真的非常困難。
佘洪宇和他的“啟問SparkQuery”項目其實就是為了打破這種壁壘。“很多人認(rèn)為AI的上限取決于模型本身,但我認(rèn)為—個更完整的公式是:(模型算法+訓(xùn)練數(shù)據(jù)+外部知識庫)x算力x優(yōu)質(zhì)提示詞。在這個公式里,模型和大部分算力由廠商提供,但高質(zhì)量的外部知識庫和優(yōu)質(zhì)提示詞,則越來越依賴于我們個人實時產(chǎn)生的數(shù)據(jù)?!?/p>
然而,這就面臨著老生常談的“數(shù)據(jù)隱私安全”問題。
當(dāng)用戶使用AI執(zhí)行文檔閱讀、會議紀(jì)要、工作總結(jié)、記錄生活等任務(wù)時,是否放心把這些數(shù)據(jù)交給云端的AI,就成為擺在用戶面前的另一個非常棘手的問題。
在佘洪宇的創(chuàng)業(yè)過程中,不免也會遇到這樣的問題。佘洪宇認(rèn)為AIPC最終將會成為“個人智能數(shù)據(jù)中心”。它不僅是一臺強(qiáng)大的計算設(shè)備,同時更是一個安全、可靠的本地數(shù)據(jù)堡壘,能夠在終端側(cè)完成對高度敏感數(shù)據(jù)的處理和分析,并確保用戶數(shù)據(jù)安全與隱私。未來,AIPC將成為真正安全、私密的個人助理。
以前我們常說,“硬件為創(chuàng)新賦能?!钡绾钨x能?或許更多時候只是在一代又一代的游戲畫面和GPU性能螺旋升級中感受得到。
而這一次,銳龍AIMax+395平臺為佘洪宇這樣的AI開發(fā)者所做的賦能,不僅僅在于AI應(yīng)用本身的驗證與開發(fā),更在于未來有可能借助強(qiáng)勁算力平臺所構(gòu)建的“個人智能數(shù)據(jù)中心”這樣的全新概念,它改變了我們對于AIPC的慣有看法,單純的AI應(yīng)用落地和傳播媒介,至少在佘洪宇的概念框架中,已經(jīng)不足以描述。
當(dāng)然,為了最終實現(xiàn)“個人智能數(shù)據(jù)中心”這一愿景,佘洪宇也對AMD平臺未來的發(fā)展提出了兩點(diǎn)期待:首先是生態(tài)支持的敏捷性,期待AMD能加速對業(yè)界前沿AI模型的適配與優(yōu)化,讓開發(fā)者能第一時間利用最新的技術(shù);其次是更親民的價格,以降低個人開發(fā)者和小型團(tuán)隊的門檻,推動高性能AIPC在更廣泛的開發(fā)者和用戶群體中普及,加速生態(tài)成熟。
·結(jié)語
佘洪宇的AI創(chuàng)業(yè)項目“啟問SparkQuery”不僅解決了用戶在AI使用過程中的溝通難題,還通過AMD銳龍AIMax+395平臺實現(xiàn)了高效、安全的本地開發(fā),并且基于這一平臺勾勒了一個充滿無限可能的“個人智能數(shù)據(jù)中心”圖景,這一刻,“硬件賦能創(chuàng)新”得到了更為充分的詮釋。而且我們也相信,在像佘洪宇這樣的更多的AI開發(fā)者、創(chuàng)業(yè)者、實踐者們的推動下,AIPC行業(yè)會有一個更加清晰的未來。
27歲,面對面癱,我選擇堅強(qiáng)!
面癱給我的生活啟示
面癱到底好不好治?談?wù)勎业呐R床心得!
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動生成,僅供參考。