問題還沒說完,就被AI搶答是一種什么體驗(yàn)?被AI的“活人感”震撼到一度懷疑究竟和自己對(duì)話的是真人還是機(jī)器人又是什么感受?近日,在上海舉辦的WAIC2025上,筆者就看到了SoulApp情緒價(jià)值賦能方向等諸多智能體應(yīng)用落地的場(chǎng)景,也看到了現(xiàn)場(chǎng)觀眾討論AI的熱情。
“下一輪的AI,賣的不是工具,而是收益?!边@句話已經(jīng)成為行業(yè)共識(shí),生成式AI的賽道也正在從“如何制造更多工具”向著“如何產(chǎn)生更多價(jià)值”的方向發(fā)展。當(dāng)技術(shù)轉(zhuǎn)化為更多普通個(gè)體愿意為之買單的實(shí)際體驗(yàn),才能催生AI時(shí)代的KillerApp,而這屆WAIC大會(huì)提供了一種方向。
AI步入新時(shí)代,從工具到創(chuàng)造價(jià)值
AI不再是賣工具,而是創(chuàng)造價(jià)值已經(jīng)是當(dāng)下AI發(fā)展的重要趨勢(shì),這點(diǎn)從近日舉辦的WAIC上就能“可見一斑”。與去年絕大多數(shù)應(yīng)用場(chǎng)景仍處于炒概念不同的是,今年WAIC期間,各個(gè)參展商都帶來已經(jīng)成熟落地的應(yīng)用,這些應(yīng)用有一些是在原先軟件服務(wù)基礎(chǔ)上,AI化之后提供的“解決方案的智能化”,有一些則是基于AI開發(fā)的,AI原生的“智能化的解決方案”,但它們相較于去年,都有了不少實(shí)際落地的經(jīng)驗(yàn)與成果展示。
比如,在大會(huì)期間,在中信集團(tuán)展臺(tái)上,華智生物展示了融合AI圖像識(shí)別與深度學(xué)習(xí)技術(shù)的智能考種分析儀,解決了傳統(tǒng)依賴皮帶傳動(dòng)與風(fēng)選模式識(shí)別空頭稻穗存在的誤判率高、數(shù)據(jù)離散等痛點(diǎn)。
AI智能體創(chuàng)造價(jià)值的場(chǎng)景不僅局限于農(nóng)業(yè)領(lǐng)域,圍繞醫(yī)療、工業(yè)、金融、交通等領(lǐng)域,也有不少?gòu)S商在本屆WAIC上帶來了全新的,結(jié)合了智能體的應(yīng)用場(chǎng)景。
除了傳統(tǒng)面向B端的企業(yè)級(jí)AI應(yīng)用之外,在C端,AI在面向終端用戶方面也有了不少成熟的應(yīng)用落地。比如在Soul連續(xù)多年參加WAIC的主題中,可以看到其“AI+社交”的發(fā)展路線,今年,Soul更是在原有AI功能的基礎(chǔ)上,在底層技術(shù)和應(yīng)用方面升級(jí),帶來了全雙工實(shí)時(shí)語音通話大模型,以及全新的AI社區(qū)應(yīng)用成果。
AI+社交,為什么“活人感”很重要
根據(jù)關(guān)注年輕人趨勢(shì)的JustSoSoul研究院2025年上半年調(diào)研數(shù)據(jù),超過80%的年輕用戶正借助AI建立起真實(shí)的人際關(guān)系。其中,39.9%從AI獲得了話題建議和情感咨詢/支持,43.6%憑借AI生成答復(fù)成功社交破冰,37.7%在AI幫助下匹配到了志趣相投的好友。
觀察Soul的技術(shù)發(fā)展路線,其人機(jī)互動(dòng)的迭代方向便是讓AI實(shí)現(xiàn)類真人能力,在交互中為用戶帶來情緒價(jià)值和信息價(jià)值,提升個(gè)體體驗(yàn),并促進(jìn)現(xiàn)實(shí)關(guān)系發(fā)展。
一方面,快速的生活節(jié)奏催生了個(gè)體的“原子化”趨勢(shì)和現(xiàn)實(shí)社交困境;另一方面,AI技術(shù)的升級(jí)進(jìn)一步賦能鏈接并重塑大眾對(duì)人機(jī)互動(dòng)的認(rèn)知。
據(jù)了解,過去一年,Soul的AI能力有了較大的迭代,特別是在2024年,SoulAI大模型能力整體升級(jí)為了多模態(tài)端到端大模型,支持文字對(duì)話、語音通話、多語種、多模態(tài)理解、真實(shí)擬人等特性。
“目前,Soul的關(guān)系模型靈犀能夠推薦‘精神層面距離最近的靈魂’,情緒模型SoulX能夠精準(zhǔn)捕捉如孤獨(dú)感、安全感等用戶情感需求,通過AI向用戶提供長(zhǎng)期的情緒價(jià)值?!痹赪AIC現(xiàn)場(chǎng),SoulApp副總裁及市場(chǎng)負(fù)責(zé)人范莉這樣介紹道。
值得注意的是,在AI技術(shù)不斷演進(jìn)的過程中,Soul在過去一段時(shí)間重點(diǎn)布局了“全雙工”方向,打破目前行業(yè)中語音交互普遍的“一來一往”形式,讓AI自主決定說話時(shí)機(jī)。
筆者在WAIC現(xiàn)場(chǎng)感受了一下全雙工語音大模型的效果。傳統(tǒng)的半雙工的一問一答,且中間還需要AI反應(yīng)回饋的等待時(shí)間。但在全雙工的模式下,用戶與AI的交互是同步的,AI甚至?xí)驍鄬?duì)話者的通話并基于這段對(duì)話反饋。比如在筆者體驗(yàn)過程中,面對(duì)筆者提出的“你是哪里人?”的問題,當(dāng)筆者“話音未落”,AI就開始回答,并主動(dòng)向筆者介紹了當(dāng)?shù)氐奶厣?/p>
(WAIC2025SoulApp展臺(tái)體驗(yàn)現(xiàn)場(chǎng))
值得注意的是,全雙工語音大模型發(fā)音方面與真人“難辨真假”,在現(xiàn)場(chǎng)體驗(yàn)環(huán)節(jié),筆者僅通過聽聲音并不能準(zhǔn)確地辨別對(duì)話中兩個(gè)聲音哪個(gè)是真人,在工作人員的告知下才得知真相。除此之外,該模型還能模仿各個(gè)地區(qū)的方言。與傳統(tǒng)的語音模型聲音過于機(jī)器化相比,全雙工大模型能帶給用戶更加真實(shí)的體驗(yàn),帶來“活人感”的互動(dòng)。
當(dāng)然,在技術(shù)探索的過程中,Soul也遇見了不小的挑戰(zhàn),其中,打破行業(yè)中普遍存在的“輪次對(duì)話”模式,賦予AI自主決策對(duì)話節(jié)奏的能力就是一個(gè)不小的挑戰(zhàn)。
例如,Soul通過讓模型基于建模預(yù)測(cè)沉默(Silence)和響應(yīng)(Response)Token預(yù)測(cè)任務(wù),實(shí)現(xiàn)機(jī)器人的完全自主決策能力,精準(zhǔn)控制對(duì)話節(jié)奏中的沉默與發(fā)聲時(shí)機(jī),“Soul的方法讓AI自己‘琢磨’什么時(shí)候該沉默(等著聽你說),什么時(shí)候該開口回應(yīng)你,就像真人對(duì)話一樣,它自己掌控節(jié)奏,時(shí)機(jī)更準(zhǔn)?!盨oulAppAI技術(shù)負(fù)責(zé)人尹順順表示。
以持續(xù)的技術(shù)能力建設(shè)為基礎(chǔ),Soul希望圍繞用戶實(shí)際的社交需求,深入推進(jìn)AIGC技術(shù)與社交場(chǎng)景的深度融合,在‘模應(yīng)一體’方向下,為用戶帶來更沉浸、更智能、更深度的社交體驗(yàn)。
而看好全雙工語音大模型的不僅是Soul一家,還有很多國(guó)內(nèi)外的廠商都圍繞全雙工大模型展開了布局。
以谷歌為例,在GoogleI/O2025大會(huì)上,谷歌就對(duì)GeminiLiveAPI進(jìn)行了全新升級(jí),除了更加細(xì)致的情感理解和雙人語音合成,更吸引人注意的便是“主動(dòng)音頻”和“主動(dòng)視頻”功能。以主動(dòng)音頻為例,谷歌Gemini模型展現(xiàn)的能力,就與Soul推出的全雙工語音大模型能力類似。具體來看,主動(dòng)音頻功能中,模型將忽略背景對(duì)話并知道何時(shí)回應(yīng)。demo演示中,Gemini會(huì)主動(dòng)忽略人類對(duì)話里一些類似“ok”這樣的背景聲音,持續(xù)說話。
在接受媒體訪談時(shí),GoogleDeepMind研究主管GregWayne也曾表示,谷歌在全雙工音頻輸出方面加大了研發(fā)力度,“它可以同時(shí)處理聽和說,這可能會(huì)有點(diǎn)煩人。它可能會(huì)打斷你。但它也更像自然的對(duì)話。當(dāng)你說話時(shí),我可能會(huì)說,‘嗯嗯’、‘嗯嗯’,它在同時(shí)聽和說。這是用來確認(rèn)的語言的一部分。”GregWayne指出。
由Soul和谷歌的業(yè)務(wù)布局不難看出,基于人類對(duì)更為真實(shí)的交互感受的向往,AI若想真正要在社交中體現(xiàn)價(jià)值,具備更強(qiáng)的“活人感”和“主動(dòng)性”,是必不可少的能力。
從“AI”到“愛”,在應(yīng)用中展現(xiàn)價(jià)值
全雙工語音大模型的探索外,本屆WAIC上,Soul還展示一些“不一樣”的嘗試——讓AI真正融入到個(gè)體的社交網(wǎng)絡(luò)之中,讓社交變得更簡(jiǎn)單。
具體來看,Soul在此次WAIC展會(huì)上展示的新能力落地在Soul平臺(tái)應(yīng)用場(chǎng)景——群聊派對(duì)AI主持的真實(shí)交互體驗(yàn)。依托新能力,在多人語音互動(dòng)場(chǎng)景中,AI主持人不僅具備全面管理群聊派對(duì)秩序的類真人主持的操作能力,還能夠自然進(jìn)行語音互動(dòng),有效活躍氣氛、鼓勵(lì)用戶參與對(duì)話討論,顯著提升群聊派對(duì)的參與度和體驗(yàn)感。
可以想象一下,在年輕人具體使用場(chǎng)景中,如當(dāng)求職季到來,大家可以在AI面試官的組織下,舉辦“模擬群面”,感受真實(shí)招聘場(chǎng)景下可能遇到的提問、集體問答、搶答等現(xiàn)實(shí)環(huán)節(jié);而在相親場(chǎng)景中,大家可以在AI紅娘的主持中,自然破冰、相識(shí),一起進(jìn)行趣味互動(dòng)。
(現(xiàn)場(chǎng)體驗(yàn)與虛擬人視頻通話)
不僅于此,現(xiàn)場(chǎng)筆者還體驗(yàn)到了Soul還在探索全雙工視頻通話能力的探索,和虛擬人“實(shí)時(shí)視頻”過程中,基于實(shí)時(shí)的視頻生成能力和全雙工語音交互能力,在實(shí)際交互體驗(yàn)中,可以看到“AI的形象和世界”,人機(jī)交互真正成為了“情感與信息的雙向交流”。
隨著AI技術(shù)從大模型向智能體演進(jìn)進(jìn)程的深入,社交智能體也是Soul布局的重點(diǎn)。社交智能體需要非常多維和復(fù)雜的能力組合,其中包括了交互能力(例如自然語言理解與生成、全雙工語音/視頻通話、多模態(tài)感知/表達(dá))、認(rèn)知與情感能力(例如情感識(shí)別、長(zhǎng)記憶、心智理論能力)、社會(huì)性構(gòu)建(人設(shè)一致性、時(shí)間/事件感知能力)、風(fēng)控安全體系等等。
而Soul在社交領(lǐng)域的深入布局,也讓其在技術(shù)與行業(yè)KnowHow上具備了先發(fā)優(yōu)勢(shì)。上線于2016年,多年的積累和長(zhǎng)期與用戶對(duì)接的過程,已經(jīng)讓Soul在社交軟件領(lǐng)域具備了充足的行業(yè)KnowHow。
在技術(shù)方面,Soul于2020年就開啟了AIGC的研發(fā)工作,并在智能對(duì)話、語音、3D虛擬人等方面擁有前沿積累。自2023年推出自研語言大模型SoulX后,Soul還陸續(xù)上線了語音生成大模型、語音通話大模型、音樂生成大模型等語音大模型能力。
目前,SoulAI大模型能力已整體升級(jí)為了多模態(tài)端到端大模型,支持文字對(duì)話、語音通話、多語種、多模態(tài)理解、真實(shí)擬人等特性,能夠?qū)崿F(xiàn)更接近生活日常的交互對(duì)話和“類真人”的情感陪伴體驗(yàn)。這些都是Soul在社交智能體的構(gòu)建中積累的前沿能力,例如此次的全雙工語音通話大模型的發(fā)布,便能夠極大提升了社交智能體的交互能力,此外在多模態(tài)交互、認(rèn)知與情感能力、社會(huì)性構(gòu)建、AI安全等Soul都有探索和布局。
除了技術(shù)上的探索之外,在社區(qū)生態(tài)運(yùn)營(yíng)上,Soul也有著自己獨(dú)特的見解。據(jù)Soul統(tǒng)計(jì),平臺(tái)“廣場(chǎng)”上有高達(dá)18%的新發(fā)帖直接反映了用戶的真實(shí)社交困境(如人際關(guān)系處理、社交開啟話題、職場(chǎng)交友),而用戶分享的生活、情感內(nèi)容及其引發(fā)的深度共鳴,構(gòu)成了寶貴的“社交樣本庫”。SoulApp副總裁及市場(chǎng)負(fù)責(zé)人范莉介紹道,Soul正在深化AI與社區(qū)的融合,具體包括了多維度的舉措。
例如,利用AI的能力,可以重塑社交內(nèi)容和互動(dòng)方式,通過大模型,根據(jù)用戶興趣和歷史數(shù)據(jù),智能推薦主題,并輔助生成內(nèi)容,降低了用戶表達(dá)門檻的同時(shí),還能實(shí)現(xiàn)個(gè)性化內(nèi)容的產(chǎn)出。
同時(shí),打造由虛擬達(dá)人組成的Agent生態(tài),構(gòu)建社交情感的“附近”。不同人設(shè)的虛擬達(dá)人,能從海量信息中識(shí)別真實(shí)的孤獨(dú)信號(hào),并以細(xì)膩、溫暖的互動(dòng)提供即時(shí)情感支持和共鳴。
最終,通過“可共創(chuàng)、可互動(dòng)”的虛擬人與真人社交的深度融合,Soul希望推動(dòng)社交向“情感共生”進(jìn)化,助力構(gòu)建新世代的數(shù)字身份認(rèn)同體系。
正如前文提到的:JustSoSoul研究院2025年上半年調(diào)研數(shù)據(jù)顯示,超過80%的年輕用戶正借助AI建立起真實(shí)的人際關(guān)系,此外,超過70%的年輕人愿意和AI交朋友,這顯示出了Z世代的年輕人對(duì)于人機(jī)關(guān)系新的理解。而在情緒價(jià)值的交互中,也將催生新市場(chǎng),《情緒消費(fèi)崛起:2025年市場(chǎng)格局與未來走向》顯示,中國(guó)情緒消費(fèi)市場(chǎng)規(guī)模預(yù)計(jì)到2025年將突破2萬億元。AI作為關(guān)鍵變量,也將在與社交方向融合過程中,延展出新的產(chǎn)品范式和商業(yè)機(jī)會(huì)。
對(duì)于社交類APP而言,在AI時(shí)代誰能提供更為真實(shí)的交互感受,以及更多的情緒價(jià)值,誰就能占有更多的年輕人市場(chǎng),而在這點(diǎn)上顯然Soul已經(jīng)走在了前列。
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。