本文來(lái)自微信公眾號(hào):山上,作者:薛星星,蔣澆,題圖來(lái)自:AI生成
經(jīng)過(guò)了兩年對(duì)Edge瀏覽器AI功能的小修小補(bǔ)之后,微軟在昨天(7月29日)為Edge瀏覽器加入Copilot模式,正式進(jìn)軍AI瀏覽器市場(chǎng)。
具體來(lái)說(shuō),Edge瀏覽器中的AI功能不再像以前一樣只是一個(gè)聊天側(cè)邊欄,新推出的Copilot模式可以讓AI閱讀和理解網(wǎng)頁(yè)內(nèi)容,比如幫你做一個(gè)技術(shù)文檔頁(yè)面的解讀或者Youtube視頻的觀看大綱。
它也可以一次性瀏覽所有你已打開(kāi)的網(wǎng)頁(yè),當(dāng)你在多個(gè)商品或者酒店頁(yè)面來(lái)回切換煩惱時(shí),幫你列一個(gè)對(duì)比表格來(lái)輔助決策。微軟還增加了語(yǔ)音功能,你可以通過(guò)語(yǔ)音聊天來(lái)理解網(wǎng)頁(yè)、和AI實(shí)時(shí)對(duì)話。
這些功能看上去與市面上已有的AI瀏覽器好像沒(méi)什么不同,但微軟CEO薩提亞·納德拉(SatyaNadella)對(duì)此贊不絕口,“這是我們?yōu)锳I時(shí)代重新定義瀏覽器的第一步?!彼f(shuō)他最喜歡multi-tabRAG功能,可以讓他更快地分析微軟過(guò)去一年在Nature上發(fā)表的論文——介紹新功能的同時(shí)順帶炫耀一番。
目前該功能尚處實(shí)驗(yàn)階段,微軟稱(chēng)將會(huì)逐漸為Copilot模式加入新功能。實(shí)驗(yàn)的另一層含義是現(xiàn)在Copilot模式為“限時(shí)免費(fèi)”??紤]到目前Copilot仍由OpenAI提供基礎(chǔ)模型支持,這意味著你可以免費(fèi)使用不少ChatGPT的付費(fèi)功能。
比如你可以在Copilot模式下使用ChatGPT中付費(fèi)的DeepResearch功能。納德拉還透露他們將推出任務(wù)代理功能,讓用戶(hù)在瀏覽網(wǎng)頁(yè)的同時(shí)委托Copilot處理任務(wù)。一位AI創(chuàng)業(yè)者將其稱(chēng)之為ChatGPTAgent的免費(fèi)替代版。ChatGPTAgent目前僅向Plus及以上用戶(hù)開(kāi)放,最低月付費(fèi)20美元。
這大概也是當(dāng)前Edge相較其他AI瀏覽器最大的吸引力了。在OpenAI還沒(méi)正式推出自家瀏覽器之前,你可以在Edge中使用平替版的ChatGPT——算是為山姆·阿爾特曼(SamAltman)脫離微軟又提供了一個(gè)借口。
Edge能讀懂網(wǎng)頁(yè)了,但也僅此而已
和2023年最初宣布Edge瀏覽器向AI轉(zhuǎn)型一樣,微軟官網(wǎng)發(fā)布的產(chǎn)品更新中對(duì)Copilot模式依然添加了不少宏大的名詞概念,諸如“我們正見(jiàn)證著網(wǎng)絡(luò)互動(dòng)方式的轉(zhuǎn)折點(diǎn)”“這是我們進(jìn)一步探索更強(qiáng)大網(wǎng)頁(yè)瀏覽方式的下一步”等等。
但用戶(hù)打開(kāi)Copilot模式之后,最明顯的感知或許就是主頁(yè)界面變成了一個(gè)Copilot對(duì)話框,微軟稱(chēng)之為“整合了對(duì)話、搜索和網(wǎng)頁(yè)導(dǎo)航”,敲入關(guān)鍵詞時(shí)可以啟用Bing搜索也可以直接與Copilot對(duì)話。
微軟在產(chǎn)品文檔中介紹,Copilot可以理解用戶(hù)意圖,幫助用戶(hù)更高效地理清信息,不再被龐雜的標(biāo)簽頁(yè)面困擾。你在瀏覽網(wǎng)頁(yè)時(shí),也可以隨時(shí)調(diào)出地址欄左側(cè)的Copilot提問(wèn),Copilot還可以根據(jù)用戶(hù)的歷史記錄,預(yù)測(cè)用戶(hù)下一步操作給出建議。
以前段時(shí)間Manus在官網(wǎng)發(fā)布的AIAgent上下文工程的技術(shù)文檔為例。打開(kāi)網(wǎng)頁(yè),Copilot可以理解網(wǎng)頁(yè)內(nèi)容,為用戶(hù)提供文檔解讀或大綱。它似乎也可以理解視頻內(nèi)容,比如對(duì)一則Youtube視頻進(jìn)行要點(diǎn)整理,生成視頻摘要。
Copilot總結(jié)網(wǎng)頁(yè)內(nèi)容
Copilot總結(jié)Youtube視頻
針對(duì)電商網(wǎng)站,Copilot還可以根據(jù)商品詳情頁(yè)進(jìn)行AI總結(jié),還會(huì)提供歷史價(jià)格走勢(shì)圖、與其他網(wǎng)站進(jìn)行比價(jià)等。不過(guò)這項(xiàng)功能僅適應(yīng)于亞馬遜、Shein等海外購(gòu)物網(wǎng)站,國(guó)內(nèi)淘寶、京東等電商網(wǎng)站尚不支持。
Copilot總結(jié)商品頁(yè)面
但這些只能算是AI瀏覽器的基礎(chǔ)能力。國(guó)內(nèi)的夸克、豆包乃至QQ瀏覽器也有類(lèi)似功能,夸克的AI總結(jié)會(huì)將原有網(wǎng)頁(yè)轉(zhuǎn)換閱讀模式,豆包也可以對(duì)B站上的視頻進(jìn)行分析整理,QQ瀏覽器還推出了網(wǎng)頁(yè)搜索與模型對(duì)話的雙屏功能。更不客氣點(diǎn),你在Chrome上安裝一個(gè)AI插件就可以獲得近似體驗(yàn),還能自定義模型。
Copilot模式更顯著的區(qū)別是它具備了主動(dòng)能力,比如AItabgrouping,可以自動(dòng)按主題將你的標(biāo)簽頁(yè)歸組。又或者納德亞口中的multi-tabRAG功能,它可以讓AI瀏覽用戶(hù)已打開(kāi)的所有標(biāo)簽頁(yè)內(nèi)容,無(wú)論你是在閱讀論文、比較酒店或者瀏覽新聞,都可以快速啟用這一功能,“讓你的瀏覽器變成一個(gè)幫助你輕松比較、決策和完成任務(wù)的工具?!?/p>
《山上》實(shí)測(cè)了包括淘寶、京東以及亞馬遜等多個(gè)國(guó)內(nèi)外的電商網(wǎng)站,Copilot都可以整理多個(gè)不同平臺(tái)、網(wǎng)頁(yè)的商品型號(hào)、賣(mài)點(diǎn)、價(jià)格、評(píng)價(jià)等,給出一個(gè)詳細(xì)的購(gòu)買(mǎi)建議。此前國(guó)內(nèi)密集更新的AIAgent產(chǎn)品,多數(shù)也都能實(shí)現(xiàn)類(lèi)似功能。
Copilot總結(jié)天貓商品頁(yè)面并給出購(gòu)買(mǎi)建議
但也僅此而已了,和市面上所有號(hào)稱(chēng)Agent能力的產(chǎn)品一樣,Copilot并沒(méi)有打通支付環(huán)節(jié),無(wú)論是預(yù)定酒店、購(gòu)買(mǎi)商品還是規(guī)劃行程,它都無(wú)法實(shí)現(xiàn)微軟宣傳片中的無(wú)縫體驗(yàn),這些功能都還是期貨。
Copilot也可以閱讀PDF文檔。打開(kāi)阿里巴巴的2024年的季度財(cái)報(bào),Copilot會(huì)閱讀文檔內(nèi)容并給出針對(duì)性的回答。它還接入了OpenAI的文生圖能力,連續(xù)對(duì)話后它會(huì)詢(xún)問(wèn)你是否需要將財(cái)務(wù)數(shù)據(jù)整理成可視化圖表。只是仍然沒(méi)法直接使用,圖表中有不少錯(cuò)誤,比如完全丟掉了阿里巴巴2024年第一季度的業(yè)績(jī)——它只閱讀了三個(gè)網(wǎng)頁(yè)。
Copilot閱讀PDF財(cái)報(bào)
在語(yǔ)音模式的加入下,微軟為Copilot模式增加了一個(gè)頗具科幻感的Vision功能。你可以用語(yǔ)音與Copilot實(shí)時(shí)對(duì)話,無(wú)論你正在瀏覽什么網(wǎng)頁(yè),都可以直接語(yǔ)音提問(wèn)“這段在說(shuō)什么”或者“這張圖片是什么”?!八鼤?huì)看到你當(dāng)前的頁(yè)面,與你一起閱讀,一起討論你面臨的難題。你不會(huì)再有獨(dú)自一人面對(duì)所有標(biāo)簽頁(yè)的孤獨(dú)體驗(yàn)?!蔽④洿饲暗漠a(chǎn)品文檔中說(shuō)。
但這項(xiàng)能力同樣不算新鮮。Perplexity本月初發(fā)布的Comet瀏覽器同樣支持語(yǔ)音實(shí)時(shí)交互,但目前Comet初期僅向PerplexityMax訂閱用戶(hù)($200/月)及部分邀請(qǐng)用戶(hù)開(kāi)放,尚未全量鋪開(kāi)。
豆包桌面版同樣具備類(lèi)似功能,但在Mac系統(tǒng)下必須打開(kāi)屏幕共享權(quán)限,將整個(gè)桌面畫(huà)面共享給AI,而Edge無(wú)需打開(kāi)屏幕共享?!渡缴稀穼?shí)測(cè)發(fā)現(xiàn),豆包的語(yǔ)音互動(dòng)無(wú)法實(shí)時(shí)對(duì)話打斷,只能通過(guò)手動(dòng)點(diǎn)擊屏幕打斷,互動(dòng)性不強(qiáng)。與之相比,即便在國(guó)內(nèi)網(wǎng)絡(luò)環(huán)境訪問(wèn)下,CopilotVision的反應(yīng)速度也更快、回答更精準(zhǔn),同時(shí)也可以實(shí)時(shí)打斷,交互體驗(yàn)更接近即時(shí)溝通。
忘掉那些AI博主們高呼的網(wǎng)頁(yè)瀏覽形式變了的口號(hào)吧,就當(dāng)下的體驗(yàn)而言,Copilot模式的許多功能與現(xiàn)有AI瀏覽器沒(méi)有什么不同。微軟強(qiáng)調(diào)Copilot仍處于實(shí)驗(yàn)階段,他們?nèi)詫⒗^續(xù)增加新功能,用戶(hù)也可自行選擇打開(kāi)或者關(guān)閉。
混戰(zhàn)的AI瀏覽器,還沒(méi)到終極形態(tài)
與今年上半年的通用AIAgent概念相比,AI瀏覽器是一個(gè)更早也更快進(jìn)入到人們視野的產(chǎn)品。最早的AI瀏覽器大多只是在瀏覽器中內(nèi)置了部分AI能力,提供基礎(chǔ)的AI對(duì)話或網(wǎng)頁(yè)總結(jié)功能。
Agent熱潮襲來(lái)之后,更多的AI瀏覽器開(kāi)始強(qiáng)調(diào)自主執(zhí)行任務(wù)的能力,諸如TheBrowserCompany的Dia瀏覽器、Perplexity的Comet瀏覽器以及OperaNeoa均屬此類(lèi)。微軟在宣傳Edge中的Copilot模式時(shí),同樣強(qiáng)調(diào)它的主動(dòng)性。
科技公司們對(duì)于AI瀏覽器的熱衷不難理解,誕生30余年之后,瀏覽器仍然是人們?cè)谧烂娑擞|達(dá)互聯(lián)網(wǎng)的第一窗口——甚至它的核心交互模式都沒(méi)有發(fā)生太大變化,一路從網(wǎng)景、IE演變到今天的Chrome,就連Chrome也是17年前的產(chǎn)品了。
大模型的誕生重塑了人們獲取信息的方式,人們普遍相信瀏覽器也將會(huì)發(fā)生改變,無(wú)論是巨頭還是創(chuàng)業(yè)公司都試圖搶占這一市場(chǎng)。市場(chǎng)調(diào)研機(jī)構(gòu)Market.us預(yù)測(cè),全球AI瀏覽器市場(chǎng)將從2024年的45億美元增長(zhǎng)至2034年的約768億,年復(fù)合增長(zhǎng)率達(dá)32.8%。
Market.us報(bào)告
但很難說(shuō)當(dāng)下的AI瀏覽器與AIAgent之間的區(qū)隔有多么清晰——二者的底層技術(shù)類(lèi)似、瞄準(zhǔn)的方向也是一樣的。微軟在Copilot模式中展現(xiàn)的能力,都可以在OpenAI過(guò)去半年的功能更新中找到影子。比如OpenAI年初更新的Operator功能,它讓AI操作網(wǎng)頁(yè)成為可能。微軟在宣傳片中描繪的Copilot未來(lái)能力,也和OpenAI的ChatGPTAgent十分類(lèi)似。
蝴蝶效應(yīng)在推出Manus之前瞄準(zhǔn)的就是AI瀏覽器方向,但他們最終放棄了。Manus聯(lián)合創(chuàng)始人張濤說(shuō),AI瀏覽器的用戶(hù)體驗(yàn)受限,他們意識(shí)到要實(shí)現(xiàn)真正的通用的人工智能代理,必須要從瀏覽器界面脫離。
甚至Perplexity決定推出AI瀏覽器也像是被迫的,PerplexityCEOAravindSrinivas說(shuō),他曾經(jīng)聯(lián)系Chrome團(tuán)隊(duì),希望將Perplexity作為Chrome的默認(rèn)搜索引擎,但被拒絕,于是決定自己做一個(gè)。
——天知道Srinivas怎么想的。紐約時(shí)報(bào)稱(chēng),Google為了成為Safari的默認(rèn)搜索引擎,僅2021年就向蘋(píng)果支付了約180億美元,怎么可能會(huì)將自家Chrome讓給競(jìng)爭(zhēng)對(duì)手。
Srinivas對(duì)于AI瀏覽器的看法也和AIAgent有些類(lèi)似。他在今年4月的一次播客對(duì)談中說(shuō),瀏覽器就是構(gòu)建Agent的最佳方式?!盀g覽器本質(zhì)上就像一個(gè)容器化的操作系統(tǒng)。它可以在你已登錄第三方服務(wù)的情況下,通過(guò)隱藏標(biāo)簽頁(yè)訪問(wèn)這些服務(wù),在客戶(hù)端抓取頁(yè)面內(nèi)容,并代表你進(jìn)行推理和執(zhí)行操作?!?/p>
換句話說(shuō),AI瀏覽器其實(shí)也是一種AIAgent。只是由于當(dāng)前大模型能力受限,仍無(wú)法擺脫原有的瀏覽器框架,只能繼續(xù)以傳統(tǒng)標(biāo)簽頁(yè)和網(wǎng)頁(yè)交互為核心,更多只是對(duì)現(xiàn)有瀏覽器體驗(yàn)的增強(qiáng),而非徹底顛覆。
很難說(shuō)這樣的中間形態(tài)會(huì)吸引多少用戶(hù)改變習(xí)慣。微軟早在2023年就開(kāi)始為Edge瀏覽器加入AI功能,但兩年下來(lái)基本沒(méi)對(duì)Chrome造成太大威脅,AI的帶動(dòng)作用可能還沒(méi)有Chromium內(nèi)核大。
豌豆莢創(chuàng)始人王俊煜發(fā)表在《第一財(cái)經(jīng)》雜志的評(píng)論文章稱(chēng),今天的AI瀏覽器雖然努力做了很多體驗(yàn)創(chuàng)新,但還遠(yuǎn)遠(yuǎn)不夠形成質(zhì)變。AI還沒(méi)有深度融合到瀏覽器中,沒(méi)有真正成為“眼睛和手腳”。
Chrome瀏覽器的市場(chǎng)壟斷地位也很難輕易撼動(dòng),多數(shù)標(biāo)榜AI的瀏覽器仍然在使用Chromium內(nèi)核。OpenAI雖然被傳即將推出AI瀏覽器,但他們同時(shí)也對(duì)收購(gòu)Chrome興趣頗大。
“即使Dia能從其中找到帶來(lái)10倍體驗(yàn)的亮點(diǎn),我也看不到什么Chrome無(wú)法跟進(jìn)的理由?!蓖蹩§险f(shuō)。5月,Google在Chrome中增加了Gemini入口,可以閱讀網(wǎng)頁(yè)和對(duì)話,體驗(yàn)與Dia相似。
AI瀏覽器往往強(qiáng)調(diào)可以自主操作網(wǎng)頁(yè),但又帶來(lái)了隱私安全問(wèn)題,并不是所有用戶(hù)都愿意將自己瀏覽的網(wǎng)頁(yè)發(fā)給AI。
此前微軟在Windows中內(nèi)測(cè)Recall功能,這是一個(gè)內(nèi)嵌在系統(tǒng)層級(jí)的AI工具,可以在后臺(tái)定期截取用戶(hù)屏幕和內(nèi)容,以方便用戶(hù)隨時(shí)切換至此前時(shí)間點(diǎn)。Recall一經(jīng)推出就遭遇不少批評(píng),部分媒體報(bào)道甚至將其形容為監(jiān)控軟件。
科技媒體TheVerge報(bào)道了微軟在Edge瀏覽器中推出Copilot模式的消息。文章下的高贊評(píng)論寫(xiě)道:“微軟在Edge的最新更新中捆綁了垃圾軟件Copilot。”
另一條更活潑的評(píng)論說(shuō),“微軟需要決定一下,我到底該在瀏覽器里使用Copilot,還是在Windows11里使用?抑或是在Word文檔的每一行,甚至Excel的每一個(gè)單元格用?把那個(gè)該死的Copilot標(biāo)志塞滿(mǎn)每個(gè)角落,實(shí)在讓人心煩?!?/p>
本文來(lái)自微信公眾號(hào):山上,作者:山上
本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表虎嗅立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系hezuo@huxiu.com
本文來(lái)自虎嗅,原文鏈接:https://www.huxiu.com/article/4633479.html?f=wyxwapp
延伸閱讀:與 【維持巨頭】的平:,庸 的相關(guān)文章