本文來自微信公眾號(hào):山上,作者:薛星星,蔣澆,題圖來自:AI生成
經(jīng)過了兩年對(duì)Edge瀏覽器AI功能的小修小補(bǔ)之后,微軟在昨天(7月29日)為Edge瀏覽器加入Copilot模式,正式進(jìn)軍AI瀏覽器市場(chǎng)。
具體來說,Edge瀏覽器中的AI功能不再像以前一樣只是一個(gè)聊天側(cè)邊欄,新推出的Copilot模式可以讓AI閱讀和理解網(wǎng)頁內(nèi)容,比如幫你做一個(gè)技術(shù)文檔頁面的解讀或者Youtube視頻的觀看大綱。
它也可以一次性瀏覽所有你已打開的網(wǎng)頁,當(dāng)你在多個(gè)商品或者酒店頁面來回切換煩惱時(shí),幫你列一個(gè)對(duì)比表格來輔助決策。微軟還增加了語音功能,你可以通過語音聊天來理解網(wǎng)頁、和AI實(shí)時(shí)對(duì)話。
這些功能看上去與市面上已有的AI瀏覽器好像沒什么不同,但微軟CEO薩提亞·納德拉(SatyaNadella)對(duì)此贊不絕口,“這是我們?yōu)锳I時(shí)代重新定義瀏覽器的第一步?!彼f他最喜歡multi-tabRAG功能,可以讓他更快地分析微軟過去一年在Nature上發(fā)表的論文——介紹新功能的同時(shí)順帶炫耀一番。
目前該功能尚處實(shí)驗(yàn)階段,微軟稱將會(huì)逐漸為Copilot模式加入新功能。實(shí)驗(yàn)的另一層含義是現(xiàn)在Copilot模式為“限時(shí)免費(fèi)”。考慮到目前Copilot仍由OpenAI提供基礎(chǔ)模型支持,這意味著你可以免費(fèi)使用不少ChatGPT的付費(fèi)功能。
比如你可以在Copilot模式下使用ChatGPT中付費(fèi)的DeepResearch功能。納德拉還透露他們將推出任務(wù)代理功能,讓用戶在瀏覽網(wǎng)頁的同時(shí)委托Copilot處理任務(wù)。一位AI創(chuàng)業(yè)者將其稱之為ChatGPTAgent的免費(fèi)替代版。ChatGPTAgent目前僅向Plus及以上用戶開放,最低月付費(fèi)20美元。
這大概也是當(dāng)前Edge相較其他AI瀏覽器最大的吸引力了。在OpenAI還沒正式推出自家瀏覽器之前,你可以在Edge中使用平替版的ChatGPT——算是為山姆·阿爾特曼(SamAltman)脫離微軟又提供了一個(gè)借口。
Edge能讀懂網(wǎng)頁了,但也僅此而已
和2023年最初宣布Edge瀏覽器向AI轉(zhuǎn)型一樣,微軟官網(wǎng)發(fā)布的產(chǎn)品更新中對(duì)Copilot模式依然添加了不少宏大的名詞概念,諸如“我們正見證著網(wǎng)絡(luò)互動(dòng)方式的轉(zhuǎn)折點(diǎn)”“這是我們進(jìn)一步探索更強(qiáng)大網(wǎng)頁瀏覽方式的下一步”等等。
但用戶打開Copilot模式之后,最明顯的感知或許就是主頁界面變成了一個(gè)Copilot對(duì)話框,微軟稱之為“整合了對(duì)話、搜索和網(wǎng)頁導(dǎo)航”,敲入關(guān)鍵詞時(shí)可以啟用Bing搜索也可以直接與Copilot對(duì)話。
微軟在產(chǎn)品文檔中介紹,Copilot可以理解用戶意圖,幫助用戶更高效地理清信息,不再被龐雜的標(biāo)簽頁面困擾。你在瀏覽網(wǎng)頁時(shí),也可以隨時(shí)調(diào)出地址欄左側(cè)的Copilot提問,Copilot還可以根據(jù)用戶的歷史記錄,預(yù)測(cè)用戶下一步操作給出建議。
以前段時(shí)間Manus在官網(wǎng)發(fā)布的AIAgent上下文工程的技術(shù)文檔為例。打開網(wǎng)頁,Copilot可以理解網(wǎng)頁內(nèi)容,為用戶提供文檔解讀或大綱。它似乎也可以理解視頻內(nèi)容,比如對(duì)一則Youtube視頻進(jìn)行要點(diǎn)整理,生成視頻摘要。
Copilot總結(jié)網(wǎng)頁內(nèi)容
Copilot總結(jié)Youtube視頻
針對(duì)電商網(wǎng)站,Copilot還可以根據(jù)商品詳情頁進(jìn)行AI總結(jié),還會(huì)提供歷史價(jià)格走勢(shì)圖、與其他網(wǎng)站進(jìn)行比價(jià)等。不過這項(xiàng)功能僅適應(yīng)于亞馬遜、Shein等海外購物網(wǎng)站,國內(nèi)淘寶、京東等電商網(wǎng)站尚不支持。
Copilot總結(jié)商品頁面
但這些只能算是AI瀏覽器的基礎(chǔ)能力。國內(nèi)的夸克、豆包乃至QQ瀏覽器也有類似功能,夸克的AI總結(jié)會(huì)將原有網(wǎng)頁轉(zhuǎn)換閱讀模式,豆包也可以對(duì)B站上的視頻進(jìn)行分析整理,QQ瀏覽器還推出了網(wǎng)頁搜索與模型對(duì)話的雙屏功能。更不客氣點(diǎn),你在Chrome上安裝一個(gè)AI插件就可以獲得近似體驗(yàn),還能自定義模型。
Copilot模式更顯著的區(qū)別是它具備了主動(dòng)能力,比如AItabgrouping,可以自動(dòng)按主題將你的標(biāo)簽頁歸組。又或者納德亞口中的multi-tabRAG功能,它可以讓AI瀏覽用戶已打開的所有標(biāo)簽頁內(nèi)容,無論你是在閱讀論文、比較酒店或者瀏覽新聞,都可以快速啟用這一功能,“讓你的瀏覽器變成一個(gè)幫助你輕松比較、決策和完成任務(wù)的工具?!?/p>
《山上》實(shí)測(cè)了包括淘寶、京東以及亞馬遜等多個(gè)國內(nèi)外的電商網(wǎng)站,Copilot都可以整理多個(gè)不同平臺(tái)、網(wǎng)頁的商品型號(hào)、賣點(diǎn)、價(jià)格、評(píng)價(jià)等,給出一個(gè)詳細(xì)的購買建議。此前國內(nèi)密集更新的AIAgent產(chǎn)品,多數(shù)也都能實(shí)現(xiàn)類似功能。
Copilot總結(jié)天貓商品頁面并給出購買建議
但也僅此而已了,和市面上所有號(hào)稱Agent能力的產(chǎn)品一樣,Copilot并沒有打通支付環(huán)節(jié),無論是預(yù)定酒店、購買商品還是規(guī)劃行程,它都無法實(shí)現(xiàn)微軟宣傳片中的無縫體驗(yàn),這些功能都還是期貨。
Copilot也可以閱讀PDF文檔。打開阿里巴巴的2024年的季度財(cái)報(bào),Copilot會(huì)閱讀文檔內(nèi)容并給出針對(duì)性的回答。它還接入了OpenAI的文生圖能力,連續(xù)對(duì)話后它會(huì)詢問你是否需要將財(cái)務(wù)數(shù)據(jù)整理成可視化圖表。只是仍然沒法直接使用,圖表中有不少錯(cuò)誤,比如完全丟掉了阿里巴巴2024年第一季度的業(yè)績——它只閱讀了三個(gè)網(wǎng)頁。
Copilot閱讀PDF財(cái)報(bào)
在語音模式的加入下,微軟為Copilot模式增加了一個(gè)頗具科幻感的Vision功能。你可以用語音與Copilot實(shí)時(shí)對(duì)話,無論你正在瀏覽什么網(wǎng)頁,都可以直接語音提問“這段在說什么”或者“這張圖片是什么”。“它會(huì)看到你當(dāng)前的頁面,與你一起閱讀,一起討論你面臨的難題。你不會(huì)再有獨(dú)自一人面對(duì)所有標(biāo)簽頁的孤獨(dú)體驗(yàn)?!蔽④洿饲暗漠a(chǎn)品文檔中說。
但這項(xiàng)能力同樣不算新鮮。Perplexity本月初發(fā)布的Comet瀏覽器同樣支持語音實(shí)時(shí)交互,但目前Comet初期僅向PerplexityMax訂閱用戶($200/月)及部分邀請(qǐng)用戶開放,尚未全量鋪開。
豆包桌面版同樣具備類似功能,但在Mac系統(tǒng)下必須打開屏幕共享權(quán)限,將整個(gè)桌面畫面共享給AI,而Edge無需打開屏幕共享?!渡缴稀穼?shí)測(cè)發(fā)現(xiàn),豆包的語音互動(dòng)無法實(shí)時(shí)對(duì)話打斷,只能通過手動(dòng)點(diǎn)擊屏幕打斷,互動(dòng)性不強(qiáng)。與之相比,即便在國內(nèi)網(wǎng)絡(luò)環(huán)境訪問下,CopilotVision的反應(yīng)速度也更快、回答更精準(zhǔn),同時(shí)也可以實(shí)時(shí)打斷,交互體驗(yàn)更接近即時(shí)溝通。
忘掉那些AI博主們高呼的網(wǎng)頁瀏覽形式變了的口號(hào)吧,就當(dāng)下的體驗(yàn)而言,Copilot模式的許多功能與現(xiàn)有AI瀏覽器沒有什么不同。微軟強(qiáng)調(diào)Copilot仍處于實(shí)驗(yàn)階段,他們?nèi)詫⒗^續(xù)增加新功能,用戶也可自行選擇打開或者關(guān)閉。
混戰(zhàn)的AI瀏覽器,還沒到終極形態(tài)
與今年上半年的通用AIAgent概念相比,AI瀏覽器是一個(gè)更早也更快進(jìn)入到人們視野的產(chǎn)品。最早的AI瀏覽器大多只是在瀏覽器中內(nèi)置了部分AI能力,提供基礎(chǔ)的AI對(duì)話或網(wǎng)頁總結(jié)功能。
Agent熱潮襲來之后,更多的AI瀏覽器開始強(qiáng)調(diào)自主執(zhí)行任務(wù)的能力,諸如TheBrowserCompany的Dia瀏覽器、Perplexity的Comet瀏覽器以及OperaNeoa均屬此類。微軟在宣傳Edge中的Copilot模式時(shí),同樣強(qiáng)調(diào)它的主動(dòng)性。
科技公司們對(duì)于AI瀏覽器的熱衷不難理解,誕生30余年之后,瀏覽器仍然是人們?cè)谧烂娑擞|達(dá)互聯(lián)網(wǎng)的第一窗口——甚至它的核心交互模式都沒有發(fā)生太大變化,一路從網(wǎng)景、IE演變到今天的Chrome,就連Chrome也是17年前的產(chǎn)品了。
大模型的誕生重塑了人們獲取信息的方式,人們普遍相信瀏覽器也將會(huì)發(fā)生改變,無論是巨頭還是創(chuàng)業(yè)公司都試圖搶占這一市場(chǎng)。市場(chǎng)調(diào)研機(jī)構(gòu)Market.us預(yù)測(cè),全球AI瀏覽器市場(chǎng)將從2024年的45億美元增長至2034年的約768億,年復(fù)合增長率達(dá)32.8%。
Market.us報(bào)告
但很難說當(dāng)下的AI瀏覽器與AIAgent之間的區(qū)隔有多么清晰——二者的底層技術(shù)類似、瞄準(zhǔn)的方向也是一樣的。微軟在Copilot模式中展現(xiàn)的能力,都可以在OpenAI過去半年的功能更新中找到影子。比如OpenAI年初更新的Operator功能,它讓AI操作網(wǎng)頁成為可能。微軟在宣傳片中描繪的Copilot未來能力,也和OpenAI的ChatGPTAgent十分類似。
蝴蝶效應(yīng)在推出Manus之前瞄準(zhǔn)的就是AI瀏覽器方向,但他們最終放棄了。Manus聯(lián)合創(chuàng)始人張濤說,AI瀏覽器的用戶體驗(yàn)受限,他們意識(shí)到要實(shí)現(xiàn)真正的通用的人工智能代理,必須要從瀏覽器界面脫離。
甚至Perplexity決定推出AI瀏覽器也像是被迫的,PerplexityCEOAravindSrinivas說,他曾經(jīng)聯(lián)系Chrome團(tuán)隊(duì),希望將Perplexity作為Chrome的默認(rèn)搜索引擎,但被拒絕,于是決定自己做一個(gè)。
——天知道Srinivas怎么想的。紐約時(shí)報(bào)稱,Google為了成為Safari的默認(rèn)搜索引擎,僅2021年就向蘋果支付了約180億美元,怎么可能會(huì)將自家Chrome讓給競(jìng)爭(zhēng)對(duì)手。
Srinivas對(duì)于AI瀏覽器的看法也和AIAgent有些類似。他在今年4月的一次播客對(duì)談中說,瀏覽器就是構(gòu)建Agent的最佳方式?!盀g覽器本質(zhì)上就像一個(gè)容器化的操作系統(tǒng)。它可以在你已登錄第三方服務(wù)的情況下,通過隱藏標(biāo)簽頁訪問這些服務(wù),在客戶端抓取頁面內(nèi)容,并代表你進(jìn)行推理和執(zhí)行操作?!?/p>
換句話說,AI瀏覽器其實(shí)也是一種AIAgent。只是由于當(dāng)前大模型能力受限,仍無法擺脫原有的瀏覽器框架,只能繼續(xù)以傳統(tǒng)標(biāo)簽頁和網(wǎng)頁交互為核心,更多只是對(duì)現(xiàn)有瀏覽器體驗(yàn)的增強(qiáng),而非徹底顛覆。
很難說這樣的中間形態(tài)會(huì)吸引多少用戶改變習(xí)慣。微軟早在2023年就開始為Edge瀏覽器加入AI功能,但兩年下來基本沒對(duì)Chrome造成太大威脅,AI的帶動(dòng)作用可能還沒有Chromium內(nèi)核大。
豌豆莢創(chuàng)始人王俊煜發(fā)表在《第一財(cái)經(jīng)》雜志的評(píng)論文章稱,今天的AI瀏覽器雖然努力做了很多體驗(yàn)創(chuàng)新,但還遠(yuǎn)遠(yuǎn)不夠形成質(zhì)變。AI還沒有深度融合到瀏覽器中,沒有真正成為“眼睛和手腳”。
Chrome瀏覽器的市場(chǎng)壟斷地位也很難輕易撼動(dòng),多數(shù)標(biāo)榜AI的瀏覽器仍然在使用Chromium內(nèi)核。OpenAI雖然被傳即將推出AI瀏覽器,但他們同時(shí)也對(duì)收購Chrome興趣頗大。
“即使Dia能從其中找到帶來10倍體驗(yàn)的亮點(diǎn),我也看不到什么Chrome無法跟進(jìn)的理由?!蓖蹩§险f。5月,Google在Chrome中增加了Gemini入口,可以閱讀網(wǎng)頁和對(duì)話,體驗(yàn)與Dia相似。
AI瀏覽器往往強(qiáng)調(diào)可以自主操作網(wǎng)頁,但又帶來了隱私安全問題,并不是所有用戶都愿意將自己瀏覽的網(wǎng)頁發(fā)給AI。
此前微軟在Windows中內(nèi)測(cè)Recall功能,這是一個(gè)內(nèi)嵌在系統(tǒng)層級(jí)的AI工具,可以在后臺(tái)定期截取用戶屏幕和內(nèi)容,以方便用戶隨時(shí)切換至此前時(shí)間點(diǎn)。Recall一經(jīng)推出就遭遇不少批評(píng),部分媒體報(bào)道甚至將其形容為監(jiān)控軟件。
科技媒體TheVerge報(bào)道了微軟在Edge瀏覽器中推出Copilot模式的消息。文章下的高贊評(píng)論寫道:“微軟在Edge的最新更新中捆綁了垃圾軟件Copilot?!?/p>
另一條更活潑的評(píng)論說,“微軟需要決定一下,我到底該在瀏覽器里使用Copilot,還是在Windows11里使用?抑或是在Word文檔的每一行,甚至Excel的每一個(gè)單元格用?把那個(gè)該死的Copilot標(biāo)志塞滿每個(gè)角落,實(shí)在讓人心煩?!?/p>
本文來自微信公眾號(hào):山上,作者:山上
本內(nèi)容為作者獨(dú)立觀點(diǎn),不代表虎嗅立場(chǎng)。未經(jīng)允許不得轉(zhuǎn)載,授權(quán)事宜請(qǐng)聯(lián)系hezuo@huxiu.com
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4633479.html?f=wyxwapp
《魔道祖師》完結(jié)篇,發(fā)糖只能靠眼神開車,對(duì)視太澀了??簡(jiǎn)漫社
魔道之安魂反吹后續(xù),金孔雀要決斗,汪嘰將惹禍的羨羨藏了起來...
魔道祖師完結(jié)篇播出,含光君性情大變,多個(gè)名場(chǎng)面一一出現(xiàn)??ACG...
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。