本文來自微信公眾號:山上,作者:薛星星,蔣澆,題圖來自:AI生成
經(jīng)過了兩年對Edge瀏覽器AI功能的小修小補之后,微軟在昨天(7月29日)為Edge瀏覽器加入Copilot模式,正式進軍AI瀏覽器市場。
具體來說,Edge瀏覽器中的AI功能不再像以前一樣只是一個聊天側(cè)邊欄,新推出的Copilot模式可以讓AI閱讀和理解網(wǎng)頁內(nèi)容,比如幫你做一個技術(shù)文檔頁面的解讀或者Youtube視頻的觀看大綱。
它也可以一次性瀏覽所有你已打開的網(wǎng)頁,當(dāng)你在多個商品或者酒店頁面來回切換煩惱時,幫你列一個對比表格來輔助決策。微軟還增加了語音功能,你可以通過語音聊天來理解網(wǎng)頁、和AI實時對話。
這些功能看上去與市面上已有的AI瀏覽器好像沒什么不同,但微軟CEO薩提亞·納德拉(SatyaNadella)對此贊不絕口,“這是我們?yōu)锳I時代重新定義瀏覽器的第一步。”他說他最喜歡multi-tabRAG功能,可以讓他更快地分析微軟過去一年在Nature上發(fā)表的論文——介紹新功能的同時順帶炫耀一番。
目前該功能尚處實驗階段,微軟稱將會逐漸為Copilot模式加入新功能。實驗的另一層含義是現(xiàn)在Copilot模式為“限時免費”??紤]到目前Copilot仍由OpenAI提供基礎(chǔ)模型支持,這意味著你可以免費使用不少ChatGPT的付費功能。
比如你可以在Copilot模式下使用ChatGPT中付費的DeepResearch功能。納德拉還透露他們將推出任務(wù)代理功能,讓用戶在瀏覽網(wǎng)頁的同時委托Copilot處理任務(wù)。一位AI創(chuàng)業(yè)者將其稱之為ChatGPTAgent的免費替代版。ChatGPTAgent目前僅向Plus及以上用戶開放,最低月付費20美元。
這大概也是當(dāng)前Edge相較其他AI瀏覽器最大的吸引力了。在OpenAI還沒正式推出自家瀏覽器之前,你可以在Edge中使用平替版的ChatGPT——算是為山姆·阿爾特曼(SamAltman)脫離微軟又提供了一個借口。
Edge能讀懂網(wǎng)頁了,但也僅此而已
和2023年最初宣布Edge瀏覽器向AI轉(zhuǎn)型一樣,微軟官網(wǎng)發(fā)布的產(chǎn)品更新中對Copilot模式依然添加了不少宏大的名詞概念,諸如“我們正見證著網(wǎng)絡(luò)互動方式的轉(zhuǎn)折點”“這是我們進一步探索更強大網(wǎng)頁瀏覽方式的下一步”等等。
但用戶打開Copilot模式之后,最明顯的感知或許就是主頁界面變成了一個Copilot對話框,微軟稱之為“整合了對話、搜索和網(wǎng)頁導(dǎo)航”,敲入關(guān)鍵詞時可以啟用Bing搜索也可以直接與Copilot對話。
微軟在產(chǎn)品文檔中介紹,Copilot可以理解用戶意圖,幫助用戶更高效地理清信息,不再被龐雜的標(biāo)簽頁面困擾。你在瀏覽網(wǎng)頁時,也可以隨時調(diào)出地址欄左側(cè)的Copilot提問,Copilot還可以根據(jù)用戶的歷史記錄,預(yù)測用戶下一步操作給出建議。
以前段時間Manus在官網(wǎng)發(fā)布的AIAgent上下文工程的技術(shù)文檔為例。打開網(wǎng)頁,Copilot可以理解網(wǎng)頁內(nèi)容,為用戶提供文檔解讀或大綱。它似乎也可以理解視頻內(nèi)容,比如對一則Youtube視頻進行要點整理,生成視頻摘要。
Copilot總結(jié)網(wǎng)頁內(nèi)容
Copilot總結(jié)Youtube視頻
針對電商網(wǎng)站,Copilot還可以根據(jù)商品詳情頁進行AI總結(jié),還會提供歷史價格走勢圖、與其他網(wǎng)站進行比價等。不過這項功能僅適應(yīng)于亞馬遜、Shein等海外購物網(wǎng)站,國內(nèi)淘寶、京東等電商網(wǎng)站尚不支持。
Copilot總結(jié)商品頁面
但這些只能算是AI瀏覽器的基礎(chǔ)能力。國內(nèi)的夸克、豆包乃至QQ瀏覽器也有類似功能,夸克的AI總結(jié)會將原有網(wǎng)頁轉(zhuǎn)換閱讀模式,豆包也可以對B站上的視頻進行分析整理,QQ瀏覽器還推出了網(wǎng)頁搜索與模型對話的雙屏功能。更不客氣點,你在Chrome上安裝一個AI插件就可以獲得近似體驗,還能自定義模型。
Copilot模式更顯著的區(qū)別是它具備了主動能力,比如AItabgrouping,可以自動按主題將你的標(biāo)簽頁歸組。又或者納德亞口中的multi-tabRAG功能,它可以讓AI瀏覽用戶已打開的所有標(biāo)簽頁內(nèi)容,無論你是在閱讀論文、比較酒店或者瀏覽新聞,都可以快速啟用這一功能,“讓你的瀏覽器變成一個幫助你輕松比較、決策和完成任務(wù)的工具。”
《山上》實測了包括淘寶、京東以及亞馬遜等多個國內(nèi)外的電商網(wǎng)站,Copilot都可以整理多個不同平臺、網(wǎng)頁的商品型號、賣點、價格、評價等,給出一個詳細(xì)的購買建議。此前國內(nèi)密集更新的AIAgent產(chǎn)品,多數(shù)也都能實現(xiàn)類似功能。
Copilot總結(jié)天貓商品頁面并給出購買建議
但也僅此而已了,和市面上所有號稱Agent能力的產(chǎn)品一樣,Copilot并沒有打通支付環(huán)節(jié),無論是預(yù)定酒店、購買商品還是規(guī)劃行程,它都無法實現(xiàn)微軟宣傳片中的無縫體驗,這些功能都還是期貨。
Copilot也可以閱讀PDF文檔。打開阿里巴巴的2024年的季度財報,Copilot會閱讀文檔內(nèi)容并給出針對性的回答。它還接入了OpenAI的文生圖能力,連續(xù)對話后它會詢問你是否需要將財務(wù)數(shù)據(jù)整理成可視化圖表。只是仍然沒法直接使用,圖表中有不少錯誤,比如完全丟掉了阿里巴巴2024年第一季度的業(yè)績——它只閱讀了三個網(wǎng)頁。
Copilot閱讀PDF財報
在語音模式的加入下,微軟為Copilot模式增加了一個頗具科幻感的Vision功能。你可以用語音與Copilot實時對話,無論你正在瀏覽什么網(wǎng)頁,都可以直接語音提問“這段在說什么”或者“這張圖片是什么”?!八鼤吹侥惝?dāng)前的頁面,與你一起閱讀,一起討論你面臨的難題。你不會再有獨自一人面對所有標(biāo)簽頁的孤獨體驗。”微軟此前的產(chǎn)品文檔中說。
但這項能力同樣不算新鮮。Perplexity本月初發(fā)布的Comet瀏覽器同樣支持語音實時交互,但目前Comet初期僅向PerplexityMax訂閱用戶($200/月)及部分邀請用戶開放,尚未全量鋪開。
豆包桌面版同樣具備類似功能,但在Mac系統(tǒng)下必須打開屏幕共享權(quán)限,將整個桌面畫面共享給AI,而Edge無需打開屏幕共享?!渡缴稀穼崪y發(fā)現(xiàn),豆包的語音互動無法實時對話打斷,只能通過手動點擊屏幕打斷,互動性不強。與之相比,即便在國內(nèi)網(wǎng)絡(luò)環(huán)境訪問下,CopilotVision的反應(yīng)速度也更快、回答更精準(zhǔn),同時也可以實時打斷,交互體驗更接近即時溝通。
忘掉那些AI博主們高呼的網(wǎng)頁瀏覽形式變了的口號吧,就當(dāng)下的體驗而言,Copilot模式的許多功能與現(xiàn)有AI瀏覽器沒有什么不同。微軟強調(diào)Copilot仍處于實驗階段,他們?nèi)詫⒗^續(xù)增加新功能,用戶也可自行選擇打開或者關(guān)閉。
混戰(zhàn)的AI瀏覽器,還沒到終極形態(tài)
與今年上半年的通用AIAgent概念相比,AI瀏覽器是一個更早也更快進入到人們視野的產(chǎn)品。最早的AI瀏覽器大多只是在瀏覽器中內(nèi)置了部分AI能力,提供基礎(chǔ)的AI對話或網(wǎng)頁總結(jié)功能。
Agent熱潮襲來之后,更多的AI瀏覽器開始強調(diào)自主執(zhí)行任務(wù)的能力,諸如TheBrowserCompany的Dia瀏覽器、Perplexity的Comet瀏覽器以及OperaNeoa均屬此類。微軟在宣傳Edge中的Copilot模式時,同樣強調(diào)它的主動性。
科技公司們對于AI瀏覽器的熱衷不難理解,誕生30余年之后,瀏覽器仍然是人們在桌面端觸達互聯(lián)網(wǎng)的第一窗口——甚至它的核心交互模式都沒有發(fā)生太大變化,一路從網(wǎng)景、IE演變到今天的Chrome,就連Chrome也是17年前的產(chǎn)品了。
大模型的誕生重塑了人們獲取信息的方式,人們普遍相信瀏覽器也將會發(fā)生改變,無論是巨頭還是創(chuàng)業(yè)公司都試圖搶占這一市場。市場調(diào)研機構(gòu)Market.us預(yù)測,全球AI瀏覽器市場將從2024年的45億美元增長至2034年的約768億,年復(fù)合增長率達32.8%。
Market.us報告
但很難說當(dāng)下的AI瀏覽器與AIAgent之間的區(qū)隔有多么清晰——二者的底層技術(shù)類似、瞄準(zhǔn)的方向也是一樣的。微軟在Copilot模式中展現(xiàn)的能力,都可以在OpenAI過去半年的功能更新中找到影子。比如OpenAI年初更新的Operator功能,它讓AI操作網(wǎng)頁成為可能。微軟在宣傳片中描繪的Copilot未來能力,也和OpenAI的ChatGPTAgent十分類似。
蝴蝶效應(yīng)在推出Manus之前瞄準(zhǔn)的就是AI瀏覽器方向,但他們最終放棄了。Manus聯(lián)合創(chuàng)始人張濤說,AI瀏覽器的用戶體驗受限,他們意識到要實現(xiàn)真正的通用的人工智能代理,必須要從瀏覽器界面脫離。
甚至Perplexity決定推出AI瀏覽器也像是被迫的,PerplexityCEOAravindSrinivas說,他曾經(jīng)聯(lián)系Chrome團隊,希望將Perplexity作為Chrome的默認(rèn)搜索引擎,但被拒絕,于是決定自己做一個。
——天知道Srinivas怎么想的。紐約時報稱,Google為了成為Safari的默認(rèn)搜索引擎,僅2021年就向蘋果支付了約180億美元,怎么可能會將自家Chrome讓給競爭對手。
Srinivas對于AI瀏覽器的看法也和AIAgent有些類似。他在今年4月的一次播客對談中說,瀏覽器就是構(gòu)建Agent的最佳方式。“瀏覽器本質(zhì)上就像一個容器化的操作系統(tǒng)。它可以在你已登錄第三方服務(wù)的情況下,通過隱藏標(biāo)簽頁訪問這些服務(wù),在客戶端抓取頁面內(nèi)容,并代表你進行推理和執(zhí)行操作?!?/p>
換句話說,AI瀏覽器其實也是一種AIAgent。只是由于當(dāng)前大模型能力受限,仍無法擺脫原有的瀏覽器框架,只能繼續(xù)以傳統(tǒng)標(biāo)簽頁和網(wǎng)頁交互為核心,更多只是對現(xiàn)有瀏覽器體驗的增強,而非徹底顛覆。
很難說這樣的中間形態(tài)會吸引多少用戶改變習(xí)慣。微軟早在2023年就開始為Edge瀏覽器加入AI功能,但兩年下來基本沒對Chrome造成太大威脅,AI的帶動作用可能還沒有Chromium內(nèi)核大。
豌豆莢創(chuàng)始人王俊煜發(fā)表在《第一財經(jīng)》雜志的評論文章稱,今天的AI瀏覽器雖然努力做了很多體驗創(chuàng)新,但還遠(yuǎn)遠(yuǎn)不夠形成質(zhì)變。AI還沒有深度融合到瀏覽器中,沒有真正成為“眼睛和手腳”。
Chrome瀏覽器的市場壟斷地位也很難輕易撼動,多數(shù)標(biāo)榜AI的瀏覽器仍然在使用Chromium內(nèi)核。OpenAI雖然被傳即將推出AI瀏覽器,但他們同時也對收購Chrome興趣頗大。
“即使Dia能從其中找到帶來10倍體驗的亮點,我也看不到什么Chrome無法跟進的理由?!蓖蹩§险f。5月,Google在Chrome中增加了Gemini入口,可以閱讀網(wǎng)頁和對話,體驗與Dia相似。
AI瀏覽器往往強調(diào)可以自主操作網(wǎng)頁,但又帶來了隱私安全問題,并不是所有用戶都愿意將自己瀏覽的網(wǎng)頁發(fā)給AI。
此前微軟在Windows中內(nèi)測Recall功能,這是一個內(nèi)嵌在系統(tǒng)層級的AI工具,可以在后臺定期截取用戶屏幕和內(nèi)容,以方便用戶隨時切換至此前時間點。Recall一經(jīng)推出就遭遇不少批評,部分媒體報道甚至將其形容為監(jiān)控軟件。
科技媒體TheVerge報道了微軟在Edge瀏覽器中推出Copilot模式的消息。文章下的高贊評論寫道:“微軟在Edge的最新更新中捆綁了垃圾軟件Copilot。”
另一條更活潑的評論說,“微軟需要決定一下,我到底該在瀏覽器里使用Copilot,還是在Windows11里使用?抑或是在Word文檔的每一行,甚至Excel的每一個單元格用?把那個該死的Copilot標(biāo)志塞滿每個角落,實在讓人心煩?!?/p>
本文來自微信公眾號:山上,作者:山上
本內(nèi)容為作者獨立觀點,不代表虎嗅立場。未經(jīng)允許不得轉(zhuǎn)載,授權(quán)事宜請聯(lián)系hezuo@huxiu.com
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4633479.html?f=wyxwapp
三料博士穿越崇禎,引領(lǐng)大明工業(yè)革命,蒸汽機紡織機改寫歷史
《大明的工業(yè)革命》作者:科創(chuàng)板第一章改進火繩槍崇禎二年,北直隸。軍器局。一處火星四濺的匠作間里。朱舜拿著一根冷骨,正在鑄造鳥銃的槍管:“看來要想個辦法脫籍了,按照明朝的戶籍制度-?!薄爸灰侨肓私臣?,一輩子都是匠籍——?!薄霸僬f了自己一個歷史上最年輕的數(shù)理化三料博士,應(yīng)該在大明掀起一場工業(yè)革命才對, 《大明的工業(yè)革命》作者:科創(chuàng)板第一章改進火繩槍崇禎二年,北直隸。軍器局。一處火星四濺的匠作間里|_。朱舜拿著一根冷骨,正在鑄造鳥銃的槍管:“看來要想個辦法脫籍了,按照明朝的戶籍制度-_。”“只要是入了匠籍,一輩子都是匠籍?!薄霸僬f了自己一個歷史上最年輕的數(shù)理化三料博士,應(yīng)該在大明掀起一場工業(yè)革等我繼續(xù)說_——。小說:數(shù)理化博士穿越崇禎,引領(lǐng)大明工業(yè)革命