文|山上,作者|薛星星,編輯|蔣澆
經(jīng)過了兩年對Edge瀏覽器AI功能的小修小補之后,微軟在今天為Edge瀏覽器加入Copilot模式,正式進軍AI瀏覽器市場。
具體來說,Edge瀏覽器中的AI功能不再像以前一樣只是一個聊天側邊欄,新推出的Copilot模式可以讓AI閱讀和理解網(wǎng)頁內容,比如幫你做一個技術文檔頁面的解讀或者Youtube視頻的觀看大綱。
它也可以一次性瀏覽所有你已打開的網(wǎng)頁,當你在多個商品或者酒店頁面來回切換煩惱時,幫你列一個對比表格來輔助決策。微軟還增加了語音功能,你可以通過語音聊天來理解網(wǎng)頁、和AI實時對話。
這些功能看上去與市面上已有的AI瀏覽器好像沒什么不同,但微軟CEO薩提亞·納德拉(SatyaNadella)對此贊不絕口,“這是我們?yōu)锳I時代重新定義瀏覽器的第一步?!彼f他最喜歡multi-tabRAG功能,可以讓他更快地分析微軟過去一年在Nature上發(fā)表的論文——介紹新功能的同時順帶炫耀一番。
目前該功能尚處實驗階段,微軟稱將會逐漸為Copilot模式加入新功能。實驗的另一層含義是現(xiàn)在Copilot模式為“限時免費”??紤]到目前Copilot仍由OpenAI提供基礎模型支持,這意味著你可以免費使用不少ChatGPT的付費功能。
比如你可以在Copilot模式下使用ChatGPT中付費的DeepResearch功能。納德拉還透露他們將推出任務代理功能,讓用戶在瀏覽網(wǎng)頁的同時委托Copilot處理任務。一位AI創(chuàng)業(yè)者將其稱之為ChatGPTAgent的免費替代版。ChatGPTAgent目前僅向Plus及以上用戶開放,最低月付費20美元。
這大概也是當前Edge相較其他AI瀏覽器最大的吸引力了。在OpenAI還沒正式推出自家瀏覽器之前,你可以在Edge中使用平替版的ChatGPT——算是為山姆·阿爾特曼(SamAltman)脫離微軟又提供了一個借口。
Edge能讀懂網(wǎng)頁了,但也僅此而已
和2023年最初宣布Edge瀏覽器向AI轉型一樣,微軟官網(wǎng)發(fā)布的產(chǎn)品更新中對Copilot模式依然添加了不少宏大的名詞概念,諸如“我們正見證著網(wǎng)絡互動方式的轉折點”“這是我們進一步探索更強大網(wǎng)頁瀏覽方式的下一步”等等。
但用戶打開Copilot模式之后,最明顯的感知或許就是主頁界面變成了一個Copilot對話框,微軟稱之為“整合了對話、搜索和網(wǎng)頁導航”,敲入關鍵詞時可以啟用Bing搜索也可以直接與Copilot對話。
微軟在產(chǎn)品文檔中介紹,Copilot可以理解用戶意圖,幫助用戶更高效地理清信息,不再被龐雜的標簽頁面困擾。你在瀏覽網(wǎng)頁時,也可以隨時調出地址欄左側的Copilot提問,Copilot還可以根據(jù)用戶的歷史記錄,預測用戶下一步操作給出建議。
以前段時間Manus在官網(wǎng)發(fā)布的AIAgent上下文工程的技術文檔為例。打開網(wǎng)頁,Copilot可以理解網(wǎng)頁內容,為用戶提供文檔解讀或大綱。它似乎也可以理解視頻內容,比如對一則Youtube視頻進行要點整理,生成視頻摘要。
Copilot總結網(wǎng)頁內容
Copilot總結Youtube視頻
針對電商網(wǎng)站,Copilot還可以根據(jù)商品詳情頁進行AI總結,還會提供歷史價格走勢圖、與其他網(wǎng)站進行比價等。不過這項功能僅適應于亞馬遜、Shein等海外購物網(wǎng)站,國內淘寶、京東等電商網(wǎng)站尚不支持。
Copilot總結商品頁面
但這些只能算是AI瀏覽器的基礎能力。國內的夸克、豆包乃至QQ瀏覽器也有類似功能,夸克的AI總結會將原有網(wǎng)頁轉換閱讀模式,豆包也可以對B站上的視頻進行分析整理,QQ瀏覽器還推出了網(wǎng)頁搜索與模型對話的雙屏功能。更不客氣點,你在Chrome上安裝一個AI插件就可以獲得近似體驗,還能自定義模型。
Copilot模式更顯著的區(qū)別是它具備了主動能力,比如AItabgrouping,可以自動按主題將你的標簽頁歸組。又或者納德亞口中的multi-tabRAG功能,它可以讓AI瀏覽用戶已打開的所有標簽頁內容,無論你是在閱讀論文、比較酒店或者瀏覽新聞,都可以快速啟用這一功能,“讓你的瀏覽器變成一個幫助你輕松比較、決策和完成任務的工具?!?/p>
《山上》實測了包括淘寶、京東以及亞馬遜等多個國內外的電商網(wǎng)站,Copilot都可以整理多個不同平臺、網(wǎng)頁的商品型號、賣點、價格、評價等,給出一個詳細的購買建議。此前國內密集更新的AIAgent產(chǎn)品,多數(shù)也都能實現(xiàn)類似功能。
Copilot總結天貓商品頁面并給出購買建議
但也僅此而已了,和市面上所有號稱Agent能力的產(chǎn)品一樣,Copilot并沒有打通支付環(huán)節(jié),無論是預定酒店、購買商品還是規(guī)劃行程,它都無法實現(xiàn)微軟宣傳片中的無縫體驗,這些功能都還是期貨。
Copilot也可以閱讀PDF文檔。打開阿里巴巴的2024年的季度財報,Copilot會閱讀文檔內容并給出針對性的回答。它還接入了OpenAI的文生圖能力,連續(xù)對話后它會詢問你是否需要將財務數(shù)據(jù)整理成可視化圖表。只是仍然沒法直接使用,圖表中有不少錯誤,比如完全丟掉了阿里巴巴2024年第一季度的業(yè)績——它只閱讀了三個網(wǎng)頁。
Copilot閱讀PDF財報
在語音模式的加入下,微軟為Copilot模式增加了一個頗具科幻感的Vision功能。你可以用語音與Copilot實時對話,無論你正在瀏覽什么網(wǎng)頁,都可以直接語音提問“這段在說什么”或者“這張圖片是什么”?!八鼤吹侥惝斍暗捻撁?,與你一起閱讀,一起討論你面臨的難題。你不會再有獨自一人面對所有標簽頁的孤獨體驗?!蔽④洿饲暗漠a(chǎn)品文檔中說。
但這項能力同樣不算新鮮。Perplexity本月初發(fā)布的Comet瀏覽器同樣支持語音實時交互,但目前Comet初期僅向PerplexityMax訂閱用戶($200/月)及部分邀請用戶開放,尚未全量鋪開。
豆包桌面版同樣具備類似功能,但在Mac系統(tǒng)下必須打開屏幕共享權限,將整個桌面畫面共享給AI,而Edge無需打開屏幕共享。《山上》實測發(fā)現(xiàn),豆包的語音互動無法實時對話打斷,只能通過手動點擊屏幕打斷,互動性不強。與之相比,即便在國內網(wǎng)絡環(huán)境訪問下,CopilotVision的反應速度也更快、回答更精準,同時也可以實時打斷,交互體驗更接近即時溝通。
忘掉那些AI博主們高呼的網(wǎng)頁瀏覽形式變了的口號吧,就當下的體驗而言,Copilot模式的許多功能與現(xiàn)有AI瀏覽器沒有什么不同。微軟強調Copilot仍處于實驗階段,他們仍將繼續(xù)增加新功能,用戶也可自行選擇打開或者關閉。
混戰(zhàn)的AI瀏覽器,還沒到終極形態(tài)
與今年上半年的通用AIAgent概念相比,AI瀏覽器是一個更早也更快進入到人們視野的產(chǎn)品。最早的AI瀏覽器大多只是在瀏覽器中內置了部分AI能力,提供基礎的AI對話或網(wǎng)頁總結功能。
Agent熱潮襲來之后,更多的AI瀏覽器開始強調自主執(zhí)行任務的能力,諸如TheBrowserCompany的Dia瀏覽器、Perplexity的Comet瀏覽器以及OperaNeoa均屬此類。微軟在宣傳Edge中的Copilot模式時,同樣強調它的主動性。
科技公司們對于AI瀏覽器的熱衷不難理解,誕生30余年之后,瀏覽器仍然是人們在桌面端觸達互聯(lián)網(wǎng)的第一窗口——甚至它的核心交互模式都沒有發(fā)生太大變化,一路從網(wǎng)景、IE演變到今天的Chrome,就連Chrome也是17年前的產(chǎn)品了。
大模型的誕生重塑了人們獲取信息的方式,人們普遍相信瀏覽器也將會發(fā)生改變,無論是巨頭還是創(chuàng)業(yè)公司都試圖搶占這一市場。市場調研機構Market.us預測,全球AI瀏覽器市場將從2024年的45億美元增長至2034年的約768億,年復合增長率達32.8%。
Market.us報告
但很難說當下的AI瀏覽器與AIAgent之間的區(qū)隔有多么清晰——二者的底層技術類似、瞄準的方向也是一樣的。微軟在Copilot模式中展現(xiàn)的能力,都可以在OpenAI過去半年的功能更新中找到影子。比如OpenAI年初更新的Operator功能,它讓AI操作網(wǎng)頁成為可能。微軟在宣傳片中描繪的Copilot未來能力,也和OpenAI的ChatGPTAgent十分類似。
蝴蝶效應在推出Manus之前瞄準的就是AI瀏覽器方向,但他們最終放棄了。Manus聯(lián)合創(chuàng)始人張濤說,AI瀏覽器的用戶體驗受限,他們意識到要實現(xiàn)真正的通用的人工智能代理,必須要從瀏覽器界面脫離。
甚至Perplexity決定推出AI瀏覽器也像是被迫的,PerplexityCEOAravindSrinivas說,他曾經(jīng)聯(lián)系Chrome團隊,希望將Perplexity作為Chrome的默認搜索引擎,但被拒絕,于是決定自己做一個。
——天知道Srinivas怎么想的。紐約時報稱,Google為了成為Safari的默認搜索引擎,僅2021年就向蘋果支付了約180億美元,怎么可能會將自家Chrome讓給競爭對手。
Srinivas對于AI瀏覽器的看法也和AIAgent有些類似。他今年4月的一次播客對談中說,瀏覽器就是構建Agent的最佳方式?!盀g覽器本質上就像一個容器化的操作系統(tǒng)。它可以在你已登錄第三方服務的情況下,通過隱藏標簽頁訪問這些服務,在客戶端抓取頁面內容,并代表你進行推理和執(zhí)行操作?!?/p>
換句話說,AI瀏覽器其實也是一種AIAgent。只是由于當前大模型能力受限,仍無法擺脫原有的瀏覽器框架,只能繼續(xù)以傳統(tǒng)標簽頁和網(wǎng)頁交互為核心,更多只是對現(xiàn)有瀏覽器體驗的增強,而非徹底顛覆。
很難說這樣的中間形態(tài)會吸引多少用戶改變習慣。微軟早在2023年就開始為Edge瀏覽器加入AI功能,但兩年下來基本沒對Chrome造成太大威脅,AI的帶動作用可能還沒有Chromium內核大。
豌豆莢創(chuàng)始人王俊煜發(fā)表在《第一財經(jīng)》雜志的評論文章稱,今天的AI瀏覽器雖然努力做了很多體驗創(chuàng)新,但還遠遠不夠形成質變。AI還沒有深度融合到瀏覽器中,沒有真正成為“眼睛和手腳”。
Chrome瀏覽器的市場壟斷地位也很難輕易撼動,多數(shù)標榜AI的瀏覽器仍然在使用Chromium內核。OpenAI雖然被傳即將推出AI瀏覽器,但他們同時也對收購Chrome興趣頗大。
“即使Dia能從其中找到帶來10倍體驗的亮點,我也看不到什么Chrome無法跟進的理由?!蓖蹩§险f。5月,Google在Chrome中增加了Gemini入口,可以閱讀網(wǎng)頁和對話,體驗與Dia相似。
AI瀏覽器往往強調可以自主操作網(wǎng)頁,但又帶來了隱私安全問題,并不是所有用戶都愿意將自己瀏覽的網(wǎng)頁發(fā)給AI。
此前微軟在Windows中內測Recall功能,這是一個內嵌在系統(tǒng)層級的AI工具,可以在后臺定期截取用戶屏幕和內容,以方便用戶隨時切換至此前時間點。Recall一經(jīng)推出就遭遇不少批評,部分媒體報道甚至將其形容為監(jiān)控軟件。
科技媒體TheVerge報道了微軟在Edge瀏覽器中推出Copilot模式的消息。文章下的高贊評論寫道:“微軟在Edge的最新更新中捆綁了垃圾軟件Copilot?!?/p>
另一條更活潑的評論說,“微軟需要決定一下,我到底該在瀏覽器里使用Copilot,還是在Windows11里使用?抑或是在Word文檔的每一行,甚至Excel的每一個單元格用?把那個該死的Copilot標志塞滿每個角落,實在讓人心煩?!?/p>
《萬事忠為首》上
陳生曰:在清宣宗末年,太平天國之亂發(fā)生在長江以南各省,造成了相當大的勢力,不得已由各地方征召人來,組織軍隊;那時在湖南有一支軍隊是曾國藩所率領的湘軍,也是以后打敗太平天國之亂的主力軍隊。曾國藩,本是讀書人,并非軍人,之所以組成軍隊,原本只希望憑著一股愛國愛民的熱忱,只希望竭盡一己的力量平亂殺敵,因而臨 曾國藩一生創(chuàng)作的日記和家書達上百萬字,而這些日記與家書的主要內容就是曾國藩一生自我教育與家庭教育的心得體會。被稱為教育家的曾國藩,終其一生的“自我教育”,令《曾國藩家訓》聲譽日隆,成為百多年來坊間不斷流傳的家訓典范|_。 2 2011年-2012年,南京師范學院的酈波教授在cctv-10的《百家講壇》節(jié)目播出《酈波評還有呢?曾國藩相人口訣,白話文翻譯,收藏閱讀!