作者|陳駿達(dá)
編輯|云鵬
智東西7月26日報(bào)道,今天下午,阿里巴巴發(fā)布了其首款自研AI眼鏡——夸克AI眼鏡的技術(shù)研發(fā)進(jìn)展。據(jù)悉,阿里巴巴AI眼鏡已完成研發(fā),預(yù)計(jì)將于年內(nèi)正式發(fā)布。
智東西也在WAIC大會(huì)上發(fā)來夸克AI眼鏡的實(shí)拍圖,其采用雙光機(jī)顯示設(shè)計(jì),鏡腿前部相較其他AI眼鏡更為纖細(xì),大部分組件被放到了鏡腿末端,
夸克AI眼鏡實(shí)拍圖(圖源:智東西)
這一AI眼鏡將與阿里及支付寶生態(tài)融合,可使用支付寶“看一下支付”,具備通義千問大模型、夸克最新AI能力,還支持高德導(dǎo)航、淘寶比價(jià)、點(diǎn)外賣、飛豬商旅提醒等功能。
阿里巴巴智能信息事業(yè)群終端業(yè)務(wù)負(fù)責(zé)人宋剛稱,夸克AI眼鏡搭載了高通驍龍AR1芯片+低功耗協(xié)處理器的雙芯設(shè)計(jì)以及安卓+RTOS雙系統(tǒng),實(shí)現(xiàn)動(dòng)態(tài)的資源調(diào)度;另一方面,其使用了可換電的雙電池系統(tǒng),用戶可通過熱插拔主電池實(shí)現(xiàn)24小時(shí)續(xù)航。
夸克AI眼鏡支持調(diào)整合像距,避免了單光機(jī)方案帶來的眼疲勞問題。其鏡腿采用鈦合金材料一體成型,保證輕量化。
一、換電倉僅有“耳機(jī)殼”大小,鏡框鏡腿重量比為1:1
宋剛在今天下午的WAIC人工智能終端產(chǎn)業(yè)發(fā)展論壇上分享了夸克AI眼鏡的更多研發(fā)細(xì)節(jié)和參數(shù)。
他稱,阿里巴巴認(rèn)為,AI眼鏡會(huì)是穿戴智能方向最重要的產(chǎn)品形態(tài),頭部設(shè)備可以捕獲80%以上的人體感知輸入,具有極強(qiáng)的場景穿透力,能同時(shí)覆蓋辦公、生活以及移動(dòng)場景。AI眼鏡有望成為繼智能手機(jī)之后最重要的個(gè)人移動(dòng)入口。
當(dāng)前,AI眼鏡尚未走到普及階段,面臨的主要問題包括不夠智能、續(xù)航時(shí)間短、不夠美觀舒適等。為解決上述問題,研發(fā)團(tuán)隊(duì)不僅為夸克AI眼鏡配備常規(guī)AI眼鏡所支持的音樂、電話、翻譯、紀(jì)要等功能,還增加了多種新配置和功能。
硬件層面,阿里首先通過定制雙音圈大振膜的小型化揚(yáng)聲器、定制一體化FTC排線、鈦合金一體化成型鏡腿讓眼鏡進(jìn)一步輕量化,同時(shí)保證功能。
其鏡片也采用定制方案,擁有高折射率和鍍膜工藝,觀感上更為通透,也讓鏡框能做到更窄、更薄。
設(shè)計(jì)鼻托和耳彎接觸面時(shí),夸克AI眼鏡采用了仿生曲面的設(shè)計(jì),實(shí)現(xiàn)壓力均勻分布。同時(shí)將設(shè)備重心精準(zhǔn)的控制在眼鏡幾何中心的位置,鏡腿、鏡框配重比為1:1,據(jù)說能提升佩戴的平衡感。
芯片方面,宋剛稱,高通驍龍AR1和低功耗協(xié)處理器的方案,可以提升重度負(fù)載場景的功效,也能降低待機(jī)場景的功耗。
示意圖顯示,支持更換的主電池位于右側(cè)鏡腿,另一側(cè)有一個(gè)更小的內(nèi)置電池,這讓這款眼鏡具備了電池?zé)岵灏文芰?。宋剛說,換電倉可隨身攜帶,大小和無線耳機(jī)盒差不多大,幫助這款眼鏡實(shí)現(xiàn)24小時(shí)續(xù)航。
二、拍攝算法針對暗光場景優(yōu)化,擁有自研大模型中控系統(tǒng)
宋剛認(rèn)為,AI眼鏡行業(yè)在拍攝上最大的痛點(diǎn)就是在暗光下噪點(diǎn)偏高,動(dòng)態(tài)范圍不足,成片率低。為解決這一問題,夸克AI眼鏡使用了自研的SuperRaw超級暗光增強(qiáng)功能,可實(shí)現(xiàn)RAW域多幀融合以及自適應(yīng)降噪。
還有不少AI眼鏡因拍攝畫質(zhì)不佳、畫面抖動(dòng)等問題而飽受詬病。對此,夸克AI眼鏡的解決方案是借助陀螺儀檢測線性角速度,進(jìn)行實(shí)時(shí)運(yùn)算處理,對抖動(dòng)畫面進(jìn)行運(yùn)動(dòng)補(bǔ)償,實(shí)現(xiàn)防抖。
眼鏡拍攝的畫面還會(huì)與云端的AI超分插幀算法融合,最終實(shí)現(xiàn)4K、60幀的拍攝效果。
顯示方面,夸克AI眼鏡調(diào)整了顯示區(qū)域的位置,最終確定了避開主視區(qū)的視仰角,能在保證觀看舒適的前提下,盡量減小對現(xiàn)實(shí)世界的干擾。
夸克AI眼鏡還擁有專門定制的字體,適合近眼顯示,保障了顯示的識別度,同時(shí)提升了視覺舒適性,可滿足用戶在翻譯、導(dǎo)航等場景的使用體驗(yàn)。
AI眼鏡主要的交互方式是語音,因此眼鏡能否聽得清用戶的聲音十分重要??淇薃I眼鏡配備了5個(gè)麥克風(fēng)加1個(gè)骨傳導(dǎo)陣列設(shè)計(jì),在噪聲環(huán)境下也可以較為準(zhǔn)確地喚醒。用于識別、理解語音指令的是夸克語音大模型,支持口音、方言識別。
以導(dǎo)航場景為例,夸克AI眼鏡研發(fā)團(tuán)隊(duì)聯(lián)合高德地圖開發(fā)了適配AI眼鏡的近眼顯示導(dǎo)航系統(tǒng),可實(shí)現(xiàn)在騎行、步行等移動(dòng)場景下的導(dǎo)航功能。
該團(tuán)隊(duì)還自研了MasterAgent大模型中控系統(tǒng),可以自主分解復(fù)雜指令,實(shí)現(xiàn)多意圖、多輪對話。
AI圖像問答方面,除了使用AI圖像增強(qiáng)技術(shù)讓眼鏡“看得清”之外,夸克AI眼鏡擁有定制意圖識別模型,這一模型讓系統(tǒng)端到端耗時(shí)較行業(yè)平均水平優(yōu)化了36%??淇硕嗄B(tài)大模型負(fù)責(zé)最終的回答,擁有百億級的圖像檢索能力。此外,夸克的視覺問答能力、學(xué)習(xí)辦公能力都將提供原生適配。
宋剛稱,除了融合阿里巴巴自有生態(tài),夸克AI眼鏡將會(huì)聯(lián)合全球領(lǐng)先的眼鏡品牌,通過技術(shù)、渠道、服務(wù)以及C2M定制能力的整合,進(jìn)一步提升用戶體驗(yàn)。
結(jié)語:國內(nèi)大廠爭相入局,百鏡大戰(zhàn)迎重大變量
2025年,隨著配套供應(yīng)鏈的成熟和AI模型能力的提升,AI眼鏡產(chǎn)品迎來集中爆發(fā)。近期,隨著阿里、小米等巨頭的入局,百鏡大戰(zhàn)又迎來新的重大變量。
阿里正基于Qwen系列模型向Rokid、雷鳥創(chuàng)新等AI眼鏡頭部企業(yè)提供AI能力支持,并在上述合作中探索了將支付寶、高德等阿里生態(tài)中的應(yīng)用與AI眼鏡結(jié)合的方式。同時(shí),阿里自身也具備研發(fā)天貓精靈等智能終端的經(jīng)驗(yàn)。
不過,這些技術(shù)積累能否成功轉(zhuǎn)化為爆款產(chǎn)品,仍有待市場的驗(yàn)證。
免責(zé)聲明:本文內(nèi)容由開放的智能模型自動(dòng)生成,僅供參考。