智東西(公眾號:zhidxcom)
作者|陳駿達
編輯|云鵬

智東西7月26日報道,今天下午,阿里巴巴發布了其首款自研AI眼鏡——夸克AI眼鏡的技術研發進展。據悉,阿里巴巴AI眼鏡已完成研發,預計將于年內正式發布

智東西也在WAIC大會上發來夸克AI眼鏡的實拍圖,其采用雙光機顯示設計,鏡腿前(qian)部相較(jiao)其他AI眼鏡更為纖細,大部分組件被(bei)放(fang)到了鏡腿末(mo)端,

剛剛,阿里正式進軍AI眼鏡,24小時逆天續航,通義夸克AI拉滿

▲夸克AI眼鏡實拍圖(圖源:智東西)

這一AI眼鏡將與阿里及支付寶生態融合,可使用支付寶“看一下支付”,具備通義千問大模型夸克最新AI能力還支持高德導航、淘寶比價、點外賣、飛豬商旅提醒等功能。

阿里巴巴智能信息事業群終端業務負責人宋剛稱,夸克AI眼鏡搭載了高(gao)通驍龍(long)AR1芯片(pian)+低功(gong)耗協處(chu)理器的雙芯設計以及安卓+RTOS雙系統,實現動態的資源調度;另一方面,其使用了可換電的雙電池系統,用戶可通過熱插拔主電池實現24小時續航

夸克AI眼鏡支持調整合像距,避免了單光機方案帶來的眼疲勞問題。其鏡腿采用鈦合金材料一體成型,保證輕量化。

一、換電倉僅有“耳機殼”大小,鏡框鏡腿重量比為1 : 1

宋剛(gang)在今天下午的(de)WAIC人工智(zhi)能終端(duan)產業發展論壇(tan)上分享了夸克AI眼鏡的(de)更多(duo)研發細節和參數。

他稱,阿里巴巴認為,AI眼鏡會是穿戴智能方向最重要的產品形態,頭部設備可以捕獲80%以上的人體感知輸入,具有(you)極強的(de)場景(jing)穿透力,能同時(shi)覆蓋辦(ban)公、生活以及移(yi)動場景(jing)。AI眼(yan)鏡有(you)望(wang)成為繼智能手(shou)機之(zhi)后最(zui)重要的(de)個人移(yi)動入口。

當前,AI眼鏡尚未走到普及階段,面臨的主要問題包括不夠智能、續航時間短、不夠美觀舒適等。為解決上述問(wen)題(ti),研發團隊不僅為夸克AI眼鏡配備常(chang)規AI眼鏡所支持(chi)的音(yin)樂、電話、翻譯、紀要等功能(neng),還增加了多(duo)種新配置和功能(neng)。

剛剛,阿里正式進軍AI眼鏡,24小時逆天續航,通義夸克AI拉滿

硬件層面,阿里首先通過定制雙音圈大振(zhen)膜(mo)的(de)小型化揚聲(sheng)器、定制一體化FTC排線、鈦合金一體化成型鏡(jing)腿讓眼鏡(jing)進一步輕量化,同時保證功能。

其鏡片也(ye)采用(yong)定制方案,擁有高(gao)折射率(lv)和鍍膜工(gong)藝,觀感上(shang)更(geng)為通透,也(ye)讓鏡框能做到(dao)更(geng)窄、更(geng)薄。

設計鼻托和耳彎接觸面時,夸克AI眼鏡采用了仿生曲面的設計,實現壓力均勻分布。同時將設備重心精準的控制在眼鏡幾何中心的位置,鏡腿、鏡框配重比為1 : 1,據說能提升(sheng)佩(pei)戴(dai)的平衡感。

剛剛,阿里正式進軍AI眼鏡,24小時逆天續航,通義夸克AI拉滿

芯片方(fang)面,宋剛稱,高(gao)通驍龍AR1和(he)低功(gong)耗協處(chu)理器的方(fang)案(an),可以提升重度負載場(chang)景的功(gong)效(xiao),也能降低待機場(chang)景的功(gong)耗。

示意圖顯示,支持更換的主電池位于右側鏡腿,另一側有一個更小的內置電池,這讓這款眼鏡具備了電(dian)池(chi)熱插拔能(neng)力。宋剛說,換電(dian)倉可隨身(shen)攜帶,大(da)小和(he)無線(xian)耳機(ji)盒差不多(duo)大(da),幫(bang)助這款眼鏡實現24小時續航。

剛剛,阿里正式進軍AI眼鏡,24小時逆天續航,通義夸克AI拉滿

二、拍攝算法針對暗光場景優化,擁有自研大模型中控系統

宋剛認為,AI眼鏡行業在拍攝上最大的痛點就是在暗光下噪點偏高,動態范圍不足,成片率低。為解決這一問題,夸克AI眼鏡使用了自研的Super Raw超級暗光增強功能,可實現RAW域(yu)多(duo)幀(zhen)融合(he)以(yi)及自(zi)適應降噪(zao)。

剛剛,阿里正式進軍AI眼鏡,24小時逆天續航,通義夸克AI拉滿

還有不(bu)少AI眼(yan)鏡(jing)因(yin)拍攝畫(hua)(hua)質不(bu)佳、畫(hua)(hua)面抖動(dong)等問題而飽受詬病。對此(ci),夸克AI眼(yan)鏡(jing)的(de)解決方(fang)案(an)是(shi)借(jie)助陀螺儀(yi)檢測線性(xing)角速(su)度,進(jin)行實時(shi)運算(suan)處理,對抖動(dong)畫(hua)(hua)面進(jin)行運動(dong)補償,實現防抖。

眼鏡拍攝的畫面還會與云端的AI超分插幀算法融合,最終實現4K、60幀的拍攝效果

顯示(shi)(shi)方面,夸克AI眼鏡調整了顯示(shi)(shi)區(qu)域的位置,最終(zhong)確(que)定了避開主視區(qu)的視仰(yang)角,能在保證(zheng)觀看舒適(shi)的前提下(xia),盡量減小對現實世界的干擾。

剛剛,阿里正式進軍AI眼鏡,24小時逆天續航,通義夸克AI拉滿

夸克AI眼鏡還擁有專(zhuan)門(men)定制的(de)字體,適合近(jin)眼顯示,保障了(le)顯示的(de)識別度,同時提升了(le)視覺(jue)舒適性,可滿足(zu)用戶在翻譯(yi)、導(dao)航等(deng)場景的(de)使用體驗(yan)。

AI眼鏡主要的交互方式是語音,因此眼鏡能否聽得清用戶的聲音十分重要。夸克AI眼鏡配備了5個麥克風加1個骨傳導陣列設計,在(zai)噪聲環境下(xia)也可(ke)以較為準確(que)地喚醒(xing)。用于識(shi)別(bie)、理(li)解語(yu)音指令的是夸(kua)克語(yu)音大模型(xing),支持口(kou)音、方言識(shi)別(bie)。

以導航場景為例,夸克AI眼鏡研發團隊聯合高德地圖開發了適配AI眼鏡的近眼顯示導航系統,可實(shi)現(xian)在騎行、步(bu)行等(deng)移動場景下的導航功能。

剛剛,阿里正式進軍AI眼鏡,24小時逆天續航,通義夸克AI拉滿

該團隊還自研了(le)Master Agent大模型中(zhong)控系統,可以自主分解復雜指令,實現多(duo)意圖、多(duo)輪對(dui)話。

在支付場景,雖然夸克AI眼鏡的“支付寶看一下”支付方案具體細節尚未公布,但是同款方案已經落地到Rokid、小米、雷鳥等品牌的AI眼鏡,可通過攝像頭掃碼,語音指定支付金額、確認支付等。

AI圖像問答方面,除了使用AI圖像增強技術讓眼鏡“看得清”之外,夸克AI眼鏡擁有定制意圖識別模型,這一模型讓系統端到端耗時較行業平均水平優化了36%。夸克多模態大模型負責最終的(de)回答(da),擁有百億(yi)級的(de)圖像檢索能(neng)力(li)。此外(wai),夸克的(de)視覺問答(da)能(neng)力(li)、學習辦公能(neng)力(li)都將提(ti)供原(yuan)生適配。

宋剛(gang)稱,除了融(rong)合阿(a)里巴巴自有生態,夸克AI眼(yan)鏡將會聯合全球(qiu)領先的眼(yan)鏡品牌,通過(guo)技(ji)術、渠道、服(fu)務以(yi)及C2M定制能力的整合,進一步提(ti)升用戶體驗。

結語:國內大廠爭相入局,百鏡大戰迎重大變量

2025年,隨著配套供應鏈的(de)成(cheng)熟和AI模型能力(li)的(de)提升,AI眼鏡(jing)產品(pin)迎(ying)來集(ji)中爆發(fa)。近期,隨著阿(a)里、小米(mi)等巨頭的(de)入局,百鏡(jing)大戰又迎(ying)來新的(de)重(zhong)大變(bian)量。

阿里(li)正基于Qwen系列模型向Rokid、雷鳥創新等(deng)AI眼(yan)鏡頭(tou)部(bu)企業提供AI能(neng)(neng)力(li)支持,并(bing)在上述合作中探索了(le)將支付寶、高德等(deng)阿里(li)生態中的(de)應用與AI眼(yan)鏡結合的(de)方式。同時,阿里(li)自(zi)身也具備研發天貓精靈等(deng)智能(neng)(neng)終端的(de)經驗。

不過,這些技術積累能否成(cheng)功轉化為(wei)爆(bao)款(kuan)產(chan)品,仍有待市場的驗證。