
智東西(公眾號:zhidxcom)
作者 | 云鵬
編輯 | 李水青
蘋果Apple Intelligence(蘋果智能)正式版終于來了!跟新版搭載M4的iMac一起來(lai)了(le)。
智東(dong)西10月29日消息,剛剛蘋果終(zhong)于正式發布了iOS 18.1,其中就包括大家期(qi)待已久的Apple Intelligence。
對話絲滑流暢且更聰明的Siri、只要有文字的地方就可以AI潤色改寫、各類系統App中無處不在的AI總結功能、一句話搜索照片、一句話生成視頻大片……
這些功能都已正式落地。當然,目前僅限英語版。
支持機型一覽:
有(you)外媒總結(jie),iOS 18.1的新功(gong)能超過55項,可以說(shuo)又是(shi)一(yi)次“史詩級”更新了。不過我們此次關(guan)注的核心還是(shi)AI,也就(jiu)是(shi)蘋果Apple Intelligence。
庫克特別發文宣布了蘋果智能的到來,并說這會是“一個激動人心的新時代的開始”。
最近安卓陣營廠商接連發布了自家的在AI和操作系統方面的一系列重磅升級,從華為、榮耀、OPPO、vivo到今天即將發布新系統的小米,各種AI智能體、AI OS的概(gai)念鋪天蓋地襲(xi)來,各(ge)類吸睛的AI新功能不斷(duan)亮(liang)相(xiang)。
▲榮(rong)耀率先發(fa)布“AI OS”
蘋果6月份畫的AI“大餅”,讓安卓(zhuo)廠商們基本提前實現的差不多了。
▲vivo小V助手基(ji)于AI重構系統實現新(xin)的(de)體驗
就連(lian)長(chang)按電源(yuan)鍵(jian)喚(huan)出AI助手的這(zhe)個動畫,都(dou)像到不能再像了!
▲蘋果喚出Siri
▲OPPO喚出小布
整體來看,iOS 18.1的各類AI功能在此前的測試版中基本都已經與大家見過面了,所以驚艷感并不強,但在功能實現邏輯、實際流暢度和一些設計細節方面,確實有蘋果的獨到之處。
大家最為期待的ChatGPT和Image Playground中(zhong)(zhong)的Gemoji(表情包生成(cheng))等功能,目(mu)前僅在iOS 18.2 Beta版中(zhong)(zhong)部份落地,沒(mei)有(you)在正(zheng)式(shi)版中(zhong)(zhong)發布,Beta版只有(you)蘋果(guo)開發者可以申請下載(zai)。
接(jie)下來,我們將深入(ru)這些(xie)功能,也將共同(tong)探(tan)討(tao)這些(xie)功能與(yu)安(an)卓實(shi)現(xian)方式的異同(tong)。
一、Siri確實變得更聰明了
現在(zai)做AI智(zhi)(zhi)能(neng)(neng)(neng)體、AI OS已經成為手(shou)機廠商(shang)們的共(gong)識,AI要(yao)深入操作系統(tong)(tong),做系統(tong)(tong)級(ji)AI,而AI智(zhi)(zhi)能(neng)(neng)(neng)體,也就是各類智(zhi)(zhi)能(neng)(neng)(neng)助手(shou),將成為用(yong)戶(hu)享受(shou)各類大(da)模型服(fu)務的核心入口(kou)。
在交互方式上,目前(qian)Siri支持語音和打字輸入(ru),這(zhe)我們(men)已經不陌(mo)生了。不過Siri在你輸入(ru)后會(hui)自動給出一些建議,并且這(zhe)些建議會(hui)根據你輸入(ru)的內容實時改變,這(zhe)一點還是相對更“智能”的。
在語音識(shi)別(bie)、語義理(li)解(jie)、意圖(tu)識(shi)別(bie)的(de)速(su)度、準確(que)性方面,Siri這次(ci)升級比較(jiao)明顯,即(ji)使我們說話的(de)時(shi)候突(tu)然改(gai)變問題(ti),或(huo)者說得比較(jiao)模糊,Siri都能比較(jiao)準確(que)地理(li)解(jie)我們要問什(shen)么,然后(hou)給出答案。
比如你說,今天(tian)氣溫……啊(a)我的意思是(shi)去(qu)芝(zhi)(zhi)加(jia)(jia)哥(ge)要多久?新Siri會(hui)直接告訴(su)你去(qu)芝(zhi)(zhi)加(jia)(jia)哥(ge)要多久,而老Siri則會(hui)回答“我找不到(dao)符合的地方,對不起(qi)。”
二、AI文本總結“哪都能用”了,智能回消息解放生產力
接下來,是蘋果(guo)在發布會上重(zhong)點(dian)強調的(de)兩個工(gong)具,書寫工(gong)具(Writing Tools)和圖片工(gong)坊(fang)(Image Playground)。
文字方(fang)面,簡單(dan)來說(shuo),只要是有輸入(ru)文字的地(di)方(fang),你就可(ke)以用(yong)AI書寫工(gong)具(ju)來進行改寫或者潤色。
話說回來,安(an)卓陣營起初是將這些AI文(wen)字(zi)處(chu)(chu)理功能放到(dao)特定的(de)App中,但隨(sui)著各家的(de)迭(die)代優化(hua),目前絕大部份安(an)卓廠商(shang)都已經(jing)將AI文(wen)字(zi)處(chu)(chu)理功能做到(dao)了跟蘋果一樣的(de)“系統級(ji)”。
只要是能調起輸入(ru)法的(de)地方(fang),就可(ke)以(yi)直接使用一系列文字處理功能,各家基(ji)本上都將AI寫作功能做到了(le)輸入(ru)法里(li),蘋(pin)果在這方(fang)面的(de)優勢,已經被趕上了(le)。
當然,在一(yi)些(xie)細節(jie)動(dong)效(xiao)、交互體驗上,蘋果確實做的更流(liu)暢符合直覺一(yi)些(xie)。
蘋果的(de)文本總結功能在各(ge)類系(xi)統App中的(de)廣泛應(ying)用是其主(zhu)要優勢。
比如(ru)在鎖屏界面(mian)上,通知的重點信息會被總結(jie)呈(cheng)現(xian),讓我們更快(kuai)抓住重點,確定要(yao)不要(yao)進一步點開看。
這種類似(si)的總結功能在(zai)郵件和消息(xi)App中也有體(ti)現,重點信息(xi)會被直觀呈現在(zai)標題或(huo)發件人(ren)下面。
在郵(you)件和消息App中,AI還可(ke)以識(shi)別文(wen)字內容,然后生成智能回復(fu),比如對于一個會議邀請,AI可(ke)以生成“參加”或“不參加”等不同類型的回復(fu)。
在(zai)(zai)Safari瀏覽(lan)器(qi)中,AI還可以在(zai)(zai)頂部幫你總結一篇文章的重點信息。
這種在系(xi)統界面、系(xi)統App中“內置”的(de)自動文字總結功能,目前在安卓陣營還(huan)基本沒有(you)實(shi)現。這方面蘋果確實(shi)有(you)一(yi)定(ding)優(you)勢。
通話錄音總結摘要(yao)已經是一個(ge)老生常談(tan)的功(gong)(gong)能了,安卓陣營基本上(shang)早在(zai)一年(nian)前就(jiu)已經標配了,蘋(pin)果在(zai)這個(ge)相對(dui)敏感(gan)的功(gong)(gong)能上(shang)落地顯然(ran)是更加謹慎的。
不過值得一提的是(shi),蘋果應該是(shi)第一個做到通話(hua)錄音告知對方(fang)(fang)的,在隱(yin)私安全(quan)方(fang)(fang)面更進一步(bu)。
總(zong)(zong)(zong)體來說(shuo),AI寫作、總(zong)(zong)(zong)結功(gong)能(neng)好(hao)(hao)不(bu)好(hao)(hao)用,最核(he)心的(de)還是要看寫的(de)好(hao)(hao)不(bu)好(hao)(hao)、總(zong)(zong)(zong)結的(de)到(dao)不(bu)到(dao)位,所以目(mu)前的(de)英文(wen)版對我們(men)來說(shuo)參考價值(zhi)不(bu)大,明年(nian)中文(wen)版落地(di),才是大家關注的(de)重(zhong)頭戲。
在中文語境中,蘋果AI能否(fou)與國內安卓AI一戰,值得期待。
三、AI搜圖更快更準,一句話生成視頻大片
AI圖片處理方面,在相冊App中,輸入文字搜圖已經比較常見了,蘋果此次也(ye)跟進了這一功能(neng)。
蘋果這次的AI搜(sou)圖(tu)也(ye)可(ke)以支持視頻搜(sou)索。
在AI視(shi)頻(pin)創(chuang)作(zuo)方面,雖然國內安(an)卓廠(chang)商目前也推(tui)出了一(yi)些“一(yi)鍵生成大片”的(de)功能,但蘋果的(de)這個(ge)AI視(shi)頻(pin)創(chuang)作(zuo)顯然可“自定義”的(de)屬性更強(qiang)。
你可以直接(jie)通過輸入(ru)一段文字(zi)描述來創建(jian)一段視(shi)頻(pin),安卓方面往往是需要選中幾(ji)個視(shi)頻(pin),然(ran)后一鍵生成大片。這個邏輯還(huan)是有很(hen)大區別的。
在視頻(pin)生(sheng)成(cheng)后(hou),你可以選擇合適的(de)背景音(yin)樂(le),然后(hou)導出(chu)。
在AI圖片(pian)處理(li)方(fang)面,AI摳圖、AI路(lu)人消除(chu)功能已經是(shi)AI手機的(de)標配了(le)。在消除(chu)的(de)準確性方(fang)面,照(zhao)片(pian)的(de)不(bu)同(tong)會(hui)導致很(hen)大的(de)結果差(cha)異。
從一(yi)些外國博主的(de)演示中,我們可以看到,蘋果的(de)AI消除效果還(huan)有比較大(da)的(de)優(you)化空間,比如路人只消除了上(shang)(shang)半身,鞋子和腿卻沒有消除干凈,并且在一(yi)些消除的(de)細節上(shang)(shang)還(huan)有些“穿模(mo)”的(de)粗糙感(gan)。
目前國內(nei)安卓廠商在AI消(xiao)除(chu)方面(mian)基本已經做的很成熟了,一鍵AI消(xiao)除(chu)路人等實用功能都已基本普(pu)及(ji)。
四、Siri直接調用ChatGPT、AI一鍵生成表情包終于要來了,還有AI識屏
在(zai)測試版(ban)系統中,我們可以(yi)看到Image Playground的(de)一些應用效果。
在iOS 18.2 Beta中,新增加了一(yi)個(ge)Playground App,在這個(ge)App里(li),我們可以選中一(yi)些元素(su)(su),比(bi)如(ru)我的照片、貝(bei)雷帽、公園、藝(yi)術家等元素(su)(su),AI就會(hui)生(sheng)成(cheng)一(yi)張包含對應(ying)元素(su)(su)的圖片。
值(zhi)得一(yi)提的(de)是,我們(men)還(huan)可以手動輸入一(yi)些文字(zi)作為(wei)提示詞,比如選擇自己的(de)照片(pian),輸入“在(zai)沙灘上”,就會生成我在(zai)沙灘上的(de)圖像。
但需要注意的(de)是(shi),Image Playground只能生成跟(gen)人(ren)物相(xiang)關的(de)圖片,如果你(ni)只是(shi)隨(sui)便輸入了(le)一段提示詞,AI是(shi)無法生成圖片的(de)。
在消(xiao)息(xi)App里(li),我們可以(yi)點(dian)擊加號,選擇圖片生(sheng)成功能,隨時生(sheng)成一張圖片并發送給朋友。
我們(men)還可以輸入一(yi)段描述(shu),然(ran)后(hou)實時生成一(yi)張圖片(pian)發(fa)送給朋(peng)友,比如一(yi)個倒置的微笑臉:
比如一個在燒烤架上的漢(han)堡(bao):
Image Playground在平板上有更多功能體驗,比如(ru)我們可(ke)以(yi)用Apple Pencil畫(hua)一些(xie)簡(jian)單的(de)線條,然后基于(yu)你(ni)的(de)描述,AI就可(ke)以(yi)生成一些(xie)精(jing)美(mei)的(de)圖片(pian)。
在圖片生成后,我們還可以(yi)用一些文字(zi)描述快速調整圖片,比如給一個(ge)房子加上(shang)兩個(ge)窗戶:
另(ling)一(yi)個測試版(ban)中(zhong)的重(zhong)要升(sheng)級(ji)就(jiu)是ChatGPT了,我(wo)們可以在與(yu)Siri對話時(shi)直接說用ChatGPT給我(wo)提(ti)供(gong)某(mou)些(xie)信(xin)息(xi),此時(shi)Siri就(jiu)會調(diao)用ChatGPT給出答案。
此外,測(ce)試(shi)版還支持了AI視(shi)覺功能,只(zhi)需(xu)要長按(an)iPhone 16 Pro系列側面新增的拍照按(an)鍵,我們(men)就能進(jin)入(ru)AI視(shi)覺識別界面。
我們拍攝(she)完一個物體(ti)后,系(xi)統會提供(gong)幾(ji)個選項,你可以選擇(ze)詢問ChatGPT,也(ye)可以選擇(ze)谷(gu)歌搜(sou)索,或(huo)者是描述(shu)圖(tu)片(pian)信息(xi)。
目(mu)前安卓(zhuo)陣(zhen)營近(jin)期的(de)一些更新,基本都加入了AI識屏功能,比(bi)如拍照識別(bie)菜單,拍照購物比(bi)價,因此蘋果這次的(de)AI識屏,在效果上并沒有帶來太大的(de)驚艷感(gan)。
▲華為小藝識屏對話
結語:蘋果AI落地加速,安卓陣營迎頭趕上
距離WWDC整整140天后(hou),蘋(pin)果(guo)Apple Intelligence終于正(zheng)式登場,從(cong)實際體驗(yan)來看(kan),蘋(pin)果(guo)承諾的(de)AI功能基本都已落(luo)地(di)。雖然在(zai)一(yi)些AI文(wen)字、圖(tu)片(pian)處理的(de)細節上還(huan)存在(zai)一(yi)些小BUG,但AI的(de)確給蘋(pin)果(guo)iOS帶來了不少新的(de)體驗(yan)加分項。
與此同時(shi),我們看(kan)到很多蘋果(guo)此前領(ling)先(xian)的(de)功能,都(dou)已經(jing)被(bei)安(an)卓陣營趕上,尤其在AI功能的(de)豐富程度方(fang)面(mian),安(an)卓甚至(zhi)有所領(ling)先(xian),比(bi)如安(an)卓陣營的(de)AI助(zhu)手已經(jing)可以(yi)一鍵、一句話(hua)完成復雜的(de)跨應用操作,比(bi)如點外賣、充話(hua)費(fei)。在這方(fang)面(mian),蘋果(guo)AI的(de)落地還(huan)有些慢(man)。
并(bing)(bing)且在AI更“懂你(ni)”這件事(shi)上,安(an)卓的(de)(de)進展也要快于蘋果,安(an)卓AI智(zhi)能體(ti)已經開始具備一(yi)些提供個性化(hua)AI服務的(de)(de)能力,比如(ru)了解用(yong)戶(hu)(hu)的(de)(de)App使用(yong)習慣、學(xue)習用(yong)戶(hu)(hu)的(de)(de)一(yi)些基本信(xin)息(xi)并(bing)(bing)在一(yi)些場景中(zhong)智(zhi)能填寫用(yong)戶(hu)(hu)信(xin)息(xi)。蘋果雖(sui)然也有相關規劃,但目(mu)前(qian)從實(shi)際功能上來說體(ti)現(xian)的(de)(de)并(bing)(bing)不(bu)多。
如今,各家手機(ji)廠商(shang)都明確要做系(xi)統級AI,要做AI OS,要重(zhong)點做好(hao)AI智(zhi)能體(ti),可以說,在思路和(he)策略上(shang),蘋果已經沒有(you)任何領(ling)先了,接(jie)下(xia)來AI手機(ji)之(zhi)戰要比拼的,就是落地體(ti)驗(yan)。
功能(neng)家家都有,但(dan)誰能(neng)做的更流(liu)暢、更準確、體驗更完善,才是(shi)真正的決勝關鍵。
文章實機(ji)體驗圖片來源:Brandon Butch、zollotech