
智東西(公眾號:zhidxcom)
編輯 | GTIC
智東西(xi)4月14日報道,在剛(gang)剛(gang)落幕的(de)GTIC 2023中國(guo)AIGC創(chuang)新峰會上,計(ji)算美學(Nolibox)聯合創(chuang)始人(ren)黃(huang)晟昱發表了名為《AIGC驅動設計(ji)創(chuang)意生產(chan)機制革(ge)新》的(de)主題演講。
黃晟昱向(xiang)在(zai)場嘉賓(bin)介紹了設(she)計中的(de)(de)技(ji)術演化(hua)。他指出,當下AI等新興技(ji)術正(zheng)在(zai)經歷爆炸式的(de)(de)發展(zhan)增長,設(she)計行(xing)業(ye)正(zheng)在(zai)面臨著(zhu)飛速增長的(de)(de)設(she)計創意(yi)市(shi)場需求與高效率及高品質(zhi)設(she)計之間的(de)(de)矛盾。從(cong)行(xing)業(ye)趨勢上來看,設(she)計創意(yi)的(de)(de)過(guo)程(cheng)及方式會隨著(zhu)機器(qi)的(de)(de)進化(hua)呈現出多元化(hua)的(de)(de)趨勢。總之,AIGC時代,設(she)計行(xing)業(ye)面臨著(zhu)生(sheng)產力變革。
黃晟昱認(ren)為,目前(qian)實(shi)現AIGC驅動下可控的(de)(de)設計(ji)(ji)(ji)創(chuang)意(yi)生(sheng)產,面(mian)臨(lin)著(zhu)“人(ren)和(he)機(ji)器在設計(ji)(ji)(ji)創(chuang)意(yi)中(zhong)的(de)(de)語言不(bu)可通(tong)約性”“復雜(za)設計(ji)(ji)(ji)創(chuang)意(yi)需求的(de)(de)獲(huo)取(qu)與分析(xi)困難(nan)(nan)”“設計(ji)(ji)(ji)生(sheng)成(cheng)創(chuang)意(yi)難(nan)(nan)以迭代及(ji)落地”等三重(zhong)困境(jing)。但這(zhe)些(xie)困難(nan)(nan)可以通(tong)過保證設計(ji)(ji)(ji)資產的(de)(de)可量化(hua)性、設計(ji)(ji)(ji)經(jing)驗(yan)的(de)(de)可歸納(na)性、設計(ji)(ji)(ji)行為的(de)(de)可模擬性等三方面(mian)來解決,從而實(shi)現從“設計(ji)(ji)(ji)認(ren)知”到“機(ji)器認(ren)知”的(de)(de)轉化(hua)。
黃(huang)晟昱指出(chu),在AI可直接創作(zuo)的(de)背景下,人(ren)和(he)機(ji)器(qi)(qi)設(she)計角色(se)將(jiang)發(fa)生變化。一(yi)(yi)方面(mian),將(jiang)從過去(qu)的(de)由(you)人(ren)主導、以人(ren)機(ji)交互方式進行設(she)計變為人(ren)機(ji)協創。另一(yi)(yi)方面(mian),設(she)計領域還將(jiang)出(chu)現一(yi)(yi)種訓(xun)練(lian)機(ji)器(qi)(qi)的(de)設(she)計師(shi),他們通過訓(xun)練(lian)機(ji)器(qi)(qi)來實現自己(ji)的(de)設(she)計目標。
最后,黃晟昱介紹(shao)了設計(ji)美學(xue)的未來愿景(jing),即通過構建面(mian)向未來的智能(neng)設計(ji),讓設計(ji)工具更包(bao)容、設計(ji)更簡單(dan)、設計(ji)創意(yi)更普惠。
以下為黃晟昱的演講實錄:
作為最后一(yi)個出場的(de)(de)演講者(zhe),其(qi)實(shi)我的(de)(de)壓力蠻大的(de)(de)。大家今天(tian)聽(ting)了(le)一(yi)天(tian)的(de)(de)技(ji)術干貨,包括前沿的(de)(de)大模型研(yan)究、產業(ye)應用分(fen)享等,接下來(lai),我給大家分(fen)享一(yi)些好玩(wan)的(de)(de)東西。我相信,藝術和設計一(yi)直都是大家很關(guan)注(zhu)的(de)(de)內容,這(zhe)也(ye)是我們(men)團隊,包括計算美學這(zhe)家公司在(zai)這(zhe)幾(ji)年一(yi)直以(yi)來(lai)深(shen)耕的(de)(de)領(ling)域。
我今(jin)(jin)天演(yan)(yan)講(jiang)的主(zhu)題是《AIGC驅(qu)動設計創(chuang)意生(sheng)產機制革新》,勢必(bi)涉及到設計創(chuang)意的機制和流程。今(jin)(jin)天的演(yan)(yan)講(jiang),我將分(fen)三個(ge)章節跟大(da)家(jia)做一個(ge)拆解。
第一章節(jie),我想聊一下設計(ji)中(zhong)的(de)技(ji)(ji)術(shu)演化、技(ji)(ji)術(shu)革(ge)新(xin)及其影響(xiang)。其中(zhong)包括技(ji)(ji)術(shu)如何來影響(xiang)藝術(shu)家?如何影響(xiang)設計(ji)師的(de)創作行為(wei)?設計(ji)工具如何在一次次的(de)技(ji)(ji)術(shu)迭代中(zhong)不(bu)斷演進?
第二(er)章節,基于設計(ji)與技術之間的(de)相互(hu)糾(jiu)纏,以及(ji)我們在AI設計(ji)基礎領域近三年的(de)研究,我想聊一下,如何(he)實現(xian)AIGC支持下的(de)設計(ji)生(sheng)成技術的(de)路徑,包括怎么來解構設計(ji)量化的(de)數據和語言?如何(he)構建(jian)機器可理(li)解的(de)美(mei)學評估模(mo)型?
最后一(yi)個章節,我希望(wang)能(neng)夠帶著大家了解一(yi)下我們(men)發布的幾款產(chan)品,我們(men)如(ru)何(he)把AIGC轉(zhuan)化為(wei)可以(yi)落(luo)地(di)的設計創意類生產(chan)力(li)工(gong)具,以(yi)及(ji)未來是不是每個普通人都將擁(yong)有自己(ji)的設計創作能(neng)力(li)。
一、設計行業面臨生產力變革,創意形式及手段呈現多元化趨勢
首先,我來(lai)講一下設計與技(ji)術的演進,從時代背景來(lai)說,以(yi)ChatGPT為(wei)代表的新(xin)興技(ji)術爆(bao)發,其實極大地影(ying)響了(le)設計行業的競爭和供需關系。
生成式AI使(shi)技(ji)(ji)能變得更加民主和普惠,而技(ji)(ji)能的(de)(de)民主普惠將會導(dao)致設(she)(she)(she)(she)計(ji)專業工作(zuo)模式的(de)(de)變化(hua)。從行業趨勢(shi)來(lai)(lai)看,我(wo)們會發現,在設(she)(she)(she)(she)計(ji)創(chuang)作(zuo)領域,無論(lun)是工業設(she)(she)(she)(she)計(ji)、平面設(she)(she)(she)(she)計(ji)、服裝設(she)(she)(she)(she)計(ji),越來(lai)(lai)越多的(de)(de)設(she)(she)(she)(she)計(ji)師開始(shi)使(shi)用人機(ji)協(xie)同的(de)(de)技(ji)(ji)術和方(fang)式來(lai)(lai)推動設(she)(she)(she)(she)計(ji)創(chuang)作(zuo)手段(duan)的(de)(de)多樣(yang)性。設(she)(she)(she)(she)計(ji)創(chuang)意的(de)(de)過程也(ye)隨著機(ji)器的(de)(de)進化(hua)呈現出多元化(hua)的(de)(de)趨勢(shi)。
我(wo)們可能會有(you)一個疑問,在(zai)AI都能進行自主設計創意的過程當(dang)中,人(ren)(ren)類應該發(fa)揮什(shen)么樣的作用?如何順應環境的發(fa)展合理使(shi)用人(ren)(ren)工智能技術,協同進入到現有(you)的不同垂類的設計行業工作流(liu),從(cong)而(er)不讓(rang)AI取代人(ren)(ren)類,而(er)只是(shi)輔佐設計師發(fa)揮更大的設計創意力(li)量,以及把這種能力(li)賦(fu)能給普通(tong)人(ren)(ren)。
回(hui)顧一下(xia)歷史(shi),其實早在(zai)70年(nian)前的建筑設(she)(she)(she)計領(ling)域,設(she)(she)(she)計學者便思(si)考(kao)將能夠運算(suan)和思(si)考(kao)的機器(qi)帶入到設(she)(she)(she)計產品當中。數據和運算(suan)在(zai)設(she)(she)(she)計領(ling)域并(bing)不(bu)是這(zhe)幾年(nian)才興(xing)起的新鮮話題。
每一次運算的進(jin)步(bu),其實都(dou)伴隨設計(ji)范(fan)式的引進(jin)。比如上世紀(ji)60年代(dai)提出建(jian)筑(zhu)控制論、宇宙結構學;扎哈·哈迪德(Zaha Hadid)大師提出的參數設計(ji)、交互(hu)設計(ji);很早之前MIT發布的生成設計(ji);再到(dao)目前流行的數字(zi)建(jian)造(zao)、網站的響應自適應布局設計(ji),這(zhe)些都(dou)是技術(shu)和設計(ji)之間不(bu)斷(duan)迭代(dai)的標志。
2010年以(yi)后,設計行業逐漸(jian)進入(ru)到設計人(ren)工智能的(de)時代,尤其是今(jin)年,AIGC理念(nian)的(de)爆火(huo),將會誕生一些新(xin)的(de)生產方式。
除此之(zhi)外(wai),我還(huan)梳理(li)了一下設(she)(she)計(ji)(ji)(ji)與計(ji)(ji)(ji)算(suan)的(de)研究發展歷程(cheng)以及設(she)(she)計(ji)(ji)(ji)與計(ji)(ji)(ji)算(suan)的(de)應用發展歷程(cheng)。在(zai)1.0階段,大(da)家很熟悉的(de)Adobe、AUTOCAD等計(ji)(ji)(ji)算(suan)機(ji)輔(fu)助圖(tu)形設(she)(she)計(ji)(ji)(ji)工具(ju)誕生。這(zhe)個圖(tu)形在(zai)上世紀90年(nian)代已經在(zai)全(quan)球范圍之(zhi)內普及,這(zhe)些基于(yu)機(ji)器視覺及圖(tu)形學,設(she)(she)計(ji)(ji)(ji)動作會(hui)被轉化為量化規則(ze),早(zao)年(nian)間設(she)(she)計(ji)(ji)(ji)師通過手繪、印刷方式進行創作。
到了2.0時代(dai),比較有代(dai)表性的(de)是阿(a)里的(de)魯班設計系統、AutoDraw等輔助智能設計工(gong)具(ju),它們基(ji)于大量的(de)數據和機(ji)器學習來提升設計師的(de)工(gong)作效(xiao)率(lv)和能力,自動生(sheng)成banner、簡單的(de)海報。
在3.0時代,微軟收購OpenAI之(zhi)后,推(tui)出了Microsoft?Designer,我(wo)們也推(tui)出了圖宇宙和(he)畫宇宙兩款智能(neng)(neng)產品(pin)。這兩款產品(pin)以(yi)機器為主導進行直接設計創(chuang)意(yi),并在整個設計流(liu)程里輔助設計師,并且賦能(neng)(neng)給普通(tong)人。
二、突破AIGC驅動下設計生產困境,實現“設計認知”到“機器認知”轉化
談起(qi)(qi)我們(men)做這件事(shi)情的初衷,其實(shi)在2019年(nian),我們(men)就(jiu)在清(qing)華(hua)大學(xue)(xue)發(fa)起(qi)(qi)了一(yi)個跨學(xue)(xue)科的研(yan)究性項目。當(dang)時設計(ji)(ji)學(xue)(xue)、藝術學(xue)(xue)、計(ji)(ji)算機學(xue)(xue)、數學(xue)(xue)等不同領域(yu)的學(xue)(xue)者希望在一(yi)起(qi)(qi)做一(yi)件激(ji)動人(ren)心的事(shi),彼時,在這些(xie)學(xue)(xue)者看來,沒有什么比(bi)讓(rang)(rang)機器學(xue)(xue)會設計(ji)(ji)創造這件事(shi)更讓(rang)(rang)人(ren)激(ji)動。
2021年,我們進行了(le)(le)產(chan)學研轉(zhuan)化,聯合成立了(le)(le)計算美學,2022年我們分別(bie)發布了(le)(le)面向超級(ji)創作的生產(chan)工(gong)具以及(ji)智能設(she)計平臺。
縱觀(guan)設(she)(she)計(ji)學所關(guan)注(zhu)的人工(gong)智(zhi)能研(yan)究,我們(men)通過對(dui)設(she)(she)計(ji)領域的平面(mian)、產品、服(fu)裝(zhuang)、建筑、室內體驗、UI設(she)(she)計(ji)等進行分(fen)析,做了一些關(guan)鍵詞的聚類分(fen)析及檢索。這其中包括中文研(yan)究領域相對(dui)比較火的專家系統、知識工(gong)程、計(ji)算(suan)機輔助設(she)(she)計(ji)、參數化(hua)設(she)(she)計(ji)等。除此之外(wai),我們(men)還關(guan)注(zhu)國外(wai)目前研(yan)究的主(zhu)流方向(xiang)和趨勢,例如使用大模型(xing)或者智(zhi)能設(she)(she)計(ji)產品構建良好(hao)的用戶體驗。
那么(me)(me),具(ju)體而(er)(er)言,如果想實現(xian)比(bi)較可控(kong)的(de)、可編(bian)輯的(de)智能(neng)設計(ji),而(er)(er)不僅僅是用Stable Diffusion生成一張簡單的(de)圖(tu)像,那么(me)(me)我們前期需(xu)要做哪些(xie)準備?
首(shou)先第一(yi)步,我(wo)們(men)需(xu)要構建設計(ji)(ji)認知到(dao)機器認知的基礎概念。我(wo)簡單(dan)做一(yi)個類比(bi),智能設計(ji)(ji)之于(yu)設計(ji)(ji)行業正如(ru)自(zi)動駕(jia)駛(shi)之于(yu)交(jiao)通行業,這(zhe)兩者的結果都很相似。人們(men)提供一(yi)個設計(ji)(ji)需(xu)求,完成一(yi)個交(jiao)付,就(jiu)跟人們(men)打車(che)從初始(shi)點到(dao)終點,完成旅(lv)行一(yi)樣自(zi)然。
但(dan)相比(bi)較而言,駕駛行(xing)為(wei)(wei)是(shi)一(yi)種結(jie)(jie)構(gou)較強的行(xing)為(wei)(wei),而設計是(shi)一(yi)種結(jie)(jie)構(gou)性(xing)較弱的行(xing)為(wei)(wei),它具有很強的不確定(ding)性(xing)。簡單來說,設計一(yi)般沒有最優解,如果把設計抽(chou)象(xiang)成一(yi)類(lei)大家比(bi)較熟悉的函數關系,那(nei)么函數往往不是(shi)唯一(yi)。
舉一(yi)個非(fei)常簡(jian)單(dan)的(de)例子,當我們打開(kai)全球最大的(de)設計素材庫、同(tong)時也是(shi)一(yi)家(jia)社(she)交(jiao)網站的(de)Pintrest去搜熊貓的(de)logo。在不同(tong)的(de)語義環(huan)境和文化下(xia),人們可能會檢索到不同(tong)風格表達的(de)方式,但很(hen)難說哪(na)個logo更受(shou)人喜歡。可能用(yong)戶(hu)A喜歡左(zuo)上角的(de),用(yong)戶(hu)B喜歡潮酷(ku)一(yi)點的(de),這(zhe)其(qi)實(shi)是(shi)大千世界影(ying)射下(xia)設計行為復雜性的(de)典型縮影(ying)。
為了實現AI驅動(dong)下可(ke)控的(de)設計生產,需(xu)(xu)要(yao)(yao)解決(jue)(jue)幾(ji)點(dian)問題(ti)(ti)。首先要(yao)(yao)解決(jue)(jue)人(ren)和(he)設計創(chuang)(chuang)作當中語言的(de)不可(ke)通約性;第二(er),要(yao)(yao)解決(jue)(jue)復(fu)雜(za)設計創(chuang)(chuang)意(yi)(yi)(yi)需(xu)(xu)求(qiu)的(de)獲取難與分析的(de)問題(ti)(ti);第三,要(yao)(yao)解決(jue)(jue)設計創(chuang)(chuang)意(yi)(yi)(yi)的(de)生成方案難以迭代的(de)問題(ti)(ti)。我(wo)們(men)使用生成式產品(pin)做(zuo)內容創(chuang)(chuang)作,當我(wo)對(dui)整體的(de)畫面很(hen)滿意(yi)(yi)(yi),但(dan)是(shi)需(xu)(xu)要(yao)(yao)對(dui)局部細節進行很(hen)多微調的(de)時候(hou),目前很(hen)多直(zhi)接生成創(chuang)(chuang)意(yi)(yi)(yi)內容的(de)工具沒有辦法去滿足。所(suo)以,我(wo)們(men)提出(chu)通過把握“設計認知”到“機器認知”轉化的(de)三要(yao)(yao)素(su)來解決(jue)(jue)這個問題(ti)(ti)。
首先,是要(yao)保(bao)證設(she)計(ji)的(de)資產具備(bei)可(ke)量化性,這個可(ke)量化性,其(qi)實是針對(dui)整個設(she)計(ji)創意(yi)領域中,非線性思(si)維比較活(huo)躍的(de)領域數(shu)據(ju)和數(shu)據(ju)集的(de)構建。
第二塊是(shi)要保證設計(ji)經(jing)驗的(de)(de)可歸納(na)性(xing),這(zhe)個(ge)設計(ji)經(jing)驗有點類(lei)似于炒(chao)菜(cai),當所有的(de)(de)菜(cai)品(pin)都(dou)備齊(qi)了,我需要知(zhi)(zhi)道菜(cai)譜,而這(zhe)個(ge)菜(cai)譜正是(shi)不(bu)同的(de)(de)設計(ji)師基(ji)于自己的(de)(de)行業知(zhi)(zhi)識(shi)所產出的(de)(de)先驗經(jing)驗和知(zhi)(zhi)識(shi)。
第(di)三個環節,是要(yao)保證設計(ji)行(xing)為的(de)可模(mo)擬(ni)性,簡(jian)單(dan)來說(shuo),就是設計(ji)師在做設計(ji)的(de)過程(cheng)中,機器怎么基(ji)于資(zi)產的(de)量化以及經驗(yan)的(de)歸(gui)納去(qu)進行(xing)模(mo)擬(ni),這個過程(cheng)我(wo)們稱為設計(ji)生成的(de)算(suan)法可控。
因(yin)此,我(wo)想把這三個最關(guan)鍵的(de)要素跟大家(jia)一塊(kuai)兒分享一下,首先什么(me)是(shi)設(she)計資產的(de)可量(liang)化性?當大家(jia)去一些(xie)國(guo)內知名的(de)素材(cai)(cai)網站下載各類平面設(she)計素材(cai)(cai)的(de)時候,這些(xie)確實是(shi)設(she)計資產。但是(shi),從機(ji)器進行設(she)計創造的(de)角(jiao)度來說,機(ji)器并(bing)不理(li)解這些(xie)數據結構。
簡(jian)單來說,機(ji)器(qi)只認識(shi)這(zhe)張圖(tu)片的尺(chi)寸大(da)小(xiao),但沒有辦法(fa)知道里面的元(yuan)素所(suo)代表的人類主觀情(qing)感(gan)是什么。除此之(zhi)外,機(ji)器(qi)也不知道這(zhe)張圖(tu)片是賽博朋克風(feng)、波譜藝術(shu)風(feng)還是潮(chao)流(liu)潮(chao)酷風(feng)?更(geng)適合哪(na)些人群(qun)?這(zhe)兩種元(yuan)素搭配在一(yi)起有哪(na)些情(qing)感(gan)傾向?而這(zhe)些其實都是設計師基(ji)于常年的一(yi)些判斷(duan)去積累的主觀評(ping)價經驗。
所(suo)以(yi)我們(men)要(yao)做的事情,就是把這(zhe)些停留在數字空間里的死亡(wang)狀(zhuang)態下的設計資(zi)產,讓機器能夠從(cong)主觀的角度去理解它。在這(zhe)個過程(cheng)當中,我們(men)構(gou)建(jian)了(le)全球第一款可商用(yong)的視覺設計數據集,我們(men)花了(le)很(hen)大工夫自己搭建(jian)了(le)標(biao)注工廠。
目前,標注(zhu)工廠以專業(ye)的設(she)(she)計師專家系(xi)統為主,這其中包(bao)括(kuo)大量普通(tong)設(she)(she)計類(lei)學(xue)生和設(she)(she)計師從業(ye)者對于不同元素(su)、視覺內容(rong)排版、布局等一系(xi)列因(yin)素(su)的主觀考量。
我(wo)們積累了近20萬(wan)套結構(gou)化(hua)的(de)設計及(ji)模(mo)型、近3萬(wan)張可(ke)調用的(de)設計元(yuan)素(su)、100萬(wan)條設計美學的(de)評判標準,在此基礎上,我(wo)們搭建了自己的(de)美學推薦及(ji)評估(gu)系統,這其中包括了以風格標簽、情感標簽在內(nei)的(de)超(chao)過1000萬(wan)次的(de)標簽數據。
跟今(jin)天很多嘉賓提到的(de)(de)大(da)模型相比,這(zhe)個規模可能并不(bu)算很大(da)。但是對于設(she)計(ji)創意或者平面(mian)設(she)計(ji)來說,之前沒(mei)有人做(zuo)過這(zhe)類事情(qing)。所以,我們希望通(tong)過構(gou)建未來面(mian)向(xiang)機器可理解的(de)(de)美學數據集來貢獻我們自己(ji)第一步的(de)(de)基礎(chu)設(she)施。
其次(ci),我(wo)(wo)想(xiang)講一下設(she)計(ji)經驗的(de)(de)可(ke)歸(gui)納(na)性如何(he)實現?在設(she)計(ji)領域,有一句大家經常說(shuo)的(de)(de)話:我(wo)(wo)在買(mai)一個設(she)計(ji)師的(de)(de)服務,而不是買(mai)設(she)計(ji)師給我(wo)(wo)服務一個月或(huo)者一周,我(wo)(wo)買(mai)的(de)(de)是設(she)計(ji)師走(zou)過的(de)(de)路、旅過的(de)(de)游、讀(du)過的(de)(de)書、看(kan)過的(de)(de)電影(ying),以及最終設(she)計(ji)方案帶給我(wo)(wo)的(de)(de)藝(yi)術感(gan)受。
簡單來(lai)說(shuo),設(she)(she)(she)(she)(she)計(ji)師做(zuo)設(she)(she)(she)(she)(she)計(ji)的(de)(de)(de)過程是一個(ge)非線(xian)性思維活動的(de)(de)(de)過程,所(suo)以我們需(xu)要對設(she)(she)(she)(she)(she)計(ji)師的(de)(de)(de)設(she)(she)(she)(she)(she)計(ji)經(jing)驗進行歸納。在這個(ge)層面上,我們通過設(she)(she)(she)(she)(she)計(ji)信(xin)息表達模型來(lai)完成不同元素之間(jian)設(she)(she)(she)(she)(she)計(ji)師的(de)(de)(de)陣列,搭建了(le)面向平面設(she)(she)(she)(she)(she)計(ji)的(de)(de)(de)設(she)(she)(she)(she)(she)計(ji)師框(kuang)架,還基(ji)于自研的(de)(de)(de)設(she)(she)(she)(she)(she)計(ji)語言,為設(she)(she)(she)(she)(she)計(ji)問題的(de)(de)(de)重構及設(she)(she)(she)(she)(she)計(ji)知識(shi)的(de)(de)(de)推(tui)廣和遷移等關鍵技術(shu)提(ti)供了(le)非常有(you)力的(de)(de)(de)理論和技術(shu)方(fang)案的(de)(de)(de)基(ji)礎。
再(zai)往下走(zou),在(zai)設計行為具體(ti)內容上,我(wo)們對圖(tu)形、文(wen)字、色彩、布局、風格等(deng)設計構成要素(su)進行了圖(tu)譜構建(jian),同(tong)時基于(yu)已有的(de)(de)數據集,結合已經量化好的(de)(de)設計師的(de)(de)先(xian)驗知識,把基礎創意概念和可視化的(de)(de)視覺表達進行了關系(xi)映(ying)射,為機器提供非常可控、有效接(jie)近人(ren)類(lei)審美的(de)(de)設計作品,提供了一系(xi)列的(de)(de)基礎。
最后是如何(he)保證設(she)計行為(wei)的可模擬性(xing)。因(yin)為(wei)我們相信,無論Stable Diffusion、ChatGPT給我們帶(dai)來怎(zen)樣的沖擊和發展,未來主流(liu)的設(she)計生產方式一(yi)定還(huan)是人機協創。
在(zai)這(zhe)個(ge)過程當中,我們需(xu)要(yao)把(ba)人類和(he)(he)機器在(zai)整個(ge)設計鏈路(lu)流程當中的分工(gong)達到一種最優的配置,其實也就是(shi)明確人機協同(tong)視覺設計方案過程當中的生成路(lu)徑,以及評估和(he)(he)決策(ce)路(lu)徑。因為(wei)人類仍(reng)然有決定(ding)權去(qu)說,這(zhe)個(ge)設計可能適不適合我的輸(shu)出和(he)(he)使用。目前,機器通(tong)過學習只(zhi)能是(shi)越來越接近決策(ce)者對于設計的判斷。
三、針對性搭建底層系統,推動創意生產商業化落地
實(shi)現可(ke)控的(de)(de)AI設計關鍵(jian)技術(shu)要點。第一(yi)(yi),我們要構建(jian)一(yi)(yi)套統一(yi)(yi)結構化(hua)的(de)(de)設計元語言來打通(tong)人和機(ji)器之(zhi)間溝通(tong)的(de)(de)不可(ke)通(tong)約性,讓(rang)機(ji)器聽得懂設計師的(de)(de)話;第二,進行(xing)多(duo)通(tong)道、多(duo)模態(tai)創意(yi)信息(xi)捕捉研究,基(ji)于DH需求(qiu)模型,機(ji)器可(ke)以(yi)通(tong)過各種(zhong)媒介來抓(zhua)取人們的(de)(de)各種(zhong)行(xing)為,成為它創意(yi)的(de)(de)來源;第三,進行(xing)多(duo)技術(shu)耦合設計生(sheng)(sheng)成技術(shu)研究,設計生(sheng)(sheng)成算法方法集、目(mu)標導(dao)向(xiang)的(de)(de)約束優化(hua)規則集。
最后一步很關鍵,也就是實現人(ren)機協同(tong)下(xia)設計(ji)美學評估(gu)及(ji)決策。這里面涉及(ji)到美學評估(gu)方法、聯想推薦、包括反向(xiang)基于人(ren)類(lei)數據的(de)設計(ji)產出的(de)學習。
我們(men)還梳(shu)理了一整套流程,即解構(gou)設計師(shi)不同系列的(de)(de)非線性復雜設計行(xing)為,到進行(xing)統(tong)一結構(gou)化的(de)(de)描述(shu),再到設計知識(shi)的(de)(de)推理及遷移,以及最終(zhong)統(tong)一化的(de)(de)映射表達(da)(da)、可視(shi)化的(de)(de)表達(da)(da),從而產(chan)生方案。
因此(ci),我們也針對性地搭建了(le)三(san)個非常底層(ceng)的(de)系(xi)(xi)統(tong),其中包(bao)括設計資產量(liang)化系(xi)(xi)統(tong)、人工智能(neng)AIGC設計生成(cheng)引擎(qing)、云端協同(tong)可(ke)基于AIGC進行二次創(chuang)作的(de)專業(ye)引擎(qing),這三(san)個底層(ceng)系(xi)(xi)統(tong)將實(shi)現從創(chuang)意(yi)內容生產到具(ju)體(ti)商業(ye)化應(ying)用AIGC全(quan)鏈路設計服務(wu),有望成(cheng)為未來產品運作的(de)核心。
四、人和機器設計角色將發生變化,人機協創成為新趨勢
那么就(jiu)會(hui)有人(ren)問了,AI可(ke)以直接進行(xing)創作(zuo)了,那么設計(ji)師還要做(zuo)什么?人(ren)和(he)機器(qi)在設計(ji)創意角(jiao)色當中會(hui)有怎樣(yang)的變(bian)化?
在進行AI設(she)(she)(she)計(ji)研發的過程中,我(wo)們始終關注設(she)(she)(she)計(ji)師與機器(qi)之間(jian)協同分工的比(bi)例(li),并量化了(le)不同的分布,通過不斷的試錯來(lai)調整人機協創比(bi)例(li),來(lai)提升設(she)(she)(she)計(ji)創意的效率以及多樣性(xing)。因此(ci)我(wo)們內部(bu)產生了(le)一個(ge)新的訓練機器(qi)的設(she)(she)(she)計(ji)師崗位,這可能是未(wei)來(lai)構建通用(yong)型智能設(she)(she)(she)計(ji)模型底層(ceng)必須要走的路徑。
人類以(yi)前通過(guo)命(ming)令(ling)機器(qi)去完成(cheng)一些事情(qing),現在(zai)通過(guo)訓(xun)練機器(qi)來(lai)達成(cheng)自(zi)己的(de)設(she)計創(chuang)意(yi)目(mu)標。以(yi)前,我們(men)關(guan)(guan)注(zhu)的(de)更多是設(she)計師在(zai)軟件使用(yong)操(cao)作方面怎么樣?現在(zai)我們(men)更加(jia)關(guan)(guan)注(zhu)設(she)計師的(de)原創(chuang)能力如(ru)何?設(she)計師訓(xun)練機器(qi)進(jin)行設(she)計創(chuang)意(yi)的(de)思路(lu)如(ru)何?這都將成(cheng)為未來(lai)從(cong)業(ye)者關(guan)(guan)注(zhu)的(de)重(zhong)點。
在AIGC時代,設(she)計創作成(cheng)本(ben)無限趨于(yu)零,原(yuan)有(you)的(de)供需關系已經被打破,原(yuan)來(lai)以(yi)為高品質的(de)價格(ge)等于(yu)良好的(de)設(she)計,但是(shi)現在以(yi)非常低成(cheng)本(ben)的(de)價格(ge)也能(neng)產(chan)(chan)出(chu)很fancy的(de)效(xiao)果(guo)。設(she)計技(ji)能(neng)逐漸(jian)從專業化轉向到全(quan)民化。門(men)口賣(mai)煎(jian)餅(bing)果(guo)子的(de)老太(tai)(tai)太(tai)(tai)都可能(neng)利用我們的(de)這(zhe)個產(chan)(chan)品快(kuai)速(su)生產(chan)(chan)新(xin)的(de)設(she)計,這(zhe)是(shi)非常有(you)可能(neng)的(de)。
大(da)模型(xing)產品(pin)機(ji)會空間廣大(da),這(zhe)在今天很多嘉賓的(de)分享中(zhong)也有(you)體現(xian)。但是,大(da)模型(xing)目前只拘(ju)泥(ni)于少數巨頭(tou)。對于垂類行業的(de)創(chuang)意(yi)者(zhe)而言,應該關注專(zhuan)業場景的(de)應用(yong)層(ceng),因為這(zhe)其中(zhong)可(ke)能(neng)有(you)非(fei)常多的(de)潛在機(ji)會,未來的(de)巨頭(tou)也將會從中(zhong)出(chu)現(xian)。
以設(she)(she)計(ji)(ji)行業(ye)(ye)為例,從(cong)創意內容(rong)到(dao)(dao)設(she)(she)計(ji)(ji)應用,我們相信AIGC將會(hui)驅動整個設(she)(she)計(ji)(ji)創意自主化加速,從(cong)而(er)解放行業(ye)(ye)生產(chan)力。正如設(she)(she)計(ji)(ji)界非常著(zhu)名(ming)的(de)(de)(de)學(xue)者所(suo)說(shuo)的(de)(de)(de),設(she)(she)計(ji)(ji),在人(ren)人(ren)設(she)(she)計(ji)(ji)的(de)(de)(de)時(shi)代(dai)。同時(shi),在這(zhe)些技術基礎之上搭建什(shen)么(me)樣的(de)(de)(de)產(chan)品(pin)來服務現有的(de)(de)(de)社會(hui)、企業(ye)(ye)及(ji)市(shi)場(chang)的(de)(de)(de)需求,這(zhe)將關系到(dao)(dao)全球平(ping)面設(she)(she)計(ji)(ji)市(shi)場(chang)、全球設(she)(she)計(ji)(ji)服務市(shi)場(chang)以及(ji)全球創意市(shi)場(chang)的(de)(de)(de)市(shi)值(zhi)。
我們相(xiang)信(xin),在未來10年,AIGC至(zhi)少賦能10億人(ren)進行設(she)計創造。按照今年最新的(de)(de)數據,全球的(de)(de)設(she)計從業者為9600萬人(ren),將(jiang)近1億人(ren),相(xiang)當(dang)(dang)于80個(ge)人(ren)當(dang)(dang)中就有一(yi)個(ge)設(she)計師。最新的(de)(de)傳統的(de)(de)設(she)計公司,以Adobe為例,它的(de)(de)市值就比較(jiao)高,我認為,全球設(she)計市場(chang)(chang)的(de)(de)工(gong)具類市場(chang)(chang),肯定有非常大超過3000億美元的(de)(de)巨頭(tou)出(chu)現(xian)。
五、B端、C端雙重布局,構建面向未來的智能設計體
我們希(xi)望(wang)讓每個(ge)人(ren)享受好設計(ji),每個(ge)人(ren)享受好創(chuang)意,每個(ge)人(ren)享受好的(de)工具(ju),所以我們在成立兩(liang)(liang)年多的(de)時間相(xiang)繼推出兩(liang)(liang)款(kuan)產(chan)品(pin),也是AIGC超(chao)級(ji)生產(chan)工具(ju)。一款(kuan)是高品(pin)質的(de)智能(neng)設計(ji)引擎(qing),它涵(han)蓋了(le)目前整個(ge)非線性設計(ji)創(chuang)意活(huo)動(dong)的(de)兩(liang)(liang)個(ge)鏈路(lu)。
第一個(ge)是(shi)(shi)如何(he)激發設(she)計(ji)師的(de)(de)(de)靈感,然后(hou)在(zai)靈感的(de)(de)(de)基礎上進行(xing)繪制以及草圖(tu)和(he)素材的(de)(de)(de)積(ji)累?第二個(ge)是(shi)(shi)如何(he)成(cheng)為商(shang)業(ye)(ye)化的(de)(de)(de)設(she)計(ji)應(ying)用?舉一個(ge)簡單的(de)(de)(de)例子,比如今天(tian)大(da)會的(de)(de)(de)背(bei)景PPT、大(da)會的(de)(de)(de)視覺(jue)體系(xi),這些創意內容(rong)的(de)(de)(de)組合輸出(chu)都需要(yao)保(bao)證嚴謹(jin)性。在(zai)商(shang)業(ye)(ye)化的(de)(de)(de)設(she)計(ji)應(ying)用上,我(wo)們推出(chu)了圖(tu)宇(yu)(yu)宙和(he)畫(hua)宇(yu)(yu)宙,圖(tu)宇(yu)(yu)宙和(he)畫(hua)宇(yu)(yu)宙將(jiang)成(cheng)為面向(xiang)全球的(de)(de)(de)AI設(she)計(ji)創意綜合平臺,同時真正成(cheng)為一款(kuan)以機器(qi)設(she)計(ji)為主導的(de)(de)(de)設(she)計(ji)工具,并重新定義什么(me)是(shi)(shi)未來的(de)(de)(de)設(she)計(ji)生(sheng)產工具。基于此,我(wo)們的(de)(de)(de)NoliHub設(she)計(ji)量化引擎及設(she)計(ji)模型平臺也會向(xiang)上述兩個(ge)產品提供強大(da)的(de)(de)(de)底層(ceng)模型集(ji)數據支持。
再簡單(dan)介紹一下圖宇(yu)宙和(he)畫宇(yu)宙,它們區別于現有娛(yu)樂化的AIGC包括(kuo)AI繪畫產品,我(wo)們更側重(zhong)于把我(wo)們的能(neng)力,尤其(qi)做設(she)計工(gong)具操作系統的能(neng)力賦能(neng)到不同(tong)的設(she)計創(chuang)意垂類(lei)行(xing)業(ye)當(dang)中,因(yin)此我(wo)們在去年早期就定向針對(dui)Stable Diffusion模(mo)型(xing)進行(xing)重(zhong)構(gou),并(bing)基于垂類(lei)行(xing)業(ye)的訓練和(he)調整,同(tong)時搭(da)配上(shang)我(wo)們自研的國產AIGC的無線(xian)畫板功能(neng),相當(dang)于我(wo)們提供(gong)了非常完善的、針對(dui)設(she)計創(chuang)意的工(gong)作流。
在(zai)我們看來(lai),單一生成(cheng)圖(tu)像(xiang)并不能解決整個復(fu)雜的設計(ji)創(chuang)意工作,它必(bi)須(xu)要搭配摳(kou)圖(tu)替換、圖(tu)像(xiang)超分辨(bian)率、文本生成(cheng)圖(tu)像(xiang)等其他公民進行(xing)重(zhong)新規劃和設計(ji)。
我(wo)們目前提(ti)供B端(duan)(duan)和(he)C端(duan)(duan)兩個(ge)版本的產品(pin),C端(duan)(duan)產品(pin)為個(ge)人用(yong)戶提(ti)供基(ji)于無(wu)線畫板以(yi)及AIGC功能合成(cheng)(cheng)集。目前C端(duan)(duan)產品(pin)已經積累了來自用(yong)戶產出的海量AI創意內容,C端(duan)(duan)產品(pin)也(ye)因(yin)此成(cheng)(cheng)為國內最大的AI繪(hui)畫社區。
除此之外,在B端產(chan)品(pin)上,我們是第(di)一家(jia)實現(xian)對B端需(xu)求進行(xing)大規模定制的(de)公司(si)。目(mu)前,B端產(chan)品(pin)作為(wei)面向專用場景的(de)AIGC專業(ye)化的(de)工具,應用于服裝、游戲、工業(ye)設計等非常細分(fen)且專業(ye)的(de)領域。這些也是垂類用戶跟我們共創的(de)產(chan)品(pin)結果。
在(zai)我看來,我們提(ti)供多樣化的(de)AIGC模塊更多是為了構建未來面向AIGC模型的(de)專業(ye)操作系統,而(er)這個操作系統會隨著(zhu)有新的(de)垂類行(xing)業(ye)專業(ye)場景玩(wan)家的(de)加入而(er)不斷更新,從而(er)使我們的(de)AI繪畫超越簡單的(de)娛(yu)樂化功能,而(er)真正成為不同行(xing)業(ye)領域新的(de)生產方式。
目前,我(wo)們通過部(bu)署層、模型層、技(ji)術(shu)(shu)層、功(gong)(gong)能層到整(zheng)個無線(xian)創(chuang)(chuang)作畫板空間的產品層構建了(le)第(di)一步創(chuang)(chuang)意(yi)內容(rong)的生產。第(di)二步,我(wo)們將(jiang)基(ji)于設(she)(she)(she)計(ji)(ji)(ji)自(zi)研的SVG畫板引擎,構建未(wei)來的高品質智(zhi)能設(she)(she)(she)計(ji)(ji)(ji)平臺。這個平臺將(jiang)包含技(ji)術(shu)(shu)創(chuang)(chuang)意(yi)內容(rong)一鍵(jian)設(she)(she)(she)計(ji)(ji)(ji)、海報生成(cheng)、自(zi)適應響(xiang)應式的開發設(she)(she)(she)計(ji)(ji)(ji)、一鍵(jian)多(duo)尺寸的視覺海報延(yan)展、各(ge)類智(zhi)能化設(she)(she)(she)計(ji)(ji)(ji)的組件等功(gong)(gong)能,同時還會基(ji)于AI營銷文案(an)進行相應填(tian)充,包括(kuo)全(quan)局配色,相似(si)風格的生成(cheng)等。這些都狠狠切(qie)在目前傳統(tong)設(she)(she)(she)計(ji)(ji)(ji)領域當中的痛點。
我們希(xi)望(wang),未來設(she)計(ji)(ji)行業將告別(bie)繁瑣的模板,所(suo)有(you)的設(she)計(ji)(ji)基于自(zi)然語言(yan)的描述一鍵生成。我們也希(xi)望(wang)助(zhu)力更多的企業、商(shang)家以及(ji)個人,讓他們以非常低(di)成本的價(jia)格獲取高品質的設(she)計(ji)(ji)服(fu)務。
我們相信,基于設(she)(she)(she)計(ji)(ji)(ji)認知模(mo)(mo)型,通過(guo)中(zhong)臺(tai)(tai)的(de)(de)量化平臺(tai)(tai)及管理模(mo)(mo)塊,前臺(tai)(tai)的(de)(de)三個產品(pin)矩陣可以(yi)給(gei)大家帶來更(geng)好的(de)(de)設(she)(she)(she)計(ji)(ji)(ji)體(ti)驗。我們希(xi)望基于人機協(xie)創(chuang),構(gou)(gou)筑面(mian)向未(wei)(wei)來的(de)(de)設(she)(she)(she)計(ji)(ji)(ji)智能(neng)體(ti),把非線性的(de)(de)創(chuang)意思維(wei)轉為(wei)線性的(de)(de)結構(gou)(gou)數據(ju),從而(er)形(xing)成機器和美學(xue)的(de)(de)共(gong)同進(jin)步,我們也希(xi)望構(gou)(gou)建面(mian)向未(wei)(wei)來的(de)(de)智能(neng)設(she)(she)(she)計(ji)(ji)(ji)體(ti),讓設(she)(she)(she)計(ji)(ji)(ji)工(gong)具(ju)更(geng)包(bao)容,設(she)(she)(she)計(ji)(ji)(ji)過(guo)程更(geng)簡單,設(she)(she)(she)計(ji)(ji)(ji)創(chuang)意更(geng)普(pu)惠。謝謝各位!
以上是黃晟昱演講內容的完整整理。