「智猩(xing)(xing)猩(xing)(xing)AI新青年(nian)講座(zuo)」由智猩(xing)(xing)猩(xing)(xing)出品,致力于邀請青年(nian)學者,主講他們在生成(cheng)式AI、LLM、AI Agent、CV等人工智能領(ling)域(yu)的最新重要研究成(cheng)果。

AI新青(qing)年是加速(su)人工智能(neng)前沿研(yan)究(jiu)的新生力量。AI新青(qing)年的視頻(pin)講解和(he)(he)直(zhi)播答(da)疑,將可以幫助大(da)(da)家(jia)增進對人工智能(neng)前沿研(yan)究(jiu)的理解,相應領域(yu)的專業知識也(ye)能(neng)夠得以積累加深。同(tong)時(shi),通過與AI新青(qing)年的直(zhi)接交流,大(da)(da)家(jia)在AI學習和(he)(he)應用AI的過程(cheng)中(zhong)遇(yu)到的問題,也(ye)能(neng)夠盡快解決。

隨著擴散模型技術的引入,文本到圖像(Text-to-Image, T2I)生成技術迎來了顯著的飛躍,現有模型在該領域展現出了卓越的創造力和表現力。盡管如此,文生圖模型在使用語言顏色名稱來指定對象顏色時,由于這些標簽覆蓋的顏色范圍較廣,難以實現精確匹配,且現有的文生圖個性化方法往往會導致顏色-形狀糾纏問題。為了實現T2I任務中的精準顏色生成,來自巴塞羅那自治大學LAMP組博士后王凱提出(chu)了ColorPeel模型,首(shou)次(ci)解決了color prompt learning(顏色提示學習)問題,相關論文為(wei)《ColorPeel: Color Prompt Learning with Diffusion Models via Color and Shape Disentanglement》,收錄于ECCV 2024。

ECCV 2024 顏色生成新突破!首次解決文生圖擴散模型中的顏色提示學習問題 | UAB博士后王凱講座預告

ColorPeel是(shi)一(yi)種基于(yu)擴散模型的精(jing)確顏(yan)色生成方法,其核(he)心在于(yu)通過(guo)顏(yan)色和形狀的解耦來(lai)提(ti)升(sheng)T2I生成中顏(yan)色的精(jing)確度(du)。

ColorPeel首先生(sheng)成一系列基礎的2D或3D幾何形(xing)狀,并將這些形(xing)狀賦予用戶(hu)指定的RGB顏(yan)色值(zhi)或顏(yan)色坐標(biao),作(zuo)為訓練數據。

擴散(san)模型利用(yong)訓(xun)練過程中學到的(de)顏(yan)色(se)特征(zheng),結合用(yong)戶(hu)提(ti)供(gong)的(de)顏(yan)色(se)提(ti)示,生成(cheng)具(ju)有精確(que)顏(yan)色(se)的(de)圖像。

ColorPeel中引入一個創(chuang)新的交叉注(zhu)意力對齊損失函數進行模(mo)型(xing)更新,旨在通過將顏色(se)和形狀(zhuang)從(cong)自動生成的目標顏色(se)幾何物體(ti)中解耦,使得模(mo)型(xing)能(neng)夠(gou)更準確地學(xue)習顏色(se)提示,避(bi)免顏色(se)和形狀(zhuang)特征的混合問題。

在生成階段,用(yong)戶(hu)通過(guo)提(ti)供文本描(miao)述和(he)顏(yan)色提(ti)示來指導(dao)圖像(xiang)的生成。通過(guo)反向擴(kuo)散過(guo)程逐步恢復(fu)出(chu)圖像(xiang)的顏(yan)色和(he)形(xing)狀信息。這個過(guo)程中,模型(xing)會不斷優化(hua)圖像(xiang),以(yi)確保(bao)其顏(yan)色、形(xing)狀以(yi)及整體風格與(yu)用(yong)戶(hu)的輸入高度一(yi)致。

ECCV 2024 顏色生成新突破!首次解決文生圖擴散模型中的顏色提示學習問題 | UAB博士后王凱講座預告

8月15日10點,智猩猩邀請到論文共同一作、巴塞羅那自治大學LAMP組博士后王凱參與「智猩猩AI新青年(nian)講座(zuo)」247講,主講《文生(sheng)圖擴散模型中的(de)精確顏色生(sheng)成》。

講者

王凱

巴塞羅那自治大學LAMP組博士后

在吉林大學計算機科學與技術學院分別于2014年及2017年拿到本科及碩士學位。2022年博士畢業于西班牙巴塞羅那自治大學LAMP組,導師為Joost van de Weijer,主要研究課題為持續學習,vision transformer,擴散模型以及域適應等課題。畢業后至今留組作為博后指導多名博士生進行相關領域的研究工作。
第247講主 題
文生圖擴散模型中的精確顏色生成
提 綱
1、文生圖擴散模型顏色生成存在的問題
2、基于LDM的文生圖精確顏色生成方法ColorPeel
3、解耦顏色和形狀以提升模型顏色學習能力
4、實驗結果展(zhan)示與擴展(zhan)應用(yong)

直播信息

直播時間:8月15日10:00
直播地點:智猩猩GenAI視頻號

成果

論文標題
《ColorPeel: Color Prompt Learning with Diffusion Models via Color and Shape Disentanglement》
論文鏈接
//arxiv.org/abs/2407.07197
項目網站
//moatifbutt.github.io/colorpeel/
開源代碼
//github.com/moatifbutt/color-peel

入群申請

本次(ci)講座(zuo)組建了(le)學習交(jiao)流(liu)群。加入學習交(jiao)流(liu)群,除了(le)可以觀看直(zhi)播,并(bing)提前拿(na)到課件(jian)外(wai),你還(huan)能結識(shi)更(geng)多研(yan)究人員和開發者(zhe),所提問題也將會優(you)先解答。

希望入群的朋友可以掃描下方二維碼,添加小助手米婭進行申請。已添加過米婭的老朋友,可以給米婭私信,發送“ANY247”進行申請。

ECCV 2024 顏色生成新突破!首次解決文生圖擴散模型中的顏色提示學習問題 | UAB博士后王凱講座預告