
去年12月,智東西(xi)公開課(ke)聯(lian)合(he)達(da)摩(mo)院自然語言智能實(shi)驗室全新策劃(hua)推出了(le)「阿(a)里達(da)摩(mo)院大模型(xing)公開課(ke)」,并邀請到了(le)阿(a)里巴巴達(da)摩(mo)院高(gao)(gao)級(ji)算法(fa)工程師(shi)李晨亮和NLP高(gao)(gao)級(ji)算法(fa)專(zhuan)家嚴明,分別就主題(ti)《達(da)摩(mo)院通義 AliceMind 預訓練大模型(xing)在(zai) AIGC 文本創作的(de)探索》、《 達(da)摩(mo)院通義 mPLUG 多模態預訓練技術演進及應(ying)用實(shi)踐》進行了(le)深度講解(jie)。
5月18日(ri),「阿(a)里達摩(mo)院(yuan)大模(mo)型公開課」第3講(jiang)上線(xian)開講(jiang)。阿(a)里巴巴達摩(mo)院(yuan)算(suan)法(fa)(fa)專家(jia)、ChatPLUG 核(he)心貢獻(xian)(xian)者(zhe)田(tian)俊峰和阿(a)里巴巴達摩(mo)院(yuan)算(suan)法(fa)(fa)工程師、mPLUG 核(he)心貢獻(xian)(xian)者(zhe)葉晴(qing)昊將參與主講(jiang)。兩位主講(jiang)人將對(dui)ChatPLUG 和 mPLUG-Owl 背(bei)后的技術(shu)細節(jie)進行深入剖析。
ChatPLUG 是基于 PLUG 的一個中文對(dui)(dui)話(hua)(hua)大模(mo)型(xing)(xing),使用億級(ji)互(hu)聯(lian)網社交數據、百科數據預訓(xun)練和百萬(wan)級(ji)高質(zhi)量對(dui)(dui)話(hua)(hua)數據,并(bing)采用 FID(Fuse-in-Decoder)架構(gou)進(jin)行(xing) instruction 微調得(de)到。該模(mo)型(xing)(xing)支持(chi)高效的輸入(ru)多段外部(bu)知識、人設信息等文本進(jin)行(xing)知識增強。
在與最新的(de)開源(yuan)中文對(dui)話大模型 BELLE-7M-2B 和(he) ChatGLM-6B 進行了多任務泛化性的(de)人(ren)工對(dui)比評(ping)測后發現:
1)ChatPLUG-3.7B 取得(de)了比(bi) BELLE-7B-2M 更好(hao)的效果( Rating-A 更多,Rating-C 更少(shao)),同時對比(bi) ChatGLM-6B 也取得(de)了 comparable 的效果,表明了 ChatPLUG 具備良好(hao)的多任務(wu)泛(fan)化能力;
2)當(dang)將模(mo)型(xing)的(de) size 擴大到 13B,ChatPLUG-13B 在所有模(mo)型(xing)中取得了最(zui)優效(xiao)果。
mPLUG-Owl是(shi)一(yi)款(kuan)類似于 miniGPT-4 和 LLaVA 的多模態(tai)對(dui)話生成模型(xing),由視覺(jue)基礎模型(xing) 、視覺(jue)抽象模塊以及預(yu)訓練語言模型(xing)組成,并(bing)且具備單(dan)模態(tai)和多模態(tai)多輪對(dui)話能力。
本(ben)次公開(kai)課,田俊峰將以(yi)《中文個性(xing)化(hua)對話大(da)模(mo)型(xing)(xing)ChatPLUG》為(wei)主題首(shou)先帶來直(zhi)播(bo)講解。他(ta)的(de)講解將主要從個性(xing)化(hua)大(da)模(mo)型(xing)(xing)研究(jiu)、搜(sou)索(suo)增強(qiang)指(zhi)令微調對話大(da)模(mo)型(xing)(xing),以(yi)及對話大(da)模(mo)型(xing)(xing)的(de)評估和開(kai)源三方(fang)面展開(kai)。
之后,葉(xie)晴昊將圍繞《模(mo)塊化多模(mo)態(tai)大(da)模(mo)型mPLUG-Owl》這一主(zhu)題進行(xing)講解。他將介紹多模(mo)態(tai)大(da)模(mo)型研究的變化趨勢,并(bing)對mPLUG模(mo)塊化多模(mo)態(tai)模(mo)型系列(lie),以及mPLUG-Owl及訓練新范(fan)式進行(xing)深入解讀。
第3講
主題一
《中文個性化對話大模型ChatPLUG》
提 綱
1、個性化大模型研究概述
2、搜索增強指令微調對話大模型
3、對話大模型(xing)的評估和開源
主講人
田俊(jun)峰,阿里巴巴達摩院算法專家(jia)、ChatPLUG核心貢獻(xian)者;研究方向(xiang)為對(dui)話(hua)大模型(xing)和(he)多模態大模型(xing),在國際頂級會議ACL、EMNLP、CVPR、AAAI等發表多篇文章。
主 題 二
《模塊化(hua)多模態(tai)大模型mPLUG-Owl》
提 綱
1、多模態大模型研究的變化趨勢
2、mPLUG模塊化多模態模型系列概述
3、mPLUG-Owl及訓練新范式解析
主講人
葉晴昊,阿里巴巴達(da)摩(mo)院算法(fa)工程師(shi)、mPLUG核心貢獻(xian)者(zhe);研究方向為多(duo)模(mo)態模(mo)塊化大模(mo)型,在國際頂級會(hui)議ICCV、ICML、ACL等發表多(duo)篇文章。