低成本DeepSeek R1推理挑战与赤兔推理引擎实践｜清程极智联合创始人唐适之主讲预告

DeepSeek R1具(ju)有(you)強大的推(tui)理能(neng)力(li)，能(neng)夠通過(guo)多(duo)次推(tui)理和思考得出(chu)問題(ti)的最佳答案(an)。但其中每一步(bu)推(tui)理和思考都(dou)會(hui)消(xiao)耗大量的計算資源，進而提高了單次推(tui)理的算力(li)成本。如何縮減DeepSeek R1的推(tui)理算力(li)成本，降低私有(you)化部署門檻，是全行業共同面臨的難題(ti)。

今年(nian)3月，清程極智聯合(he)清華大學翟季(ji)冬教授團隊開源了大模型(xing)推(tui)理(li)(li)引(yin)(yin)擎赤(chi)兔(tu)（Chitu），率(lv)先實(shi)現了在非H卡設備運行原生FP8模型(xing)突破。實(shi)測數據顯示，使(shi)用赤(chi)兔(tu)引(yin)(yin)擎在H800集群上部(bu)署滿(man)血(xue)版DeepSeek R1，相比(bi)于(yu)vLLM部(bu)署方案，能夠(gou)在減(jian)少50%的(de)(de)GPU使(shi)用量的(de)(de)同時，將輸出速度提升3.15倍。這意味著通過(guo)赤(chi)兔(tu)推(tui)理(li)(li)引(yin)(yin)擎，企業可以通過(guo)更(geng)少的(de)(de)硬件資源，實(shi)現更(geng)高的(de)(de)性能，大幅(fu)降低推(tui)理(li)(li)模型(xing)的(de)(de)私(si)有化部(bu)署成本。

3月27日19點，智猩猩「DeepSeek大解讀」系列公開課第6期將開講，由清程極智聯合創始人唐適之博士主講，主題為《低成本DeepSeek R1推理挑戰與赤兔推理引擎實踐》。

本次公(gong)開(kai)(kai)課，唐(tang)適之博(bo)士首先(xian)會對(dui)DeepSeek R1與日益增長的算力需求進行分析，并探討(tao)有(you)限硬件資源下的大(da)模型推(tui)理(li)取舍之道。之后，唐(tang)適之博(bo)士還會深(shen)入講解(jie)開(kai)(kai)源大(da)模型推(tui)理(li)引擎(qing)“赤兔”如何降低DeepSeek R1推(tui)理(li)所需的硬件成本，尤(you)其是(shi)在更(geng)廣泛GPU上的FP8數據類(lei)型的推(tui)理(li)優(you)化實踐。

低成本DeepSeek R1推理挑戰與赤兔推理引擎實踐｜清程極智聯合創始人唐適之主講預告

公開課內容

主題：低成本 DeepSeek R1 推理挑戰與赤兔推理引擎實踐
提綱：
1、DeepSeek R1 與日益增長的算力需求
2、有限硬件資源下的大模型推理取舍
3、“赤(chi)兔”方(fang)案(an)：更廣(guang)泛(fan) GPU 上的 FP8 推理優化

主講人

唐適之(zhi)，清(qing)程極(ji)智聯合創始人，清(qing)華大學(xue)計(ji)算(suan)(suan)機專業學(xue)士、博士，負(fu)責清(qing)程極(ji)智并行訓(xun)練(lian)、推理框架、算(suan)(suan)子優化等(deng)各類技術研(yan)發。唐適之(zhi)曾(ceng)獲全國(guo)信(xin)息學(xue)奧賽(sai) NOI 金(jin)牌，曾(ceng)為(wei)清(qing)華大學(xue)國(guo)際超(chao)算(suan)(suan)競賽(sai) ASC/ISC/SC 三冠(guan)團隊成員，主(zhu)要的學(xue)術研(yan)究領域包括編程語言、異構計(ji)算(suan)(suan)等(deng)，代表(biao)工作(zuo)為(wei) FreeTensor 編程框架。

直播時間

3月(yue)27日19:00

久久婷婷五月综合97色直播,日本日本熟妇中文在线视频,精品国精品自拍自在线,7777精品伊人久久久大香线蕉,男人用嘴添女人下身免费视频

相關推薦