
智東西(公眾號:zhidxcom)
作者 | 三北
編輯 | 漠影
2024年,狂飆大半年的百模大戰,打到了視頻領域。瘋狂進化的模型、暴力堆砌的算力,展現出變革的巨大能量。但同時,海量難以開發利用的視頻數據,成為新的“瓶頸”。
“數據時代(dai),大模型是核心(xin)工具,場(chang)景化(hua)應(ying)用是價值(zhi)變現(xian)的(de)關鍵。”大華股份研發(fa)中心(xin)副總(zong)裁(cai)周文凱告(gao)訴智東西(xi),“當下(xia)數據要素很火,但(dan)視頻類數據生產、流(liu)通、交易仍有很多亟待解(jie)決的(de)問題,這(zhe)與視頻數據的(de)隱私性(xing)、敏感(gan)性(xing)、安全性(xing)有很大的(de)關系。”
作為(wei)AIoT領域(yu)龍頭(tou)企(qi)業,大(da)華股份在(zai)視(shi)頻領域(yu)有長達十(shi)幾年的深(shen)(shen)耕,周(zhou)文凱認為(wei)基(ji)于場(chang)景化(hua)的業務理解來提取視(shi)頻數(shu)據(ju)的結構化(hua)信息,并與業務應用進(jin)行深(shen)(shen)度的融(rong)合才能發揮更大(da)價值。
作為以視頻為核心的(de)數據產業代表企(qi)業,大(da)華股(gu)份是(shi)如(ru)何打造(zao)未來范本(ben)的(de)?通過對(dui)話周文(wen)凱,本(ben)文(wen)試圖從大(da)華股(gu)份在千(qian)行百(bai)業的(de)場景(jing)實戰經驗中,尋找這些(xie)問題(ti)的(de)答案。
一、數據為王,以視頻為核心的數據產業尤為重要
據(ju)(ju)知名行研機構IDC預測(ce),到(dao)2025年,全球(qiu)數據(ju)(ju)總量將(jiang)超過(guo)180ZB,其中(zhong)中(zhong)國數據(ju)(ju)總量將(jiang)躍居(ju)全球(qiu)首位。伴隨這一趨(qu)勢,數據(ju)(ju)交易市場(chang)的規模預計將(jiang)達到(dao)2200億元(yuan)(yuan)以上,若進一步考慮其驅動的計算(suan)、存儲(chu)、AI技術(shu)及軟件等基礎設施的全面發展(zhan),整(zheng)體市場(chang)規模更是(shi)有(you)望突破2萬億元(yuan)(yuan)大關。
這將展現出什么樣的廣闊發展前景呢?周文凱向智東西透露,目前產生的所有數據類型中,?以視圖為核心的非結構化數據占據數據總量的90%以上,圍繞著視頻的數據采集、流轉、分析、計算和應用等每個環節都隱藏著巨大的價值。但打開視頻數據產業鏈,我們看到還面臨著很多挑戰:如何在復雜的感知場景和泛雜的物聯協議中,實現數據的精準采集和海量設備的跨網互聯,在視頻數據分析和加工服務中,當前對于視頻等非結構化數據的挖掘程度還很低,視頻類數據需要依賴行業智能算法和應用的進一步挖掘,當前中國人工智能滲透率還不足10%,只有通過將視頻內容結構化后與業務結合才能發揮更大價值,而場景化應用是數據產業價值變現的核心關鍵。
“我國視(shi)頻(pin)數(shu)(shu)(shu)據(ju)要素(su)市(shi)場(chang)已構建起清晰的(de)(de)(de)三級(ji)(ji)架構:上游(you)聚焦于數(shu)(shu)(shu)據(ju)采(cai)集與治理的(de)(de)(de)一級(ji)(ji)市(shi)場(chang),中游(you)專(zhuan)注于數(shu)(shu)(shu)據(ju)加工與分析的(de)(de)(de)二級(ji)(ji)市(shi)場(chang),以及下游(you)面向數(shu)(shu)(shu)據(ju)應用(yong)評估的(de)(de)(de)三級(ji)(ji)市(shi)場(chang)。這一專(zhuan)業化(hua)分工體系不僅促進了視(shi)頻(pin)數(shu)(shu)(shu)據(ju)產業鏈的(de)(de)(de)精細化(hua)發展(zhan),還顯(xian)著加速了視(shi)頻(pin)數(shu)(shu)(shu)據(ju)向產業化(hua)邁進的(de)(de)(de)步伐。”周文凱說
總的來看,海量數據資源和三級視頻數據要素市場,都是數據產業的肥沃土壤。
二、發揮視頻要素“乘數效應”,要邁過四道坎
今年(nian)1月4日(ri),國家數(shu)據(ju)局(ju)等17部門近(jin)日(ri)聯合印發《“數(shu)據(ju)要(yao)素×”三年(nian)行動計劃(2024—2026年(nian))》(簡稱:行動計劃),提出選取(qu)工業(ye)制造、現代農業(ye)、商貿流通、交(jiao)通運輸、金(jin)融服務等12個行業(ye)和領域,推動發揮數(shu)據(ju)要(yao)素乘(cheng)數(shu)效(xiao)應,釋放數(shu)據(ju)要(yao)素價值。
周文凱告訴智東西,行動方案提及的12個行業所涉及的數據,90%以上是視圖為核心的非結構化數據。而發揮這些視頻要素“乘數效應”,至少要邁過四道坎。
具體來說,這些視頻數據包括用戶生成數據、專業制作數據、公共資源產生數據、社交媒體分享數據等多種類型。相比于結構化的文本數據來說,這些視頻數據在存儲、處理、理解和計算四(si)大方(fang)面都更加復(fu)雜。
1、存儲量大。視圖(tu)數(shu)據(ju)(ju)有別于(yu)結(jie)構化的(de)文(wen)本數(shu)據(ju)(ju),大(da)量(liang)的(de)視圖(tu)數(shu)據(ju)(ju)要做大(da)量(liang)的(de)存(cun)儲(chu)。這就(jiu)對有效的(de)存(cun)儲(chu)空間利用提出更高要求,包(bao)括(kuo)需要較強的(de)編(bian)解碼技術,以(yi)及有效的(de)存(cun)儲(chu)能(neng)力。
2、數據處理復雜。視頻(pin)數(shu)(shu)據種類(lei)豐富,編碼方式(shi)繁多,需要支持(chi)不(bu)同的分辨率(lv)、幀率(lv)、編碼方式(shi)、格式(shi)的數(shu)(shu)據的處(chu)(chu)理,這就要求數(shu)(shu)據處(chu)(chu)理方積累這些不(bu)同數(shu)(shu)據的處(chu)(chu)理能力(li)。
3、視頻理解難度大。視頻數(shu)(shu)據(ju)(ju)內容(rong)復雜多(duo)樣,要去理解(jie)場景化的(de)內容(rong),最(zui)好(hao)是(shi)將小(xiao)模(mo)型(xing)和大(da)模(mo)型(xing)結合起來,去做數(shu)(shu)據(ju)(ju)的(de)解(jie)析,從而挖掘出視頻數(shu)(shu)據(ju)(ju)中(zhong)有價值(zhi)的(de)信息。這(zhe)里補充說下,除了(le)訓練(lian)模(mo)型(xing)所需的(de)原始數(shu)(shu)據(ju)(ju),視頻數(shu)(shu)據(ju)(ju)真正(zheng)產生(sheng)的(de)交易(yi)價值(zhi),還是(shi)在于(yu)視頻結構化后挖掘產生(sheng)的(de)數(shu)(shu)據(ju)(ju)價值(zhi),因此視頻理解(jie)好(hao)不好(hao),很(hen)大(da)程度上決(jue)定了(le)視頻價值(zhi)的(de)大(da)小(xiao)。
4、計算量大。視(shi)頻數據的計算量非常大,大模型(xing)加(jia)劇(ju)了這(zhe)一情況。這(zhe)就需(xu)要廠商在準(zhun)確(que)率和(he)效率之間找一個平衡。視(shi)頻解析模型(xing)的參數量要適度,無法像文本大模型(xing)動輒有千億參數,不然計算量就太大了。
上述特征,也決定了視頻數據定價、交易和流通難度更大。
周文凱表示,視頻數據不像結構化的文本數據一樣流通便利,而是規模巨大,且大多數機器不可讀。如果要交易的話,巨量視頻數據怎么上傳和下載,對網絡帶寬、安全保護、結構化成本的(de)要(yao)求(qiu)都(dou)較高;基于成本(ben)和價(jia)值定價(jia)標準如(ru)何定,都(dou)是要(yao)解決的(de)問題(ti)。
對此,周(zhou)文凱認(ren)為,視(shi)頻(pin)數據(ju)要(yao)素價值的(de)開(kai)發,可以參考(kao)地產(chan)行業采取所有(you)權、使用(yong)權、經(jing)營權“三權分立”。視(shi)頻(pin)數據(ju)使用(yong)者(zhe)向數據(ju)所有(you)者(zhe)付費,視(shi)頻(pin)數據(ju)運(yun)營者(zhe)推動視(shi)頻(pin)價值得(de)到最大(da)限度的(de)安全挖掘(jue),從而(er)能夠盤活視(shi)頻(pin)數據(ju)要(yao)素市場。
而從技術角度來說,讓視頻(pin)數(shu)據(ju)(ju)可交(jiao)易(yi)使用(yong),還(huan)有(you)賴于AI對(dui)數(shu)據(ju)(ju)的(de)理解(jie)。比如(ru)大華股份在視頻(pin)編解(jie)碼、大數(shu)據(ju)(ju)平臺、數(shu)據(ju)(ju)治理、視覺大模型、安全合規等多方面都有(you)深入積淀(dian),比如(ru)如(ru)何實現(xian)視頻(pin)數(shu)據(ju)(ju)與文本數(shu)據(ju)(ju)的(de)異構數(shu)據(ju)(ju)融合計(ji)算等,以此降低視頻(pin)數(shu)據(ju)(ju)開發利用(yong)的(de)難度和(he)成(cheng)本。
三、數據價值變現,場景化應用落地是關鍵
在(zai)數(shu)(shu)字化(hua)時代(dai),?數(shu)(shu)據(ju)(ju)被視為新型生(sheng)產要素(su),數(shu)(shu)據(ju)(ju)的(de)價(jia)值不僅(jin)僅(jin)在(zai)于其(qi)本身,?更(geng)在(zai)于如(ru)何(he)有效(xiao)地(di)利用這些數(shu)(shu)據(ju)(ju),場景化(hua)應用落地(di)是實現數(shu)(shu)據(ju)(ju)價(jia)值變現的(de)關鍵(jian)。大華股份自2017年(nian)起就開始構(gou)建大的(de)物聯(lian)數(shu)(shu)智(zhi)平(ping)臺(tai)(tai),2019年(nian)形成(cheng)完整(zheng)的(de)平(ping)臺(tai)(tai)體(ti)系(xi)架構(gou),2021年(nian)發布Dahua Think #戰(zhan)略,推(tui)出“一體(ti)系(xi)、兩平(ping)臺(tai)(tai)”,即“物聯(lian)數(shu)(shu)智(zhi)中臺(tai)(tai)體(ti)系(xi)”和“城市平(ping)臺(tai)(tai)2.0、企業(ye)(ye)平(ping)臺(tai)(tai)3.0”,助力各(ge)(ge)行各(ge)(ge)業(ye)(ye)挖掘視頻數(shu)(shu)據(ju)(ju)價(jia)值。
2023年,大華(hua)股份(fen)全新升(sheng)級(ji)Dahua Think #2.0戰略,并全新升(sheng)級(ji)的(de)物聯數(shu)智平(ping)臺2.0,該(gai)平(ping)臺全面融合(he)物聯感知(zhi)、算網融合(he)、視覺大模型、數(shu)據智能等技術(shu),完善軟件工程化能力,賦能千行百業(ye)客戶(hu)的(de)應用。
在城市方面,大華圍(wei)繞城市(shi)高效治理(li)(li)、運行(xing)自治、安全(quan)體系升級、生態協同治理(li)(li)拓(tuo)展了各領域,覆蓋了超過200個城市(shi)場景(jing)(jing)。比如在交(jiao)通(tong)治理(li)(li)場景(jing)(jing),周文凱談道,過去(qu)的(de)小(xiao)模(mo)(mo)型往(wang)往(wang)只能(neng)識別一些局部(bu)場景(jing)(jing),如某(mou)個關(guan)口排隊(dui)要多久等;在應用了大模(mo)(mo)型之(zhi)后(hou),某(mou)地整個城市(shi)交(jiao)通(tong)態勢變得可(ke)被(bei)全(quan)面掌控,交(jiao)通(tong)調配決(jue)策(ce)變得更(geng)科(ke)學(xue)。
在企業方面,大(da)華則(ze)以助(zhu)力(li)企(qi)(qi)業(ye)(ye)(ye)構建大(da)安(an)全(quan)體系、數智生(sheng)產(chan)力(li)、提(ti)升經(jing)營決斷力(li),為企(qi)(qi)業(ye)(ye)(ye)提(ti)供數字化管理工具,幫(bang)助(zhu)企(qi)(qi)業(ye)(ye)(ye)解決業(ye)(ye)(ye)務痛點。比(bi)如(ru)能源領域(yu),周文凱(kai)稱一些客(ke)戶的需(xu)求比(bi)較強烈,他們(men)亟需(xu)通過(guo)視(shi)頻去做安(an)全(quan)生(sheng)產(chan)和(he)(he)降本提(ti)效;另外智能駕駛(shi)領域(yu)的客(ke)戶需(xu)求也非常強烈,他們(men)需(xu)要基(ji)于(yu)視(shi)頻和(he)(he)雷達聯合起來去做智能駕駛(shi)。
當然這(zhe)(zhe)些(xie)應用的(de)升級離不(bu)開大(da)模型(xing)(xing)能(neng)力的(de)加載,很多大(da)模型(xing)(xing)并不(bu)適合(he)直接拿來用,而是需(xu)要結合(he)場景(jing)去發揮價值。“無論(lun)是生成(cheng)式模型(xing)(xing)還(huan)是解析式模型(xing)(xing),這(zhe)(zhe)些(xie)大(da)模型(xing)(xing)都是基礎模型(xing)(xing)(Foundation Model),本質上是比小(xiao)模型(xing)(xing)加強了理解和(he)認(ren)知能(neng)力。當認(ren)知產生的(de)時候,人們在上面構建(jian)出面向各個(ge)場景(jing)的(de)能(neng)力,這(zhe)(zhe)才是大(da)模型(xing)(xing)價值的(de)本質。”
周文凱(kai)談道,大(da)(da)(da)華做的大(da)(da)(da)模型,是以視覺為核心(xin),融(rong)合了(le)多模態的能力,具備準確(que)性和泛化性躍升(sheng)、圖(tu)文提示(shi)定(ding)義新功(gong)能、突破視覺認知能力、全場景自主解(jie)析、大(da)(da)(da)小(xiao)模型與算(suan)力協同(tong)五大(da)(da)(da)方面(mian)特征,目前已落地多個(ge)行(xing)業(ye)領(ling)域。
除了大模型外,這背后也離不開大華股份圍繞視圖在編解碼、治理、分析、網絡、存儲等方面所做(zuo)的一系列優化。
比如在數據分析方(fang)面(mian),大華自建(jian)了超千臺服務器(qi)規模的數(shu)據(ju)中(zhong)心,專門模擬大數(shu)據(ju)各(ge)種場景需求,支(zhi)持(chi)大華在數(shu)據(ju)存(cun)儲(chu)、數(shu)據(ju)治理(li)、數(shu)據(ju)分(fen)析等多方(fang)面(mian)去做全流程試驗,從而保證技術(shu)領先(xian)性(xing)和穩定性(xing)。
在數據安全方面(mian),大華(hua)積累了眾(zhong)多安全(quan)相關技術(shu),在其一站式的數據智能引(yin)擎上提供了面(mian)向(xiang)數據傳(chuan)輸(shu)流轉的很多安全(quan)管控措(cuo)施,如實現項目隔(ge)離(li)(li)、數據隔(ge)離(li)(li),權限(xian)隔(ge)離(li)(li)、訪(fang)問隔(ge)離(li)(li)、安全(quan)審計等。
結語:視頻數據沃土,場景化數據要素價值凸顯
當下正值數據要(yao)素加速落地(di)千行百業,深挖場(chang)景化數據價值變得(de)尤為重要(yao)。
從大華股份(fen)的實踐(jian)中(zhong),我們了解到國產玩(wan)家正在克服視頻數據在存(cun)儲、處理(li)、理(li)解、計(ji)算、定價(jia)、流通等環(huan)節面臨的挑(tiao)戰(zhan),將視頻數據處理(li)能(neng)與多(duo)樣化場(chang)景(jing)應用深(shen)度融合。這其中(zhong)既包含了企業十(shi)幾(ji)年的行業經驗和數據處理(li)能(neng)力積淀(dian),更凝聚(ju)了跨越多(duo)個業務周(zhou)期(qi)的寶(bao)貴行業知識與專業洞察(cha)(know-how)。
數據為(wei)王時代,在(zai)堆(dui)算力(li)、煉模型(xing)的同時,如何(he)讓(rang)海量的視頻數據要素(su)發揮乘(cheng)數效應,成為(wei)我(wo)國數字產業實現領(ling)跑世(shi)界的一大(da)關(guan)鍵。