芯東西(公眾號:aichip001)
編輯 |? GACS

9月(yue)14日~15日,2023全球AI芯片(pian)峰會(hui)(GACS 2023)在深圳南山(shan)圓滿舉行(xing)。在首日AI芯片(pian)架(jia)構創新專場上,肇觀電子的(de)(de)CEO馮歆鵬分享了主(zhu)題為《AI視覺芯片(pian)打造機器人的(de)(de)核(he)心感(gan)知能(neng)力》的(de)(de)主(zhu)題演講(jiang)。

馮歆鵬先介紹了VPU的(de)(de)定義以及學(xue)科基(ji)礎背景,認為VPU的(de)(de)市場規模和(he)GPU相(xiang)當,在世(shi)界正在從(cong)2D轉向(xiang)3D的(de)(de)技術革新中,是未來機器人等(deng)智(zhi)能設備必(bi)不可少(shao)的(de)(de)重要組(zu)成部(bu)分。

肇觀(guan)電(dian)子在產業內積(ji)累數年之久,也從其(qi)中(zhong)汲取了不少落地(di)經驗,并(bing)將其(qi)賦能(neng)與產業。馮(feng)歆鵬還提(ti)到(dao)肇觀(guan)電(dian)子幾個(ge)有(you)趣的(de)落地(di)場景案例。比如說,如何打造能(neng)夠(gou)在冷庫中(zhong)工作的(de)機器(qi)人,又如何讓汽車能(neng)夠(gou)巧妙的(de)避開障礙(ai)物等(deng)等(deng)。此外,他還認為未來世界,將會是(shi)機器(qi)人和人類(lei)共存的(de)狀態。

以下為馮歆鵬的演講實錄:

大家(jia)好!我是肇觀電子CEO馮歆(xin)鵬(peng),很高興(xing)今(jin)天有機會能(neng)夠跟大家(jia)分享。肇觀電子名字聽起(qi)來比較獨特(te),肇是開啟(qi),觀是視(shi)覺,開啟(qi)視(shi)覺的(de)意思(si),英文是NextVPU,也就(jiu)是Next Vision Processing Unit,下(xia)一代(dai)視(shi)覺處(chu)理器的(de)意思(si)。

我們是(shi)一家(jia)做計算(suan)機視覺和人工(gong)智能端側的(de)(de)芯片和模組核心元器件的(de)(de)公(gong)司,我們做的(de)(de)事情就(jiu)是(shi)幫助所有智能設備,讓它看懂世界(jie),賦予它看懂世界(jie)能力的(de)(de)事情。我們的(de)(de)下游(you)也比較廣(guang)泛,在機器人、車載(zai)、工(gong)業、安防、消費都有諸多的(de)(de)應用。

一、要讓機器人看懂世界,需解決五大技術問題

今天(tian)我(wo)講(jiang)的主題聚焦在(zai)(zai)機器人(ren)方面,機器人(ren)在(zai)(zai)過(guo)去的很(hen)長一(yi)段時(shi)間(jian),一(yi)直是熱點的領域(yu),也經歷了很(hen)多年的發(fa)展,到現(xian)在(zai)(zai)機器人(ren)領域(yu)在(zai)(zai)快(kuai)速(su)地發(fa)展,而(er)且(qie)將來(lai)市場非常廣大。所以(yi)特斯拉馬斯克說過(guo)特斯拉現(xian)在(zai)(zai)已(yi)經不是一(yi)個車(che)載公(gong)司(si)(si),是機器人(ren)公(gong)司(si)(si)。

大家(jia)想要解決(jue)(jue)(jue)的(de)問題其實很(hen)(hen)類似(si),當今世界(jie)面臨很(hen)(hen)多挑(tiao)戰,解決(jue)(jue)(jue)這些(xie)挑(tiao)戰的(de)一個現實有(you)效的(de)措施,是提高生產(chan)效率。如何(he)能夠快速地提高生產(chan)效率?就得利用發明(ming)或者創(chuang)造(zao)更加智(zhi)能的(de)設備,來自動幫人解決(jue)(jue)(jue)很(hen)(hen)多問題。

我(wo)們都希望將來的世界(jie)大概率(lv)會(hui)是(shi)一個無(wu)人(ren)(ren)工(gong)廠、無(wu)人(ren)(ren)農(nong)場(chang)、可(ke)穿戴(dai)設(she)備(bei)(bei)、無(wu)人(ren)(ren)駕駛汽車(che),是(shi)一個高(gao)度自動化的世界(jie),這些智能設(she)備(bei)(bei)可(ke)以提高(gao)每(mei)個人(ren)(ren)的工(gong)作(zuo)效率(lv)以及生活的質(zhi)量。咱們這個會(hui)場(chang)可(ke)能有很少(shao)的機器(qi)人(ren)(ren),但是(shi)過數年后,全球可(ke)能是(shi)300億個機器(qi)人(ren)(ren)和(he)90億人(ren)(ren)口(kou)共存的一個世界(jie)。

300億(yi)個智能(neng)(neng)(neng)設(she)備很重要(yao)的就是具(ju)有視(shi)(shi)覺(jue)能(neng)(neng)(neng)力,機器人要(yao)能(neng)(neng)(neng)自主(zhu)(zhu)地在(zai)空間中移動(dong),去(qu)解決(jue)它(ta)的這些(xie)問(wen)題,完成它(ta)的任務。這些(xie)設(she)備自主(zhu)(zhu)移動(dong)、需(xu)要(yao)全天(tian)候(hou)地移動(dong),需(xu)要(yao)24小時在(zai)各種惡劣(lie)條件下(xia)、各種環境下(xia),能(neng)(neng)(neng)夠正確(que)地解決(jue)它(ta)的問(wen)題,這需(xu)要(yao)它(ta)有相當(dang)程度的視(shi)(shi)覺(jue)能(neng)(neng)(neng)力。

我們肇觀電(dian)子做(zuo)的事情,就是幫助所有設(she)備賦予它“視覺(jue)能力”。

視覺(jue)(jue),大(da)家都比較理(li)解,它對于每個智能(neng)生物(wu)和智能(neng)設備都非(fei)常重要,人(ren)對信息的(de)采集主要是通過(guo)眼(yan)睛,同樣對設備而言,視覺(jue)(jue)能(neng)力(li)是它的(de)核心技術能(neng)力(li),所以我們在(zai)做這樣一件(jian)事情(qing)。

我們讓設備(bei)看(kan)懂世(shi)(shi)界(jie)(jie)的(de)話,要解決幾個子問題(ti),就是設備(bei)要看(kan)懂世(shi)(shi)界(jie)(jie),首先(xian)得(de)看(kan)得(de)見(jian)世(shi)(shi)界(jie)(jie),還得(de)看(kan)得(de)清楚、看(kan)得(de)懂。

看得(de)見和看得(de)清楚,在現場(chang)這樣的(de)光照下是挑戰相對比較(jiao)低的(de)場(chang)景(jing)。但是如果需(xu)要一個智能設備在完全無人化地去解決(jue)它的(de)問題,在全天候、全場(chang)景(jing)地去做,這個問題就變得(de)非(fei)常復雜(za)。

機器人(ren)往(wang)往(wang)會被要求在人(ren)眼都(dou)睜不開的強(qiang)光(guang)下(xia)(xia),還能(neng)(neng)(neng)夠正常地(di)成(cheng)像(xiang);在很(hen)黑暗(an)的區域,比如(ru)(ru)黑燈工廠,它還要能(neng)(neng)(neng)正常成(cheng)像(xiang);還有在強(qiang)逆(ni)光(guang)下(xia)(xia),比如(ru)(ru)智能(neng)(neng)(neng)車很(hen)大(da)的挑戰就(jiu)是遠光(guang)燈打過來的時候,人(ren)都(dou)覺(jue)得晃眼,車也是一(yi)樣,所(suo)以這些(xie)設(she)備要在強(qiang)光(guang)下(xia)(xia)、弱光(guang)下(xia)(xia)、逆(ni)光(guang)下(xia)(xia)都(dou)能(neng)(neng)(neng)正常成(cheng)像(xiang),看得見(jian)這些(xie)該被看見(jian)的東(dong)西,這些(xie)是非常重要的基礎。

因此,成像對智能(neng)設備(bei)能(neng)看懂世界非常重(zhong)要,它首先得(de)看得(de)見、看得(de)清楚世界。

這(zhe)是(shi)我(wo)們肇觀電(dian)子(zi)從(cong)成(cheng)(cheng)立到現在(zai)(zai),一直在(zai)(zai)孜孜不倦解決的方向(xiang)(xiang)。成(cheng)(cheng)像這(zhe)個方向(xiang)(xiang)可以(yi)做(zuo)50年(nian)、100年(nian),是(shi)非常浩(hao)瀚(han)和非常長的領域(yu)。我(wo)們取得了一些階段性成(cheng)(cheng)果,但還是(shi)在(zai)(zai)持之以(yi)恒地繼續(xu)做(zuo)。

肇觀電子馮歆鵬:五大技術讓機器人看懂世界,AI視覺芯片實現顛覆式創新丨GACS 2023

另外一個很重要的對于機器人的基礎能力就是3D感知,機(ji)(ji)器(qi)(qi)(qi)人如(ru)果固(gu)定在那(nei)里,不(bu)(bu)跟周(zhou)圍環(huan)境交互(hu),這個問(wen)(wen)題(ti)(ti)相對好一些,但一旦機(ji)(ji)器(qi)(qi)(qi)人動起來,就(jiu)涉(she)及到(dao)跟環(huan)境中(zhong)的(de)(de)物體如(ru)何(he)互(hu)動的(de)(de)問(wen)(wen)題(ti)(ti),那(nei)么機(ji)(ji)器(qi)(qi)(qi)人不(bu)(bu)能(neng)撞到(dao)人、不(bu)(bu)能(neng)撞到(dao)寵物、不(bu)(bu)能(neng)撞到(dao)機(ji)(ji)器(qi)(qi)(qi)人,所以(yi)遇到(dao)這些問(wen)(wen)題(ti)(ti)的(de)(de)時候,機(ji)(ji)器(qi)(qi)(qi)人要移動。

像慢速(su)的(de)機器人,大(da)概(gai)每(mei)秒鐘移動0.2米到1米;如果(guo)像人的(de)步速(su)機器人,大(da)概(gai)每(mei)秒鐘是1.5到2.5米的(de)速(su)度(du)(du);如果(guo)是兩輪車或者(zhe)四輪車,速(su)度(du)(du)越來越快(kuai);還有像飛機這(zhe)樣更加高速(su)移動的(de)設備,這(zhe)些設備但(dan)凡要(yao)移動起來,就會跟周圍(wei)的(de)空(kong)間(jian)環境帶來一(yi)些關(guan)聯。

對于周(zhou)圍(wei)做正確的(de)3D感(gan)知(zhi)是每一(yi)個(ge)自主設(she)備(bei),每一(yi)個(ge)要在空間中移動的(de)設(she)備(bei)的(de)核(he)(he)心基礎能(neng)(neng)力(li)。3D感(gan)知(zhi)是機器人(ren)讓它變得(de)更智能(neng)(neng)的(de)核(he)(he)心能(neng)(neng)力(li),這也是肇觀(guan)電子在芯(xin)片上(shang)做了一(yi)系列的(de)事情(qing),使得(de)這些機器人(ren)的(de)應用能(neng)(neng)夠更好地感(gan)知(zhi)周(zhou)圍(wei)的(de)環(huan)境。

AI是機(ji)器(qi)人(ren)的另一(yi)(yi)大方面(mian),剛才(cai)很多嘉賓分(fen)享了在AI方面(mian)諸(zhu)多的成績。AI對(dui)于機(ji)器(qi)人(ren),當它(ta)能(neng)夠正確識別什(shen)(shen)么是地板、什(shen)(shen)么是墻壁、什(shen)(shen)么是天花板,其實這都是很有挑戰的事(shi)情。大部(bu)分(fen)情況(kuang)下(xia)(xia),人(ren)一(yi)(yi)看就知(zhi)道這是地板,但對(dui)機(ji)器(qi)人(ren)而(er)言(yan),要嚴(yan)格意義上讓(rang)它(ta)99.99%的情況(kuang)下(xia)(xia)知(zhi)道是地面(mian)還是桌面(mian),要加以區分(fen),是非常困難(nan)的一(yi)(yi)件事(shi)情。

所(suo)以AI解決的(de)(de)就是(shi)這樣的(de)(de)問題,桌子(zi)(zi)、椅子(zi)(zi)、茶杯是(shi)不一樣的(de)(de)物體(ti)(ti),如(ru)(ru)何做語義分割,如(ru)(ru)何在高速移動物體(ti)(ti)情(qing)況下(xia)還能(neng)正(zheng)確識別,這是(shi)非常重要(yao)的(de)(de)事情(qing)。AI的(de)(de)處(chu)理能(neng)力對機(ji)器人也是(shi)一個基礎能(neng)力。

VSLAM,也就(jiu)是Visual Simultaneous Localization And Mapping,實時(shi)定位和構圖技術(shu)對機器人也非(fei)常重要,對于空間的復刻,數字化(hua)整個環境,顯示定位自身(shen),把周(zhou)圍地圖都畫出(chu)來(lai),是智(zhi)能設備、智(zhi)能生物的基礎能力。

SoC,當我們(men)解決了諸(zhu)多的這些問題之(zhi)后,我們(men)需要(yao)考慮(lv)到一個(ge)工程化系(xi)(xi)統層(ceng)面(mian)可(ke)(ke)(ke)執行、可(ke)(ke)(ke)落地、可(ke)(ke)(ke)商用(yong)(yong)(yong),能夠(gou)切實給我們(men)下(xia)游帶來好處,形(xing)成價(jia)值鏈閉(bi)環的載體(ti),就(jiu)是SoC,片(pian)(pian)(pian)上(shang)系(xi)(xi)統。一個(ge)完整(zheng)的芯(xin)片(pian)(pian)(pian)必須具有諸(zhu)多的功能,這樣使得(de)我們(men)不用(yong)(yong)(yong)在(zai)電路板上(shang)用(yong)(yong)(yong)多個(ge)芯(xin)片(pian)(pian)(pian)搭出來一個(ge)系(xi)(xi)統,而是直接在(zai)一個(ge)板子上(shang)用(yong)(yong)(yong)一顆芯(xin)片(pian)(pian)(pian),一顆芯(xin)片(pian)(pian)(pian)解決所有問題,這樣才能做到高性能、低功耗(hao)、低成本、低系(xi)(xi)統復雜度,有諸(zhu)多好處。

可以看(kan)到(dao)(dao),解(jie)決(jue)(jue)這(zhe)(zhe)些(xie)機器(qi)人看(kan)懂世(shi)界是我(wo)們(men)(men)的目標(biao),我(wo)們(men)(men)要解(jie)決(jue)(jue)的事情,要在成像、3D、AI、VSLAM、SoC解(jie)決(jue)(jue)這(zhe)(zhe)五(wu)個問(wen)(wen)題(ti),這(zhe)(zhe)五(wu)個問(wen)(wen)題(ti)也是肇觀(guan)電(dian)子從成立到(dao)(dao)現在一直在積累的能力。

二、攝像頭正在從2D向3D躍遷,VPU市場與GPU市場相當

機(ji)器人(ren)的(de)(de)發展在這(zhe)幾(ji)年(nian)非常快速,我們也切實地看到了(le)在一些(xie)比(bi)較(jiao)艱苦的(de)(de)工作環(huan)境下(xia),高溫下(xia)、低(di)溫下(xia),在比(bi)較(jiao)惡(e)劣的(de)(de)環(huan)境下(xia),以及枯燥(zao)的(de)(de)、繁(fan)重(zhong)的(de)(de)這(zhe)些(xie)勞動(dong)下(xia),機(ji)器人(ren)換人(ren)的(de)(de)比(bi)例在非常快速地上升,機(ji)器人(ren)的(de)(de)滲透(tou)率不斷(duan)地走高。

機(ji)(ji)器(qi)人(ren)(ren)有很多種(zhong)機(ji)(ji)器(qi)人(ren)(ren),有工業機(ji)(ji)器(qi)人(ren)(ren)、服務機(ji)(ji)器(qi)人(ren)(ren)、人(ren)(ren)形機(ji)(ji)器(qi)人(ren)(ren)、特種(zhong)機(ji)(ji)器(qi)人(ren)(ren)、無人(ren)(ren)機(ji)(ji)等各種(zhong)移(yi)動物體,如(ru)果速(su)度再(zai)快一些(xie)(xie)(xie),可能(neng)四個輪子的汽車也是一種(zhong)機(ji)(ji)器(qi)人(ren)(ren)。這(zhe)些(xie)(xie)(xie)設備(bei)在不知不覺地快速(su)發展,而且(qie)這(zhe)些(xie)(xie)(xie)設備(bei)上面都需要越(yue)來越(yue)強大的視覺能(neng)力,能(neng)夠看懂周圍(wei)。

很多(duo)機器人(ren)它(ta)不像人(ren),咱們(men)人(ren)只(zhi)要(yao)(yao)往前看就(jiu)可以了,很多(duo)機器人(ren)比(bi)人(ren)更先(xian)進,它(ta)需(xu)要(yao)(yao)四(si)面八方都要(yao)(yao)看,所以它(ta)的身上要(yao)(yao)裝很多(duo)眼(yan)睛,這也(ye)是我(wo)們(men)在幫助(zhu)我(wo)們(men)的下游做(zuo)的事情。

視(shi)覺的前身(shen)是圖像處(chu)理,發展了(le)(le)很(hen)多(duo)年,正在面臨比較大的變革,就是從(cong)2D往3D在發展。我們知道蘋果在消費端發布了(le)(le)Vision Pro,在內容生產上做了(le)(le)一(yi)(yi)些事情。世界是3D的,無論現在手(shou)機(ji)也好,各種照相設備也好,都(dou)是2D成像,它(ta)帶來了(le)(le)一(yi)(yi)維(wei)信(xin)息的損失(shi),這個損失(shi)其實(shi)是非常可(ke)惜的以(yi)及非常重要的,因為那一(yi)(yi)維(wei)信(xin)息很(hen)重要,所以(yi)往前走,大家所有的采集信(xin)息拍照設備一(yi)(yi)定會變成3D。

肇觀電子馮歆鵬:五大技術讓機器人看懂世界,AI視覺芯片實現顛覆式創新丨GACS 2023

我們知(zhi)道(dao)從(cong)量(liang)的(de)角度來講,現在全球(qiu)每年大概(gai)15億只手機,大概(gai)9000萬輛(liang)車,每個車上有十幾個攝像(xiang)頭,有很多的(de)家電,所(suo)有這些上面的(de)傳(chuan)感器(qi)、攝像(xiang)頭將來都要從(cong)2D往(wang)3D躍遷,所(suo)以我們現在面臨比較大的(de)技術變(bian)革。

我們做的(de)VPU,跟(gen)GPU比(bi)(bi)較相(xiang)(xiang)(xiang)似的(de)名(ming)字定義,GPU大(da)家已經非(fei)常(chang)熟(shu)悉了,GPU的(de)學科基礎是(shi)計(ji)算(suan)機圖形(xing)學,VPU的(de)學科基礎就(jiu)是(shi)計(ji)算(suan)機視(shi)覺,計(ji)算(suan)機視(shi)覺跟(gen)計(ji)算(suan)機圖形(xing)學這(zhe)兩個(ge)學科是(shi)完全相(xiang)(xiang)(xiang)逆的(de),VPU干的(de)事是(shi)更接近(jin)人的(de)智能的(de)本質,它是(shi)讓設(she)備看懂世(shi)界(jie)(jie),看懂世(shi)界(jie)(jie)之(zhi)(zhi)后這(zhe)個(ge)設(she)備就(jiu)具有了相(xiang)(xiang)(xiang)當(dang)程度(du)的(de)智能,我們都說解(jie)決AI問(wen)題(ti)(ti)一半的(de)問(wen)題(ti)(ti)在(zai)于視(shi)覺,所以解(jie)決視(shi)覺問(wen)題(ti)(ti)也解(jie)決了相(xiang)(xiang)(xiang)當(dang)程度(du)的(de)人工智能問(wen)題(ti)(ti)。所以VPU的(de)市(shi)場非(fei)常(chang)之(zhi)(zhi)廣闊,GPU市(shi)場大(da)家都知道很大(da),VPU其實不(bu)比(bi)(bi)GPU小(xiao)。

肇觀電子馮歆鵬:五大技術讓機器人看懂世界,AI視覺芯片實現顛覆式創新丨GACS 2023

這(zhe)是我(wo)們做(zuo)的(de)階(jie)段性成(cheng)像(xiang)成(cheng)果,我(wo)們在暗光(guang)(guang)、逆光(guang)(guang)、強光(guang)(guang)下做(zuo)一(yi)些事情(qing),這(zhe)些成(cheng)像(xiang)是永無止境的(de)事情(qing),我(wo)們調整了很多傳感器(qi)(qi),和各類傳感器(qi)(qi)廠商的(de)關系也非(fei)常(chang)好,大家互相(xiang)扶持,也幫(bang)助前面(mian)的(de)透鏡、中間的(de)光(guang)(guang)電轉(zhuan)換(huan)以及SoC,這(zhe)大家在成(cheng)像(xiang)系統(tong)里面(mian)屬于三(san)個重(zhong)要的(de)部分。我(wo)們互相(xiang)扶持幫(bang)助彼此解決對(dui)方(fang)的(de)問題,形成(cheng)一(yi)個非(fei)常(chang)好的(de)成(cheng)像(xiang)系統(tong)。

成(cheng)像系統可以(yi)說(shuo)永(yong)無止境,不同(tong)的客(ke)戶(hu)有不同(tong)的需求(qiu),而且不同(tong)客(ke)戶(hu)要(yao)求(qiu)也越來(lai)越高,所(suo)以(yi)在這個領域(yu)我(wo)們(men)做了(le)非(fei)常多的事情(qing)。

在實際(ji)落地中有各(ge)種(zhong)(zhong)各(ge)樣奇奇怪怪的(de)(de)(de)問(wen)(wen)題(ti),透鏡有透鏡的(de)(de)(de)問(wen)(wen)題(ti),現場又有特別奇怪的(de)(de)(de)光照情(qing)況,在這里面這些問(wen)(wen)題(ti)都需要(yao)加以解決(jue),肇觀電子在過去(qu)一段時間幫助各(ge)種(zhong)(zhong)客戶解決(jue)他(ta)們(men)實際(ji)的(de)(de)(de)問(wen)(wen)題(ti)。

這(zhe)是(shi)(shi)我們(men)正在做(zuo)的(de)一些3D技術,無論是(shi)(shi)在純(chun)室外(wai)、室內外(wai)切換的(de)場景(jing)還是(shi)(shi)純(chun)室內場景(jing),我們(men)做(zuo)了系列3D的(de)技術,這(zhe)都是(shi)(shi)用芯片(pian)來去(qu)做(zuo)一些計算。在室外(wai),比如像車(che),以及像各種(zhong)室外(wai)工(gong)作的(de)機器人,都需(xu)要(yao)我們(men)這(zhe)樣的(de)技術,來解決3D感知的(de)問(wen)題(ti),使(shi)得(de)機器人能(neng)避開(kai)障(zhang)礙,知道(dao)自己在哪(na)里,能(neng)獲得(de)這(zhe)些重要(yao)的(de)信息(xi)。

肇觀電子馮歆鵬:五大技術讓機器人看懂世界,AI視覺芯片實現顛覆式創新丨GACS 2023

這是我們(men)基(ji)于芯(xin)片做的(de)(de)一(yi)個(ge)VSLAM的(de)(de)案例,我們(men)的(de)(de)一(yi)位員(yuan)工拿著智能3D深度相(xiang)機在(zai)空間中移動(dong),紅色的(de)(de)線是相(xiang)機移動(dong)的(de)(de)軌跡,通過這些掃(sao)旁邊的(de)(de)一(yi)張(zhang)桌子,把它掃(sao)描(miao)出(chu)來(lai),這是實時掃(sao)描(miao)的(de)(de)結果,我們(men)在(zai)芯(xin)片上做了很(hen)多特征點的(de)(de)加(jia)速(su)(su),各種(zhong)濾波(bo)的(de)(de)加(jia)速(su)(su),在(zai)上面做很(hen)多VSLAM硬(ying)件的(de)(de)底層硬(ying)件加(jia)速(su)(su)的(de)(de)事情,使得(de)離(li)線在(zai)端側(ce)實時做三維(wei)重建成為可能。

很(hen)多應用對實時性要(yao)求非常(chang)高,一個機(ji)器(qi)人,我們不(bu)希(xi)望它像恐龍(long)一樣,看(kan)到(dao)的東西等它反應過(guo)來(lai)已經是(shi)(shi)1秒(miao)(miao)之(zhi)后了,這是(shi)(shi)不(bu)行的,很(hen)多機(ji)器(qi)人希(xi)望0.1秒(miao)(miao),也就(jiu)是(shi)(shi)100毫秒(miao)(miao)就(jiu)要(yao)反應過(guo)來(lai);這就(jiu)涉及(ji)(ji)到(dao)感知(zhi),從(cong)光子打到(dao)傳(chuan)(chuan)感器(qi)到(dao)它全部處理完然后作出反應,100毫秒(miao)(miao)內(nei)要(yao)解決問題。所以很(hen)多時候(hou),端側(ce)的處理能(neng)力(li)非常(chang)重(zhong)要(yao),因為(wei)有(you)些時候(hou)是(shi)(shi)來(lai)不(bu)及(ji)(ji)往(wang)云(yun)端傳(chuan)(chuan)輸數據,解決完再傳(chuan)(chuan)回來(lai)。當然云(yun)端也非常(chang)重(zhong)要(yao),所以云(yun)和端都是(shi)(shi)在很(hen)繁(fan)榮地往(wang)前發展(zhan)。

AI大家(jia)比(bi)較熟(shu)悉了(le)(le),這些都是具體(ti)的落地應(ying)用,肇觀服務了(le)(le)非常多(duo)的各種(zhong)各樣的客(ke)戶,解決客(ke)戶的問題。

三、一款汽車多個部位用到VPU芯片,VPU做機器人的眼睛

我(wo)(wo)們的芯片被(bei)用在(zai)了汽車上(shang),用在(zai)車的三個鏡子(zi)上(shang),車內(nei)后視(shi)鏡以(yi)及(ji)(ji)車的兩個外后視(shi)鏡上(shang),以(yi)及(ji)(ji)被(bei)用在(zai)車的攝像頭里(li)面,以(yi)及(ji)(ji)被(bei)用來做(zuo)ADAS比如LDW(車道預警)、交通標(biao)志(zhi)輔助識(shi)別、駕駛(shi)員疲勞監測(ce)、乘客(ke)監測(ce)、DVR,做(zuo)BSD盲區(qu)檢測(ce)等等。在(zai)車載領(ling)域,我(wo)(wo)們是(shi)車規、國產、高畫質、低延時(shi),性能還(huan)不錯。大家(jia)如果(guo)對車載芯片有需求,我(wo)(wo)們是(shi)比較好(hao)的選擇之一。

一個具體的(de)應用案例是一個電子后視鏡,在下雨的(de)時候,畫質非(fei)常清晰。在黑暗(an)的(de)場景,通(tong)過屏幕看(kan),電子后視鏡仍然很清晰。

四、基于肇觀自研芯片打造費曼系列智能深度相機,更進一步服務下游客戶

我平(ping)常(chang)隨身也帶(dai)著(zhu)芯(xin)片(pian),放在一個小盒子里,給(gei)大家展示一下(xia);做芯(xin)片(pian)就是(shi)有(you)這(zhe)個好處,產品(pin)非常(chang)小,可以隨身攜帶(dai)。

我們基于自(zi)己芯片的(de)(de)電路板做了智(zhi)能深度(du)相機(ji),這(zhe)就是(shi)機(ji)器(qi)(qi)人(ren)(ren)(ren)(ren)的(de)(de)眼睛,我隨身帶的(de)(de)一(yi)個(ge)機(ji)器(qi)(qi)人(ren)(ren)(ren)(ren)的(de)(de)眼睛。工(gong)業機(ji)器(qi)(qi)人(ren)(ren)(ren)(ren)、服(fu)務機(ji)器(qi)(qi)人(ren)(ren)(ren)(ren)、人(ren)(ren)(ren)(ren)形機(ji)器(qi)(qi)人(ren)(ren)(ren)(ren)、特種機(ji)器(qi)(qi)人(ren)(ren)(ren)(ren)、無人(ren)(ren)(ren)(ren)機(ji)器(qi)(qi)人(ren)(ren)(ren)(ren)等各(ge)種各(ge)樣的(de)(de)機(ji)器(qi)(qi)人(ren)(ren)(ren)(ren),都需要(yao)這(zhe)樣的(de)(de)眼睛。這(zhe)個(ge)眼睛解決的(de)(de)問題是(shi)幫助機(ji)器(qi)(qi)人(ren)(ren)(ren)(ren)3D感知,AI識別全在里(li)面做了,成像,以及輸出(chu)碼流。

所以,一個小的模組(zu),像(xiang)口香糖一樣大的模組(zu),就解決了(le)機器(qi)人眼睛(jing)所有的問題(ti)。

我們花了很多(duo)力(li)氣在(zai)做(zuo)這(zhe)個產品(pin),來(lai)解決(jue)客(ke)戶(hu)的(de)問題。舉例來(lai)講,很多(duo)很嚴苛的(de)客(ke)戶(hu),要(yao)求我們把眼睛(jing)要(yao)做(zuo)到世(shi)界第(di)一;在(zai)沒(mei)有我們的(de)時(shi)候,是有一家(jia)海外(wai)的(de)巨(ju)(ju)頭(tou)(tou)來(lai)提供(gong)類似(si)的(de)模(mo)組(zu)。有了我們之后,我們被客(ke)戶(hu)要(yao)求替代掉海外(wai)巨(ju)(ju)頭(tou)(tou),被要(yao)求在(zai)很多(duo)的(de)技術點上(shang)要(yao)磨到世(shi)界第(di)一。

舉(ju)一(yi)(yi)個(ge)很簡單的(de)例子,像這(zhe)(zhe)樣的(de)模組,它的(de)連(lian)(lian)接(jie)是(shi)USB3.0的(de)連(lian)(lian)接(jie),大(da)家可(ke)(ke)能有(you)(you)些(xie)人比較熟悉,就是(shi)一(yi)(yi)根線,拖(tuo)出來(lai)插到電腦上充電也好,數據傳輸也好,都可(ke)(ke)以用。從(cong)技術角度而言,USB協議其實不(bu)是(shi)一(yi)(yi)個(ge)特別穩定可(ke)(ke)靠(kao)的(de)協議。大(da)家如(ru)果關(guan)注這(zhe)(zhe)一(yi)(yi)點(dian),在工業這(zhe)(zhe)種場景(jing)下,不(bu)穩定可(ke)(ke)靠(kao)是(shi)致(zhi)命的(de),如(ru)果通過USB連(lian)(lian)接(jie),把(ba)這(zhe)(zhe)個(ge)數據穩定傳出來(lai),我們(men)的(de)客戶要(yao)求(qiu)我們(men)10萬小時的(de)連(lian)(lian)接(jie)不(bu)能中(zhong)斷(duan)一(yi)(yi)次,這(zhe)(zhe)就要(yao)求(qiu)非常高了。所以為了達(da)到這(zhe)(zhe)樣的(de)目標,就是(shi)海外(wai)巨(ju)頭都做不(bu)到這(zhe)(zhe)一(yi)(yi)點(dian),因為它有(you)(you)一(yi)(yi)些(xie)天生的(de)不(bu)足導致(zhi)的(de)問(wen)題。

肇觀電子馮歆鵬:五大技術讓機器人看懂世界,AI視覺芯片實現顛覆式創新丨GACS 2023

為了達到這個10萬小時一(yi)次連接都不(bu)斷(duan),我們被迫要(yao)去(qu)在(zai)(zai)(zai)芯片級、在(zai)(zai)(zai)所有的(de)(de)(de)底(di)層(ceng)驅動(dong)都重(zhong)新寫(xie)一(yi)遍,在(zai)(zai)(zai)跟(gen)它(ta)連接的(de)(de)(de)另外一(yi)端(duan)的(de)(de)(de)軟(ruan)件(jian)也(ye)要(yao)重(zhong)新寫(xie)一(yi)遍,所以(yi)全部的(de)(de)(de)硬件(jian)軟(ruan)件(jian)都要(yao)重(zhong)新做,所以(yi)才能做到10萬小時不(bu)斷(duan)連接的(de)(de)(de)場景(jing),這只是客戶的(de)(de)(de)諸多非常細的(de)(de)(de)要(yao)求之一(yi)。

在這(zhe)個(ge)過(guo)程中(zhong),我(wo)們(men)能(neng)夠提供給(gei)客(ke)戶(hu)穩定的(de)(de)(de)、可靠(kao)的(de)(de)(de)、智(zhi)能(neng)的(de)(de)(de)、3D的(de)(de)(de)深度的(de)(de)(de)相機(ji),適(shi)用于各(ge)種極限場景,比(bi)(bi)如(ru)說我(wo)們(men)有(you)冷庫機(ji)器人(ren)的(de)(de)(de)客(ke)戶(hu),它的(de)(de)(de)機(ji)器人(ren)常年在零下(xia)18度搬海鮮(xian)的(de)(de)(de)客(ke)戶(hu),它的(de)(de)(de)眼睛就需(xu)要在零下(xia)18度每(mei)次都能(neng)正常啟動,完(wan)成它的(de)(de)(de)任務,然后再關機(ji)。但是比(bi)(bi)如(ru)海外巨頭的(de)(de)(de)產品在零下(xia)18度開(kai)機(ji)都開(kai)不出來,我(wo)們(men)被要求(qiu)(qiu)在如(ru)此低溫下(xia)能(neng)正常工(gong)作(zuo)。我(wo)們(men)也被要求(qiu)(qiu)在非(fei)常高溫下(xia)要能(neng)正常工(gong)作(zuo),所(suo)以這(zhe)里面(mian)有(you)非(fei)常多的(de)(de)(de)客(ke)戶(hu)需(xu)求(qiu)(qiu)。

所以我(wo)們(men)在跟諸(zhu)多(duo)客(ke)戶(hu)在過去很多(duo)年一直在打磨,我(wo)們(men)積(ji)累了非常(chang)多(duo)解決(jue)方(fang)案,這些(xie)解決(jue)方(fang)案反過來幫助(zhu)了肇觀(guan)如何能夠設計出(chu)更(geng)好的芯(xin)片(pian)和(he)模組來切實解決(jue)客(ke)戶(hu)的問題,這是非常(chang)重(zhong)要的。

在這(zhe)個過程中,我們也(ye)深刻理(li)解(jie)(jie)了客(ke)(ke)戶(hu)(hu)的(de)(de)使用場景,客(ke)(ke)戶(hu)(hu)面對(dui)的(de)(de)各種(zhong)問題(ti)。因為(wei)這(zhe)些模(mo)組主要賣給這(zhe)些toB的(de)(de)客(ke)(ke)戶(hu)(hu)。我們作(zuo)為(wei)一個核心元器件(jian)廠(chang)商(shang),如(ru)何幫助他們解(jie)(jie)決問題(ti),在這(zhe)里(li)面肇觀也(ye)收獲(huo)了很多(duo)寶貴的(de)(de)經驗。

五、支持荷蘭語德語等各種語言,OCR識別正確率全球領先

肇觀電子馮歆鵬:五大技術讓機器人看懂世界,AI視覺芯片實現顛覆式創新丨GACS 2023

肇觀電子馮歆鵬:五大技術讓機器人看懂世界,AI視覺芯片實現顛覆式創新丨GACS 2023

肇觀(guan)也(ye)應一類客戶要求,在OCR的領域做(zuo)(zuo)了很多(duo)事情。不謙虛地講,在自然(ran)光照條件下各種復雜(za)文(wen)本的采集(ji)分(fen)析方面(mian),我們在這個領域,在全球范圍(wei)內做(zuo)(zuo)得算是(shi)比較領先。

舉例子(zi)來講,比如彎(wan)曲(qu)的各種(zhong)文(wen)字(zi)(zi)、不同(tong)的背景下,我們(men)(men)文(wen)字(zi)(zi)的采(cai)集、文(wen)字(zi)(zi)識別和處理做(zuo)得比較領(ling)先。比如說,右下角(jiao)這是一個日本的報(bao)紙(zhi),日文(wen)報(bao)紙(zhi)有(you)豎(shu)排、橫排混在一起,我們(men)(men)就被客戶要求把它完(wan)全(quan)正確處理出(chu)來,而且(qie)把順序排好,要能(neng)夠語(yu)義(yi)能(neng)夠理解出(chu)來。所以在OCR領(ling)域(yu),我們(men)(men)做(zuo)了很多(duo)事情,現在已(yi)經支持十幾種(zhong)不同(tong)國(guo)家(jia)的語(yu)言(yan)了,在這個領(ling)域(yu)算法做(zuo)得比較領(ling)先。

這是(shi)我(wo)們(men)(men)OCR的(de)(de)具體(ti)例子,我(wo)們(men)(men)的(de)(de)識(shi)別準確(que)率,我(wo)們(men)(men)支(zhi)(zhi)持中文(wen)(wen)、英文(wen)(wen)、日(ri)文(wen)(wen)、韓(han)文(wen)(wen)、阿拉伯語(yu)(yu)、西班(ban)牙(ya)(ya)語(yu)(yu)、葡萄牙(ya)(ya)語(yu)(yu)、法文(wen)(wen)、德文(wen)(wen)、荷(he)蘭語(yu)(yu)等(deng)各(ge)國語(yu)(yu)言,我(wo)們(men)(men)支(zhi)(zhi)持各(ge)國語(yu)(yu)言的(de)(de)OCR,我(wo)們(men)(men)在這方面(mian)(mian)做得算是(shi)世界領(ling)先之(zhi)一,我(wo)們(men)(men)不僅做逐字的(de)(de)識(shi)別,在表格的(de)(de)識(shi)別,還在各(ge)種時尚雜志、繪本等(deng)復雜頁面(mian)(mian)里(li)面(mian)(mian),能(neng)把該提取(qu)的(de)(de)東西提取(qu)出來,不該提取(qu)的(de)(de)不提取(qu),在這里(li)面(mian)(mian)我(wo)們(men)(men)做了非常多的(de)(de)事(shi)情。

大家(jia)如果(guo)誰對OCR的算(suan)法或者技術有(you)需求,也(ye)歡(huan)迎聯系我,聯系肇觀電子,我們都很樂(le)意在客戶(hu)的產品中貢(gong)獻一點(dian)力(li)量(liang)。

肇觀一直致力于(yu)用AI視覺(jue)芯(xin)片來(lai)幫助(zhu)所(suo)有的(de)智能設(she)(she)備看懂世界,來(lai)做這樣一件(jian)事情,這個事情對我(wo)(wo)們(men)(men)而言意義非(fei)常(chang)重大(da),對這些智能設(she)(she)備而言也非(fei)常(chang)重要,所(suo)以(yi)在這個領域,我(wo)(wo)們(men)(men)一直在深耕我(wo)(wo)們(men)(men)的(de)芯(xin)片,深耕我(wo)(wo)們(men)(men)的(de)核心能力,更好地幫助(zhu)到客戶(hu)。今天我(wo)(wo)的(de)分享就(jiu)到這里(li),感謝大(da)家!

以上是馮歆鵬演講內容的完整整理。