飛象網(wǎng)訊(魏德齡/文)只要留心一下身邊,就能發(fā)現(xiàn)AI的無處不在。走進(jìn)商場(chǎng)中的咖啡面包店,店長的小電腦里不時(shí)便會(huì)收到AI做出的對(duì)于補(bǔ)貨、清潔的提示。走進(jìn)工廠生產(chǎn)線中的質(zhì)檢環(huán)節(jié),AI正在通過一雙慧眼對(duì)于商品是否存在瑕疵進(jìn)行掃描。
邊緣AI如同一名剛剛學(xué)會(huì)做應(yīng)用題的小學(xué)生,開始在不同的工作崗位上,依據(jù)自身的題庫,對(duì)一道道問題給出自己的解。然而,也如同每個(gè)人從小學(xué)到大學(xué)的歷程,邊緣AI也正在經(jīng)歷著成長的煩惱。
邊緣AI成長的煩惱
例如開篇提到的工廠生產(chǎn)線質(zhì)檢案例就面臨著訓(xùn)練樣本不足的問題。在做產(chǎn)品質(zhì)量檢測(cè)過程中,最有效的樣本正是帶有缺陷的樣本,但這類樣本在產(chǎn)線上出現(xiàn)的概率卻很小。如何在較少樣本的情況下實(shí)現(xiàn)有效訓(xùn)練,得到有效的模型更新,正是當(dāng)下面臨的挑戰(zhàn)之一。
數(shù)據(jù)保護(hù)在近期更是被很多人所關(guān)注,如何在保護(hù)隱私的情況下利用如聯(lián)邦學(xué)習(xí)這類新技術(shù)實(shí)現(xiàn)數(shù)據(jù)融合,再利用融合的數(shù)據(jù)實(shí)現(xiàn)模型的進(jìn)一步訓(xùn)練同樣是需要解決的問題。又比如當(dāng)數(shù)據(jù)處在運(yùn)行狀態(tài),暫時(shí)被存儲(chǔ)在內(nèi)存中時(shí),如何實(shí)現(xiàn)保護(hù),使其與其他應(yīng)用之間有一個(gè)安全邊界,也同樣是需要關(guān)注的問題。
在汽車領(lǐng)域,自動(dòng)駕駛對(duì)于模型的即時(shí)更新訴求正在愈發(fā)強(qiáng)烈。原因就在于汽車廠商此前利用大數(shù)據(jù)訓(xùn)練的模型與實(shí)際駕駛時(shí)所面對(duì)的路況存在差異,造成模型泛化能力有限。最有效的解決方法就是要讓邊緣AI對(duì)于模型擁有二次修正能力,可以不斷重新訓(xùn)練。
“以自動(dòng)駕駛為例,它所代表的正是邊緣人工智能發(fā)展的下一個(gè)趨勢(shì)——邊緣訓(xùn)練!庇⑻貭栔袊鴧^(qū)網(wǎng)絡(luò)與邊緣事業(yè)部首席技術(shù)官、英特爾高級(jí)首席 AI 工程師張宇博士在近期2023中國國際服務(wù)貿(mào)易交易會(huì)·中國智能產(chǎn)業(yè)論壇主題演講中表示。他認(rèn)為邊緣AI有三個(gè)發(fā)展階段:邊緣推理、邊緣訓(xùn)練、邊緣AutoML。
成長的三階段
邊緣AI的當(dāng)下正處于推理向訓(xùn)練邁進(jìn)的階段。張宇博士開玩笑地表示稱:“當(dāng)下的人工智能一半是人工,一半是智能!
原因在于如今的人工智能,無論是在邊緣側(cè)還是數(shù)據(jù)中心,人在人工智能中都扮演了一個(gè)非常重要的角色。盡管運(yùn)用了極大的算力與數(shù)據(jù)去訓(xùn)練一個(gè)網(wǎng)絡(luò)模型,但是模型結(jié)構(gòu)需要人為進(jìn)行預(yù)先設(shè)定。
第二階段邊緣訓(xùn)練也往往稱之為增量訓(xùn)練,即邊緣AI在已有訓(xùn)練集的基礎(chǔ)上,能夠通過新增樣本集實(shí)現(xiàn)增量訓(xùn)練。如同人類通過不同階段學(xué)校的學(xué)習(xí),以及大腦的成長,將不僅僅只是根據(jù)固有題庫來做題,還開始具備了舉一反三的能力,能夠在實(shí)踐的過程中,來實(shí)現(xiàn)能力提升。
當(dāng)下很多AI應(yīng)用,實(shí)際上都處在開放的狀態(tài),而非閉環(huán),也就是說在訓(xùn)練完模型以后用于推理,推理的結(jié)果并不能馬上就進(jìn)行反饋,對(duì)模型進(jìn)行二次更新。
這就意味著邊緣AI的最終目標(biāo)便是實(shí)現(xiàn)AutoML,該階段下網(wǎng)絡(luò)模型能夠感知人的意圖,選取適宜的樣本集訓(xùn)練模型,將訓(xùn)練結(jié)果推送到訓(xùn)練階段進(jìn)行相應(yīng)操作。如同進(jìn)入大學(xué)時(shí)代,學(xué)生將開始強(qiáng)調(diào)具備自主學(xué)習(xí)能力,為后續(xù)一生的探索打下重要基礎(chǔ),可以自主選擇課題,進(jìn)行資料查找,并撰寫論文。
“如果把攀登高峰比喻為人工智能不同階段的話,實(shí)現(xiàn)邊緣推理只是意味著站在山腳,能實(shí)現(xiàn)邊緣訓(xùn)練只是到達(dá)半山腰,站到山頂是真正實(shí)現(xiàn)AutoML的時(shí)刻!睆堄畈┦窟@樣形容。
如同攀登一座高峰,或許汽車領(lǐng)域目前展現(xiàn)出的需求似乎是走出一段山谷前所看到的鞍部曙光。技術(shù)的發(fā)展也正在給出邊緣AI演進(jìn)的暗示,張宇博士認(rèn)為共有三個(gè)關(guān)鍵要素,將推動(dòng)AI的成長。
助推“快樂”成長
三個(gè)重要因素分別是:算力、數(shù)據(jù)、人工智能技術(shù)。算力將能夠支撐越來越復(fù)雜的網(wǎng)絡(luò)模型,數(shù)據(jù)讓模型能夠得到一個(gè)可以使用的訓(xùn)練結(jié)果,包括人工智能理論在的關(guān)鍵技術(shù)則起到了底層支撐引導(dǎo)的作用。
“我覺得這三個(gè)因素應(yīng)該是相輔相成、缺一不可的,尤其是目標(biāo)達(dá)到第三個(gè)階段!睆堄畈┦吭诮邮懿稍L時(shí)表示。
盡管目前人工智能還主要依賴于1990年人工智能高潮時(shí)便使用的卷積運(yùn)算原理。但在算力和數(shù)據(jù)上已經(jīng)近年來突破不斷,助推了人工智能的發(fā)展。
例如從超算排名上看,當(dāng)1994年首次出現(xiàn)該榜單時(shí),每妙算力為1000多億次。今年最近一次排名中,人類的超算能力已經(jīng)達(dá)到了E級(jí),即每秒浮點(diǎn)運(yùn)算速度達(dá)到百億億次。和1994年相比,實(shí)現(xiàn)了百萬倍以上的算力提升。
邊緣側(cè)的算力同樣提升明顯,今年發(fā)布的第四代至強(qiáng)可擴(kuò)展處理器,包含了高級(jí)矩陣擴(kuò)展技術(shù)AMX,可直接對(duì)矩陣計(jì)算進(jìn)行加速,無需進(jìn)行項(xiàng)目拆解,無論是進(jìn)行人工智能推理還是訓(xùn)練,相比上代都實(shí)現(xiàn)了10倍的提升。
數(shù)據(jù)增加的背后則意味著人類在通訊和存儲(chǔ)能力上的提升。最直觀的變化正是存儲(chǔ)磁盤容量在快速提升,以及接口傳輸能力的突飛猛進(jìn)。
英特爾在今年推出的Gaudi 2處理器就是一個(gè)很好的例證,不僅能提供大量的算力,還同時(shí)提供通訊能力。在近期MLPerf公司針對(duì)業(yè)界主流大模型的評(píng)測(cè)中,Gaudi 2成為全球唯二能提供針對(duì)大模型訓(xùn)練極佳性能的產(chǎn)品。于此同時(shí),Gaudi 2還擁有21個(gè)10萬兆內(nèi)部互連以太網(wǎng)接口(ROCEv2 RDMA)、96GB HBM2E高帶寬內(nèi)存(總帶寬2.4TB/s)!皩(duì)于大模型的平臺(tái),它的能力要從計(jì)算、存儲(chǔ)和通訊能力進(jìn)行綜合考慮!睆堄畈┦糠Q。
英特爾除了在算力、數(shù)據(jù)上通過硬件性能的升級(jí),推動(dòng)邊緣AI快速成長外,還正在通過軟件的方式實(shí)現(xiàn)“快樂”成長。
例如OpenVINO能夠幫助開發(fā)人員實(shí)現(xiàn)邊緣AI的快速部署與適配。開發(fā)人員可以選用一些人工智能框架,在框架上利用自己的訓(xùn)練集設(shè)計(jì)網(wǎng)絡(luò)模型,最終形成一個(gè)模型的數(shù)據(jù)文件,該文件通過OpenVINO可以實(shí)現(xiàn)快速轉(zhuǎn)化,跟硬件進(jìn)行適配、部署。OpenVINO還包含模型開發(fā)器與推理引擎兩個(gè)關(guān)鍵組件,讓開發(fā)人員的應(yīng)用只需一次開發(fā),便能利用OpenVINO的適配能力在不同硬件平臺(tái)實(shí)現(xiàn)部署,極大降低軟件開發(fā)成本,進(jìn)一步減少邊緣AI的成長煩惱。
或許邊緣AI正像是一位剛剛在校園考出幾個(gè)不錯(cuò)成績(jī)的孩子,它有成長的煩惱,更有無限的可能,因?yàn)樗有很長的成長之路,令人充滿遐想的巔峰時(shí)刻。英特爾正牽起它的小手,一道邁出一步又一步。