首頁(yè)|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 技術(shù) >> 正文

Adlik亮相國(guó)際電聯(lián)峰會(huì),推動(dòng)AI觸手可及

2021年11月3日 09:29  CCTIME飛象網(wǎng)  

近日,由國(guó)際電信聯(lián)盟(ITU)主辦、中興通訊聯(lián)合鵬程實(shí)驗(yàn)室、Linux基金會(huì)等單位承辦的AI for Good峰會(huì)第二場(chǎng)線上研討會(huì)成功舉辦。本次研討會(huì)的主題是“開(kāi)源,加速人工智能技術(shù)創(chuàng)新”,國(guó)內(nèi)外多位AI開(kāi)源領(lǐng)域的專家和大家分享了各種由開(kāi)源推動(dòng)的AI最佳實(shí)踐,包括來(lái)自Linux基金會(huì)人工智能和數(shù)據(jù)基金會(huì)(LF AI & Data)的執(zhí)行董事Ibrahim Haddad、前TAC主席Jim Spohrer,以及來(lái)自O(shè)penI、PaddlePaddle、柴火創(chuàng)客、OpenVINO、Milvus等多個(gè)AI開(kāi)源社區(qū)的代表。中興通訊高級(jí)開(kāi)源工程師、Adlik開(kāi)源項(xiàng)目的TSC主席袁麗雅發(fā)表了題為《Adlik,讓人工智能觸手可及》的演講。

【Adlik背景】

Adlik是中興通訊在LF AI & Data牽頭發(fā)起的一項(xiàng)開(kāi)源項(xiàng)目,旨在解決在深度學(xué)習(xí)模型落地過(guò)程中的挑戰(zhàn)性問(wèn)題,實(shí)現(xiàn)深度學(xué)習(xí)模型在特定硬件環(huán)境的部署、做到高效推理。袁麗雅提到,在這個(gè)過(guò)程中,模型訓(xùn)練只是第一步,如何根據(jù)應(yīng)用場(chǎng)景確定硬件部署環(huán)境、如何確定各種不同環(huán)境下的模型部署和推理方案、如何完成復(fù)雜的調(diào)優(yōu)工作以滿足性能需求,每一個(gè)步驟對(duì)于模型的實(shí)際應(yīng)用都至關(guān)重要。Adlik項(xiàng)目的誕生正是為了掃除這整個(gè)流程中的絆腳石。

Adlik作為一個(gè)深度學(xué)習(xí)推理工具鏈項(xiàng)目,可以為深度學(xué)習(xí)模型提供從訓(xùn)練完成,到部署到特定硬件并提供應(yīng)用服務(wù)的端到端支持,其應(yīng)用目的就是為了將模型從研發(fā)狀態(tài)快速部署到生產(chǎn)應(yīng)用環(huán)境。Adlik可以和多種推理引擎協(xié)作,支持多款硬件,提供統(tǒng)一對(duì)外推理接口,并提供多種靈活的部署方案,以及工程化的自適應(yīng)參數(shù)優(yōu)化方案,為用戶提供快速、高性能的應(yīng)用服務(wù)提供助力。

【Adlik架構(gòu)】

Adlik在架構(gòu)上,可以分為模型優(yōu)化器模塊(Optimizer),模型編譯器模塊(Compiler)和推理引擎模塊(Inference Engine)。在模型訓(xùn)練完畢、應(yīng)用場(chǎng)景確定之后,用戶即可通過(guò)Adlik 模型優(yōu)化器處理,生產(chǎn)優(yōu)化后的模型,然后通過(guò)模型編譯模塊,完成模型格式轉(zhuǎn)換,生成最終推理引擎支持的模型格式,最終完成在云邊端等多種環(huán)境中的定制化部署,在最大化資源利用率的前提下,實(shí)現(xiàn)最佳的推理性能。​​

Adlik模型優(yōu)化器支持剪枝、量化、知識(shí)蒸餾等多種模型優(yōu)化、壓縮技術(shù),以ResNet-50為例,經(jīng)優(yōu)化器組合優(yōu)化后,在模型的準(zhǔn)確率基本不變的情況下,時(shí)延縮短為原來(lái)的1/4,計(jì)算量下降為原來(lái)的1/3,模型大小縮小為原來(lái)的1/12。

Adlik模型編譯器通過(guò)DAG圖的方式實(shí)現(xiàn)模型端到端的自動(dòng)最優(yōu)編譯,另外通過(guò)常量折疊、層融合、步長(zhǎng)優(yōu)化等技術(shù)減少計(jì)算量、內(nèi)存讀寫時(shí)間,進(jìn)一步提升推理速度。在最新的版本中,Adlik基于升級(jí)優(yōu)化的TVM自動(dòng)搜索,能大幅加快調(diào)度參數(shù)的搜索過(guò)程。

Adlik推理引擎為深度學(xué)習(xí)或機(jī)器學(xué)習(xí)模型自動(dòng)匹配加載插件式的推理運(yùn)行時(shí),實(shí)現(xiàn)模型的版本管理、運(yùn)行調(diào)度,為人工智能應(yīng)用提供滿足性能要求的推理服務(wù)。在x86 cpu硬件執(zhí)行DL模型推理的標(biāo)準(zhǔn)測(cè)試中,對(duì)標(biāo)原始模型提升最大10倍的推理性能。

【Adlik展望】

Adlik項(xiàng)目目前已經(jīng)發(fā)布了三個(gè)版本,已走進(jìn)深水區(qū),正在不斷探索更加自動(dòng)化的模型優(yōu)化部署技術(shù)。比如說(shuō)Adlik最近投入了對(duì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索的研究,近期將發(fā)布ZenNAS的加強(qiáng)版,基于原始阿里的ZenNAS框架做了一些優(yōu)化,能大大加速網(wǎng)絡(luò)搜索的過(guò)程。“這個(gè)工作將Adlik工作流的起點(diǎn)往前挪了一步,也使Adlik加速模型落地的步伐往前邁了一步”。袁麗雅表示。此外Adlik還會(huì)基于增強(qiáng)學(xué)習(xí)對(duì)模型編譯器中算子的調(diào)度流程進(jìn)一步優(yōu)化,實(shí)現(xiàn)基于設(shè)備特性的最佳調(diào)度。

“更廣泛的AI應(yīng)用場(chǎng)景、更簡(jiǎn)單的操作、更優(yōu)化的性能一直是Adlik技術(shù)演進(jìn)過(guò)程中的原則”。 最后,袁麗雅描述了Adlik的終極目標(biāo):“讓模型部署不再成為人工智能的應(yīng)用瓶頸,讓人工智能更觸手可及!

編 輯:霏雯
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張?jiān)泼鳎捍蟛糠謬?guó)家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動(dòng) 共筑信息保障堤壩
2023MWC上海世界移動(dòng)通信大會(huì)
中國(guó)5G商用四周年
2023年中國(guó)國(guó)際信息通信展覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像