首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|低空經(jīng)濟(jì)|智能汽車|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 飛象原創(chuàng) >> 正文

Deepseek蒸餾模型涌現(xiàn)的背后機(jī)遇,AI將成為新的UI

2025年3月4日 15:20  CCTIME飛象網(wǎng)  作 者:魏德齡

飛象原創(chuàng)(魏德齡/文)時(shí)至2025年,當(dāng)生成式AI已經(jīng)爆發(fā)兩年有余,本地AI模型的部署本已不是什么新鮮事。但隨著Deepseek R1的發(fā)布,除了線上被擠爆的服務(wù)器外,短短一周左右時(shí)間,論壇、博客、視頻站點(diǎn)上涌現(xiàn)出的各種新蒸餾模型與部署教程,吸引著很多普通用戶將一個(gè)容量僅幾個(gè)G的3B-13B不等參數(shù)量的小模型部署到本地設(shè)備中,成為在PC或手機(jī)中的新助手。

本地AI模型部署所呈現(xiàn)的“用腳投票”現(xiàn)象,背后則是硬實(shí)力的呈現(xiàn)。

蒸餾模型涌現(xiàn)的背后硬實(shí)力

蒸餾模型的涌現(xiàn)與小模型的實(shí)用性大大提升有關(guān),很多部署教程中,還會向觀眾進(jìn)行相關(guān)功能實(shí)用性的驗(yàn)證,例如文檔的閱讀總結(jié)、簡單編程、圖文內(nèi)容的分析等,來證明端側(cè)AI模型部署已經(jīng)不僅僅是極客們一時(shí)興起的玩物。

高通技術(shù)公司高級副總裁兼技術(shù)規(guī)劃和邊緣解決方案業(yè)務(wù)總經(jīng)理馬德嘉給出的這張PPT,做出了一個(gè)很好的例證,使用DeepSeek蒸餾后的Qwen-7B模型,已經(jīng)能夠在性能上與去年所推出的且當(dāng)時(shí)最為先進(jìn)的GPT-4o云端模型持平。但兩個(gè)模型的參數(shù)規(guī)模卻相差甚多。另對比蒸餾后的Llama 700億模型在推理、編程、數(shù)學(xué)、數(shù)據(jù)分析等方面表現(xiàn)來看,同樣已經(jīng)超越了原始模型,只在語言理解和指令遵循方面有待進(jìn)一步優(yōu)化。

根據(jù)《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》論文中的觀點(diǎn)顯示,通過蒸餾技術(shù)能夠使小模型也擁有大模型的推理能力,并且既高效又經(jīng)濟(jì)。實(shí)驗(yàn)結(jié)果表明,蒸餾后的小模型在多個(gè)基準(zhǔn)測試中表現(xiàn)出色。DeepSeek-R1-Distill-Qwen-7B在AIME 2024基準(zhǔn)測試中取得了55.5%的成績,超越了QwQ-32B-Preview。DeepSeek-R1-Distill-Qwen-32B同樣在多個(gè)測試中表現(xiàn)優(yōu)異,AIME 2024、MATH-500、LiveCodeBench的測試結(jié)果超越了以往開源模型,與OpenAI o1-mini相當(dāng)。

蒸餾技術(shù)能夠讓大模型“教學(xué)”小模型,保持準(zhǔn)確性的同時(shí)遷移知識,在這一老師教授學(xué)生的過程中,起到了所謂“聽君一席話,勝讀十年書”的效果,從而讓小模型實(shí)現(xiàn)更多全新的功能與性能。對于開發(fā)者而言,如今在非常多高質(zhì)量的小模型和蒸餾技術(shù)的加持下,將大大推動AI模型數(shù)量的激增,實(shí)現(xiàn)更多AI商業(yè)應(yīng)用的規(guī)模化擴(kuò)展。尤其是在終端側(cè),目前大有“當(dāng)機(jī)會來臨,已經(jīng)準(zhǔn)備好了”的態(tài)勢。

端側(cè)AI準(zhǔn)備好了

在終端本地能否運(yùn)行小模型,并保證流暢體驗(yàn),要看當(dāng)前的硬件能否滿足要求。相比正在彌補(bǔ)短板的iOS來說,Android陣營無疑走在了前列。例如,早在MWC24期間,高通就展示了全球首個(gè)在Android智能手機(jī)上運(yùn)行的大型多模態(tài)語言模型,該LMM擁有超過70億參數(shù),可接受包括文本和圖像在內(nèi)的多種類型的數(shù)據(jù)輸入,并能夠與AI助手生成關(guān)于圖像的多輪對話。

“對于高通來講,我們預(yù)判了終端側(cè)模型的爆發(fā),同時(shí)也推動了邊緣AI推理在跨終端設(shè)備上的落地。”馬德嘉表示。

根據(jù)最新發(fā)布的《AI變革正在推動終端側(cè)推理創(chuàng)新》白皮書中寫到,高通的SoC能夠直接在終端側(cè)提供高性能、高能效的AI推理。通過緊密集成這些核心組件,高通技術(shù)公司的平臺可在保持電池續(xù)航和整體能效表現(xiàn)的同時(shí)處理復(fù)雜AI任務(wù),這對邊緣側(cè)用例至關(guān)重要。

高通還在去年MWC24期間推出了AI Hub,能夠幫助開發(fā)者選擇相應(yīng)平臺和開發(fā)模型、編寫應(yīng)用,最后在不同類型的移動終端上進(jìn)行部署,目前已有超過1500家企業(yè)在使用,其中包括海量的模型廠商,比如Meta、Allam、OpenAI、Tech Mahindra、IBM、Mistral、G42等。據(jù)馬德嘉介紹,現(xiàn)在AI Hub不僅提供已有的模型,還能允許開發(fā)者將自己的模型引入其中,或直接通過AI Hub用數(shù)據(jù)來搭建模型,并在云端設(shè)備中實(shí)時(shí)運(yùn)行。

由于以手機(jī)、筆記本為代表的移動設(shè)備一般不會標(biāo)配超大的RAM,能否滿足端側(cè)AI運(yùn)行所需也成了關(guān)注的問題。而蒸餾技術(shù)已經(jīng)讓模型的參數(shù)規(guī)模已經(jīng)不再是衡量模型質(zhì)量的重要指標(biāo),進(jìn)而降低了端側(cè)RAM的壓力。

“我認(rèn)為隨著模型規(guī)模不斷地下降,日后10-20億參數(shù)規(guī)模的模型將會占用更少的運(yùn)行內(nèi)存,更好地適配8-12GB內(nèi)存設(shè)置的終端!瘪R德嘉在回答上述問題時(shí)表示,現(xiàn)在旗艦智能手機(jī)運(yùn)行內(nèi)存配置一般在12GB或以上,已經(jīng)足夠支持很多模型的高效運(yùn)行。同時(shí),高通在處理模型終端側(cè)運(yùn)行的內(nèi)存方面也有著豐富的技術(shù)經(jīng)驗(yàn)。

以正在舉行的MWC25現(xiàn)場的高通展臺為例,iQOO、努比亞、OPPO、榮耀、小米和一加等中國生態(tài)伙伴,均帶來了基于驍龍平臺的終端側(cè)生成式AI和智能體AI的最新應(yīng)用成果。三星也在Galaxy S25 Ultra上展示谷歌全新AI助手Gemini。

《AI變革正在推動終端側(cè)推理創(chuàng)新》白皮書顯示,不僅僅是手機(jī),高通正在擴(kuò)展終端側(cè)AI覆蓋所有關(guān)鍵邊緣細(xì)分領(lǐng)域,還包括PC、汽車、工業(yè)物聯(lián)網(wǎng)、網(wǎng)絡(luò),賦能眾多行業(yè)、釋放商業(yè)價(jià)值并支持全新用戶體驗(yàn)。

在這一過程中,AI將不僅僅是用戶本地的一個(gè)能夠快速響應(yīng)又保證隱私安全的助手,更將帶來新一輪的交互變革。

AI是新的UI

“隨著終端側(cè)可以運(yùn)行越來越多高質(zhì)量的AI模型,越來越多的AI應(yīng)用和用例開始涌現(xiàn)。AI正在重新定義所有終端的用戶界面,這也意味著,AI正在成為終端側(cè)新的UI。”馬德嘉專門強(qiáng)調(diào)了這一論點(diǎn)。

回首過往,智能手機(jī)的每一次重要迭代所伴隨的也是交互方式的變革,從能發(fā)電子郵件的全鍵盤手機(jī),再到能夠?qū)崿F(xiàn)移動計(jì)算的電容屏手機(jī),當(dāng)業(yè)界開始思考智能手機(jī)的下一步將走向何方,AI恰恰給予了改變手機(jī)交互方式的全新契機(jī)。

《AI變革正在推動終端側(cè)推理創(chuàng)新》白皮書表示,智能體AI(Agentic AI)是下一代用戶交互的核心。AI系統(tǒng)能夠通過預(yù)測用戶需求,并在終端和應(yīng)用內(nèi)主動執(zhí)行復(fù)雜工作流,進(jìn)行決策和管理任務(wù)。

屆時(shí),用戶輸入進(jìn)手機(jī)的語音和音頻、文本、圖像、視頻和傳感器等數(shù)據(jù),將不直接應(yīng)用于某個(gè)具體的應(yīng)用,而是先傳輸至智能體AI。智能體AI在接收到這些信息后,會對其進(jìn)行相應(yīng)的處理,之后再將工作負(fù)載分配給后臺的不同應(yīng)用。在這背后,智能體AI要做的就是從終端側(cè)豐富的模型中選擇所需的模型完成任務(wù)。

“也就是說,所有這些處理任務(wù)都是由AI智能體直接完成的,應(yīng)用只會在后臺運(yùn)行,用戶是看不到的。”馬德嘉表示,對于終端用戶來講,AI智能體就是唯一在前端與他們交互的UI,而所有實(shí)際應(yīng)用的處理都是在后臺完成的。最終個(gè)性化的多模態(tài)AI智能體將通過自然語言和基于圖像、視頻與手勢的交互簡化人們使用技術(shù)的方式,高效地跨越各種應(yīng)用完成任務(wù)。

Deepseek蒸餾模型涌現(xiàn)的背后是終端側(cè)AI所迎來的全新機(jī)遇,使用戶在本地也能獲得媲美甚至超越云端的生成式AI能力,這種能力還正逐步演變?yōu)槿碌慕换シ绞剑層脩裟軌蚋幼匀坏嘏c設(shè)備溝通,引領(lǐng)智能終端邁向下一場變革。

編 輯:路金娣
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
vivo胡柏山:手機(jī)行業(yè)是最典型的新質(zhì)生產(chǎn)力代表
精彩專題
聚焦2025全國兩會
2025年世界移動通信大會
低空經(jīng)濟(jì)2025:助力中國經(jīng)濟(jì)騰飛,成就高質(zhì)量發(fā)展
2024通信業(yè)年終盤點(diǎn)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像