京東云昨日宣布,京東云已正式上線DeepSeek-R1 和 DeepSeek-V3模型,支持公有云在線部署、;焖接谢瘜嵗渴饍煞N模式,供用戶按需部署,快速調(diào)用。
附兩種部署方式:
公有云在線部署
開發(fā)者和企業(yè)可以在京東云官網(wǎng),進入言犀 AI 開發(fā)計算平臺的“AI 資產(chǎn)市場”中,選用該模型進行一鍵部署。
言犀 AI 開發(fā)計算平臺已經(jīng)支持 DeepSeek-V3、DeepSeek-R1 以及所有蒸餾小參數(shù)模型(DeepSeek-R1-Distill)的一鍵部署,具體步驟如下:
1、選擇基礎(chǔ)模型在“AI 資產(chǎn)市場 / 模型”中,提供 DeepSeek 開源的多個版本,如 DeepSeek-R1-Distill-Qwen-1.5B,點擊進入卡片頁可了解模型結(jié)構(gòu)和預(yù)訓(xùn)練數(shù)據(jù)等關(guān)鍵信息,并查看模型文件結(jié)構(gòu)。

2、準(zhǔn)備資源節(jié)點 在部署時,LLM 模型因為模型較大,資源性能要求較高,需要獨占計算卡進行部署,建議提前準(zhǔn)備好專屬資源節(jié)點。功能路徑:專屬資源組-創(chuàng)建資源組-創(chuàng)建節(jié)點。節(jié)點規(guī)格:部署 DeepSeek-R1-Distill,推薦使用 cap.p.n3a30.4xlarge;部署 DeepSeek-V3,推薦使用 cap.hc.p5h20.46xlarge

3、模型部署使用將模型部署到相應(yīng)的服務(wù)資源上提供推理調(diào)用服務(wù),在部署時平臺將自動適配預(yù)置推理框架,實現(xiàn)一鍵部署,僅需指定使用的專屬資源組和對應(yīng)的節(jié)點規(guī)格。部署完成后,狀態(tài)將會變?yōu)檫\行中,運行中的模型可被調(diào)用,提供推理服務(wù)。功能路徑:專屬資源組-創(chuàng)建資源組-創(chuàng)建節(jié)點在線服務(wù)-部署;在線服務(wù)-服務(wù)列表 | 服務(wù)名稱-在線調(diào)試

私有化算力實例部署
;焖接谢懔嵗渴鹉J,已經(jīng)同步上線京東云 vGPU AI 算力平臺,為金融、企業(yè)、政府等客戶提供數(shù)據(jù)不出域的私有化模型推理服務(wù)。
以 DeepSeek R1 版本為例,具體的使用步驟如下:1、進入算力管理頁面,點擊租用新實例按鈕

2、選擇資源規(guī)格以及對應(yīng)帶有 deepseek 模型的鏡像

3、資源創(chuàng)建成功后通過 Jupyterlab 進入實例,啟動 Ollama 即可與之對話


京東云言犀 AI 開發(fā)計算平臺還支持私有化部署及 API 快速集成,通過自研高性能資源管理與彈性調(diào)度系統(tǒng),可提供大模型的全生命周期服務(wù)及部署,涵蓋模型開發(fā)、推理及多場景應(yīng)用擴展。
針對資源緊缺的場景,京東云支持通過蒸餾技術(shù)訓(xùn)練企業(yè)自己的大模型,減少模型部署所需資源的同時具備較好的性能。使用京東云 vGPU AI 算力平臺,可以將多個蒸餾過的企業(yè)自有模型部署在同一張卡上,有效提升資源利用率 70%。