首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 頭條資訊 >> 正文

2024Q1人工智能“里程碑”盤點:Sora和Kimi做對了什么?

2024年4月1日 07:23  財聯(lián)社  

2024年一季度即將結(jié)束。在以ChatGPT為起點的AI風潮席卷世界一年后,全球生成式AI應用加速發(fā)展,多模態(tài)模型及應用成為新一輪AI競賽的“主戰(zhàn)場”。目前,國內(nèi)AIGC賽道應用層品類持續(xù)多元化,海外助手類應用逐漸成為主流。

盤點一季度資本市場最“出圈”的AI應用,文生視頻賽道上,Sora在2月春節(jié)假期后引起市場關注;3月國產(chǎn)AI對話助手Kimi在突破200萬字的長文本技術后,訪問量與市場關注度激增;3月下旬,初創(chuàng)企業(yè)Suno發(fā)布同名模型V3版本發(fā)布,一條龍“包辦”歌詞、歌聲、配樂,指向多模態(tài)應用流行新趨勢。

文字聊天助手在ChatGPT問世之后成為各方人工智能巨頭進軍的方向,而多模態(tài)AI應用在2023年也已開始批量涌現(xiàn),2024年仍然在A股“出圈”的Sora、Kimi做對了什么?

Sora:更長的視頻與商業(yè)化落地

繼文生視頻“獨角獸”Pika大火之后,龍年春節(jié)期間,Open AI發(fā)布的文生視頻大模型Sora迅速風靡。Sora初步具備了理解物理世界的能力,率先將文生視頻長度突破了1分鐘長度,較其他模型表現(xiàn)更出色,還支持圖生視頻、視頻生視頻、視頻擴展、多角度鏡頭等。春節(jié)后,Sora行情引領A股人工智能概念走強。

其最關鍵的突破可以概括為以下幾點,據(jù)中泰證券概括,一是生成效果上的可用性極高(60s時長、分辨率1080p);二是從技術路線上解決了模態(tài)之間的對齊問題;三是從產(chǎn)業(yè)發(fā)展看,Sora通用性極強,有望統(tǒng)一視頻生成生態(tài)。

而另一邊,Pika等競爭者也在持續(xù)迭代,3月,Pika添加了AI 視頻自動生成音效功能,用戶可以直接在應用程序中完成并創(chuàng)建新的聲音文件,在此之前,Pika還推出了口型同步功能,在成為“一條龍”式AI 視頻平臺的路上前進。

Kimi:開啟超長文本競爭

Kimi智能助手這一AI對話工具由月之暗面(Moonshot AI)在2023年10月推出,之后歷經(jīng)三次版本迭代。三月中旬,月之暗面宣布在大模型長上下文窗口技術上取得新的突破,Kimi智能助手已支持200萬字超長無損上下文。

隨后,“解鎖”長文本能力的Kimi概念在市場爆火,多家上市公司發(fā)布公告稱接入Kimi或正在與其溝通。百度、阿里也雙雙宣布加碼,角逐長文本大模型賽道。

目前海內(nèi)外商業(yè)化AI應用仍然以聊天助手類為主。在海外,a16z最新的全球 AI 產(chǎn)品 Top100 榜單2024年有22家新公司上榜,LLM助手占主導地位,ChatGPT網(wǎng)站穩(wěn)居榜首。在國內(nèi),根據(jù)AI產(chǎn)品榜aicpb.com統(tǒng)計,目前國內(nèi)智能聊天助手占主流,國內(nèi)訪問量前十中有六款產(chǎn)品為AI ChatBots,其中目前Kimi增速最高,2月環(huán)比為107.6%,在國內(nèi)AI產(chǎn)品訪問量排行榜中的排名升至第3位,僅次于百度文心一言的1006萬和阿里通義千問的365萬。

Kimi在競爭激烈的同類產(chǎn)品中被二級市場關注,民生證券認為,優(yōu)勢在于其長文本處理能力,領先于同期其他模型產(chǎn)品。月之暗面創(chuàng)始人曾表示:“無損的長上下文是通用人工智能的關鍵基礎”。而這一趨勢在海外同類產(chǎn)品中也已出現(xiàn)。機器之心數(shù)據(jù)顯示,Open AI尚未上線的GPT-4.5Turbo上下文窗口將高達256K token(約20萬詞),Anthropic剛剛發(fā)布的Claude 3支持200K tokens上下文。

Suno: 降低AI音樂創(chuàng)作門檻

近期,AI初創(chuàng)公司Suno更新了文生音樂模型Suno V3,可通過幾秒時間創(chuàng)作2分鐘的“廣播級”音質(zhì)完整歌曲,并新增了更豐富的音樂風格和流派選項,如古典音樂、爵士、Hiphop等。相比V1版本20-40 秒的時長,V3版本在完整度、提示詞依從以及交互界面等各方面都有改進。Suno V3支持AI生成音樂歌詞,但其能力側(cè)重于音頻生產(chǎn),在文本生成方面,其與Open AI有合作。在模型運行時,Suno調(diào)用ChatGPT生成歌詞和標題。

AI應用在向多模態(tài)延伸的同時,智能文字助手的接入也在成為AI初創(chuàng)企業(yè)的新嘗試。

掀起行情的“爆款”AI有何共通之處?

無論是Sora的強擴展性長視頻,還是Kimi的超長無損上下文、Suno在文生音頻中調(diào)用ChatGPT實現(xiàn)“一條龍”創(chuàng)作,都填補了市場中AI產(chǎn)品的某些技術性空白。而其更多的共通點在于面向C端用戶的開放體驗和顯著的商業(yè)化預期。

ToC的切入點

Sora尚未正式發(fā)布,但其母公司Open AI是最早一批開啟人工智能商業(yè)化的企業(yè)。在Sora的測試階段,其最先被開放給視覺藝術家、設計師、電影制作人等群體,首批拿到Sora授權的導演、藝術家們已在本周公開自己創(chuàng)作的最新短片。Kimi與Suno均有面向C端用戶的免費訪問形式,也獲得良好口碑。華泰證券觀點表示,Kimi的戰(zhàn)略是基于閉源的C端模型,加速模型迭代,讓B端公司接入其API合作賦能。

商業(yè)化預期

獲A股市場關注的AI模型/應用單品往往有著更清晰的商業(yè)化預期。

在文生視頻賽道,最新消息顯示,Open AI試圖借助Sora進軍好萊塢。據(jù)報道,Open AI計劃下周在美國洛杉磯與好萊塢諸多工作室、媒體高管、藝人經(jīng)紀開會,以構(gòu)建娛樂產(chǎn)業(yè)的合作伙伴關系、并鼓勵眾多制片公司將Open AI的新款AI視頻生成器融入它們的工作中。Open AI CEO Altman已經(jīng)在今年奧斯卡電影節(jié)周末出席洛杉磯的多場活動。

在智能聊天助手賽道,Kimi母公司聯(lián)合創(chuàng)始人預計,2024年會推出多模態(tài)模型及產(chǎn)品,預計在24年上半年開啟商業(yè)化模式。而這一發(fā)展路徑,在海外已被Open AI驗證過。

熱門AI應用對A股市場的影響?

Sora與LLM推理更需要內(nèi)存帶寬的資源需求不同,視覺模型推理將對芯片本身算力和內(nèi)存容量提出更高要求?v觀機構(gòu)對Sora概念所給出的投資建議,機會集中于:①光通信領域和算力基礎設施領域,需要更高的算力和帶寬②AI文生視頻技術有望對影視、廣告營銷、游戲與視覺內(nèi)容創(chuàng)作等傳媒領域進行重塑。

和Kimi相關的投資主線則包括語料素材庫價值的凸顯(包括文字、圖像、視頻)、Kimi賦能應用的邏輯、與其他國產(chǎn)優(yōu)質(zhì)大模型合作的邏輯。Kimi近期連續(xù)宕機則顯示從訓練走向推理對于算力的需求將會巨大,而且這種需求僅僅剛開始。華福證券復盤稱,回顧本年Kimi行情,最先領漲的是可接入Kimi的應用場景,包括閱讀、短劇劇本生成等場景相關的標的,而后行情傳導到模型語料,即擁有視頻語料、文字語料的各個標的,子版塊輪動路徑和Open AI行情較為相似。

與Suno相關的投資機會,開源證券解讀稱,AI音樂生成模型訓練或拉動對音樂版權、音頻語料數(shù)據(jù)的需求。

除了以上“爆款”AI,近期還有階躍星辰大模型(萬億參數(shù))、英偉達的一系列AI應用新部署等面世,AGI范式的構(gòu)建仍在不斷重塑中。在此過程中,機構(gòu)的投資建議更多地指向訓練數(shù)據(jù)集、算力和應用賦能。

算力、數(shù)據(jù)集、應用方向的新機會

國產(chǎn)AI算力鏈在芯片、交換機、存儲、AI服務器等方向的機遇早已明確,而2024年新生的機遇也在醞釀。一季度,國盛證券表示,國內(nèi)外對液冷的需求有望形成共振,液冷從“可選”到“必選”的過程將大幅提升市場空間,成為算力重要細分賽道;興業(yè)證券有色金屬研究團隊認為,英偉達新發(fā)布的GB200 NVLink銅互聯(lián)方案以及高速連接器需求放量有望打開高端銅合金市場需求。

2024年人工智能產(chǎn)業(yè)對于訓練數(shù)據(jù)集的需求持續(xù)多模態(tài)化,開源證券表示,長文本訓練或拉動知識、文學類語料需求,多模態(tài)訓練或拉動圖片、視頻類語料需求。AI領域版權糾紛不斷,海外近期多起由于未經(jīng)出版社同意使用版權方內(nèi)容訓練大模型判罰落地,驗證數(shù)據(jù)要素價值。三月末,國內(nèi)《生成式人工智能服務安全基本要求》落地,方正證券表示,優(yōu)質(zhì)的視頻和文本版權商價值凸顯。

AI對應用的賦能在ToB領域也已有許多嘗試,近期的機構(gòu)觀點更多指向多模態(tài)、長文本的應用加速。華泰證券表示,綜合當下全球AI應用發(fā)展情況,海外ToC應用進展與國內(nèi)大模型能力升級或?qū)⒊蔀?024年AI應用的關注重點。海外,AI應用2023年針對ToB場景全面鋪開,大模型逐步嵌入企業(yè)IT基礎架構(gòu)。伴隨模型能力提升,ToC應用有望迎來新拐點,多模態(tài)應用與智能終端(AI手機、AIPC)有望提速;國內(nèi),大模型能力優(yōu)化仍是產(chǎn)業(yè)重點,長文本能力成為當前多家公司的模型能力重點。伴隨基礎模型能力提升,國內(nèi)AI應用產(chǎn)品化、商業(yè)化節(jié)奏有望全面加快。

下一個Kimi何處尋?

從技術角度上,中泰證券認為,繼文本、代碼、圖片、視頻之后,下一個有可能實現(xiàn)突破的AI模態(tài)大概率是3D。目前海外在AI+3D技術上主要分為工業(yè)場景探索與非工業(yè)場景探索。非工業(yè)場景應用探索主要主要面向游戲、元宇宙中的3D資產(chǎn)設計;工業(yè)場景應用則主要以衍生式設計軟件。但AI+3D建模技術當前也面臨較多挑戰(zhàn),如3D數(shù)據(jù)與資產(chǎn)缺乏、AI訓練難度高、AI實時渲染技術有限、商業(yè)化落地難度大等問題。

而從A股市場角度,能夠掀起行情的“黑馬”往往出現(xiàn)在ToC端受眾群體較多且有商業(yè)應用催化的方向。天風證券計算機團隊在Kimi掀起市場熱潮期間曾經(jīng)發(fā)布相關問卷調(diào)查,結(jié)果顯示,Kimi 培育用戶習慣逐步形成且黏性很高,并非營銷導流的一次性熱潮,同時在某些特定場景下也形成了用戶的核心需求(如金融)。從繞不開的通用場景如辦公出發(fā),垂直場景看好金融,建議關注辦公軟件、多模態(tài)賽道、金融和法律應用、B 端應用等。

編 輯:高靖宇
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應用建議。如網(wǎng)站內(nèi)容涉及作品版權和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
陳忠岳:中國聯(lián)通正在開展6G技術指標制定等工作
精彩專題
CES 2024國際消費電子展
2023年信息通信產(chǎn)業(yè)盤點暨頒獎禮
飛象網(wǎng)2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復制、鏡像