Kimi爆火,國產(chǎn)大模型突然開始“卷”長文本。
接連兩日,阿里巴巴、360等互聯(lián)網(wǎng)大廠相繼官宣1000萬字、500萬字的長文本處理能力,另有消息稱,百度也將開放長文本能力,文字范圍會(huì)在200萬字-500萬字。
一場圍繞著Kimi的“圍剿戰(zhàn)”正在上演。
在上述已經(jīng)官宣具備長文本能力的三款明星產(chǎn)品上,就目前公測版本而言,新浪科技分別做了三個(gè)樣本試驗(yàn):在總結(jié)《三體2:黑暗森林》和《未來簡史》時(shí),Kimi只能解讀52%和66%文本內(nèi)容,而另兩家分別達(dá)到100%解讀。這也意味著,在最常見的解讀小說、暢銷書環(huán)節(jié),目前Kimi并沒有優(yōu)勢,甚至在某些功能上與大廠大模型仍有差距。
有AI大模型行業(yè)投資人向新浪科技直言,“長文本在技術(shù)圈里并不稀奇,并沒有想象中那么難”。此前受限于長文本對算力消耗極大且成本較高,導(dǎo)致入局者較少,“資本關(guān)注,現(xiàn)在不得不入局開卷”。
此外他透露,目前Kimi投放廣告的獲客成本約在10元,如果算上拉新后用戶問答互動(dòng)產(chǎn)生的算力成本,每個(gè)用戶的獲客成本達(dá)到12-13元。根據(jù)第三方平臺的下載量預(yù)估,近一個(gè)月來,Kimi在蘋果端和安卓端的日均下載量為17805。按此計(jì)算,Kimi每天的獲客成本將燒掉至少20萬元。
長文本解析,哪家強(qiáng)?
事實(shí)上,長文本處理這項(xiàng)技術(shù)也許并不稀缺。在短時(shí)間內(nèi),阿里和360相繼宣布開放這一功能,就可佐證。
根據(jù)阿里巴巴官方消息,阿里通義千問向所有人免費(fèi)開放1000萬字的長文檔處理功能,成為全球文檔處理容量第一的AI應(yīng)用。幾小時(shí)后,360宣布智腦正式內(nèi)測500萬字長文本處理功能,該功能入駐360AI瀏覽器。
就目前公測版本而言,Kimi、360、阿里,誰的長文本處理能力更強(qiáng)?新浪科技分別進(jìn)行了三組試驗(yàn):
樣本一:暢銷書《未來簡史》;
樣本二:暢銷書《三體2:黑暗森林》;
樣本三:Sora英文論文《大型視覺模型背景、技術(shù)、局限性和機(jī)遇綜述》。
(Kimi總結(jié)《三體2:黑暗森林》,只能閱讀52%)
(通義千問總結(jié)《三體2:黑暗森林》)
(360瀏覽器AI助手總結(jié)《三體2:黑暗森林》)
簡要總結(jié):在實(shí)驗(yàn)一和實(shí)驗(yàn)二中,Kimi僅能解讀前兩者52%和66%文本內(nèi)容,從文本解讀的完成度上明顯落后兩者;解析內(nèi)容層面,三者都有各自的總結(jié),360增設(shè)了摘要和思維導(dǎo)圖等能力。
此外,在聯(lián)網(wǎng)搜索等方面,Kimi所展現(xiàn)出的能力也存在一定局限。
引爆A股,有何過人之處?
不過毫無疑問的是,“月之暗面”仍然是當(dāng)下最炙手可熱的AI企業(yè)。從資方背景來看,包括阿里、紅杉中國、小紅書、美團(tuán)等在內(nèi)的頂級互聯(lián)網(wǎng)巨頭加持,更是讓這家剛A輪的AI科技企業(yè),增添了許多神秘。
除了頭部互聯(lián)網(wǎng)產(chǎn)業(yè)資本一直看好外,目前月之暗面?zhèn)涫荜P(guān)注還有三方面原因:
第一,公司創(chuàng)始團(tuán)隊(duì)年輕且富才學(xué)。公司創(chuàng)始人楊植麟為中國35歲以下NLP領(lǐng)域引用最高的研究者,Transformer-XL和XLNet兩篇論文的第一作者,兩者均為大語言模型領(lǐng)域的核心技術(shù)。公司另外兩位聯(lián)合創(chuàng)始人周昕宇和吳育昕也在大模型道路上探索多年。
第二,Kimi作為一款由初創(chuàng)企業(yè)打造的產(chǎn)品,快速獲得了市場關(guān)注,日活不斷逼近豆包、文心一言等大廠產(chǎn)品。據(jù)華福AI互聯(lián)網(wǎng)團(tuán)隊(duì)公布數(shù)據(jù),截至今年3月3日,Kimi小程序+網(wǎng)頁+App用戶日活90.38萬人,相較于豆包網(wǎng)頁+App日活268萬人,和文心一言網(wǎng)頁+App日活233萬人,差距正不斷縮小。
第三,去年10月,Kimi發(fā)布時(shí)僅能夠支持20萬字的無損上下文輸入,但半年后,公司近期再次宣布內(nèi)測支持200萬字的無損上下文輸入能力,短期內(nèi)文本處理能力提升10倍,技術(shù)迭代進(jìn)展飛快。
一系列“振奮人心”的消息沖擊下,Kimi儼然成為ChatGPT之后國內(nèi)最值得關(guān)注的現(xiàn)象級AI產(chǎn)品,因此也迎來了A股市場的熱捧。近日,A股與Kimi存在關(guān)聯(lián)關(guān)系的華策影視(10.040, -1.02, -9.22%)、掌閱科技(33.130, 0.64, 1.97%)、中廣天擇(38.880, -3.71, -8.71%)、海天瑞聲(87.190, -5.52, -5.95%)等多只個(gè)股漲停。
然而,Kimi的技術(shù)突破,與A股市場Kimi關(guān)聯(lián)企業(yè)的市值暴漲真的存在關(guān)聯(lián)嗎?答案也許是否定的。
在與新浪科技溝通中,便有金融行業(yè)從業(yè)者表示,Kimi概念股暴漲,“本質(zhì)就是股市炒概念的套路,沒有太多底層邏輯性!痹谒磥,“券商研究員基本的操作就是找熱點(diǎn),然后把一些消息釋放出去,讓散戶抄起來,然后機(jī)構(gòu)退出賺錢,自己則從中獲得對沖基金的派點(diǎn),就是這么一個(gè)邏輯!
對于Kimi所擅長的長文本處理能力,另有某國內(nèi)知名大模型創(chuàng)企投資人李良(化名)對新浪科技表示,“長文本這個(gè)東西在技術(shù)圈并不稀奇,大家想做就能做!钡珵槭裁创蠹叶疾蛔瞿?李良的解釋是,“最根本的原因還是長文本對算力消耗極大,成本太高了,目前入局也是不得已的選擇”。
大模型投資人:商業(yè)模式仍是最大問題
在李良看來,“從傳播定位角度來看,一個(gè)產(chǎn)品只抓住一個(gè)點(diǎn)去宣傳,確實(shí)更容易深入人心,讓人家記住,現(xiàn)在大模型可以拿出來宣傳主要就是長文本和多模態(tài)理解,kimi更側(cè)重長文本,因此也更容易被外界關(guān)注到!钡S著后續(xù)互聯(lián)網(wǎng)大廠們開始發(fā)力長文本處理,Kimi的情況,可能會(huì)因此變差。
他進(jìn)一步解釋道,“Kimi能夠提供的長文本處理能力,通義千問、360智腦等競爭對手其實(shí)也能夠提供,因此只要這些大廠一天不收費(fèi),那這類產(chǎn)品就收不了錢,所以它就只能一直虧錢虧下去,這是我們從投資人角度看到它商業(yè)模式最大的一個(gè)問題!
“可能你給它一本小說,讓它去概括一下,它就得花5-10元,但你卻沒付錢給它!崩盍贾赋觯澳壳癒imi投放廣告獲客成本約在10元左右,如果算上拉新后用戶問答互動(dòng)產(chǎn)生的算力成本,每個(gè)用戶的獲客成本可能達(dá)到12-13元!
據(jù)七麥數(shù)據(jù)下載量預(yù)估,近一個(gè)月來,Kimi 在App Store日均下載量5445,在安卓端全渠道日均下載量12360,合計(jì)日均下載量為17805。按此計(jì)算,Kimi每天在安卓+iOS端獲客成本便將達(dá)21.366萬-23.147萬。如果再加上網(wǎng)頁及小程序等其他渠道獲客增長,Kimi每月的獲客成本不在小數(shù)。
“如果Kimi一直持續(xù)這樣的模式,卻找不到新的創(chuàng)收渠道,這樣的做法無異于‘燒錢賺吆喝’!崩盍纪嘎,“在月之暗面近期獲得的10億美元融資中,其中第一期交割的8億美元融資中,阿里領(lǐng)投了7.9億美元融資,其中有6億美元是必須放在共管賬號中,必須消耗阿里云相關(guān)服務(wù)的!
“如果他們后續(xù)無法創(chuàng)造能夠盈利的商業(yè)模式,最終的宿命,可能也就是被并購成為阿里的一部分!崩盍疾聹y道。