出門(mén)問(wèn)問(wèn)多模態(tài)大模型又添新備案!近日,出門(mén)問(wèn)問(wèn)(02438.HK)語(yǔ)音大模型「序列猴子」成功通過(guò)上海市生成式人工智能服務(wù)備案,這是出門(mén)問(wèn)問(wèn)繼「序列猴子」大模型完成相應(yīng)備案后的又一次成就。
此次備案的順利通過(guò),不僅標(biāo)志著「序列猴子」語(yǔ)音大模型在技術(shù)落地應(yīng)用上取得了重要進(jìn)展,也彰顯了出門(mén)問(wèn)問(wèn)在多模態(tài)大模型領(lǐng)域發(fā)展的雄厚實(shí)力。
「序列猴子」語(yǔ)音大模型以出門(mén)問(wèn)問(wèn)自研并完成備案的「序列猴子」大模型為基座模型,采用第六代TTS引擎 MeetVoice Pro以及語(yǔ)音合成標(biāo)記語(yǔ)言(SSML)技術(shù)進(jìn)行開(kāi)發(fā)!感蛄泻镒印拐Z(yǔ)音為通用大模型,提供多種文本和語(yǔ)音應(yīng)用功能。
其中,文字轉(zhuǎn)語(yǔ)音功能可以將文字快速轉(zhuǎn)換成自然、流暢的語(yǔ)音,可用于制作有聲書(shū)、語(yǔ)音廣告或自動(dòng)播報(bào);聲音克隆功能可以對(duì)語(yǔ)音樣本的深度學(xué)習(xí)訓(xùn)練,產(chǎn)生極富自然感和表現(xiàn)力的合成聲音;發(fā)音校正則是對(duì)于發(fā)音不準(zhǔn)或多音字提供了校正功能,確保語(yǔ)音合成的準(zhǔn)確性;智能文案創(chuàng)作可以為用戶(hù)提供多種風(fēng)格的改寫(xiě)建議,幫助用戶(hù)更高效地創(chuàng)作文案。
「序列猴子」語(yǔ)音大模型為AI在聲音方面的探索提供了更多的可能性,出門(mén)問(wèn)問(wèn)旗下的「魔音工坊」(海外版 DupDub)就是其重要應(yīng)用之一!改б艄し弧故且豢罴陌、配音、剪輯全流程一站式 AI 軟件,在海內(nèi)外擁有超過(guò)800萬(wàn)注冊(cè)會(huì)員,付費(fèi)會(huì)員超60萬(wàn)。其具有六大核心功能,即軟件配音、文字轉(zhuǎn)語(yǔ)音、真人配音、聲音商店、效率工具、聲音克隆及視頻編輯,并擁有有聲音克隆、聲音搜索、情感合成 / 角色遷移以及聲音合成四方面聲音黑科技。依托序列猴子大模型,「魔音工坊」可通過(guò) 3-10 秒的短音頻,快速地實(shí)現(xiàn)聲音克隆,并支持跨語(yǔ)言遷移、情感語(yǔ)氣生成。其海外版 DupDub 還支持多語(yǔ)言生成,目前已涵蓋英語(yǔ)、法語(yǔ)、日語(yǔ)、西班牙語(yǔ)、 葡萄牙語(yǔ)、泰語(yǔ)等。
作為業(yè)內(nèi)稀缺的堅(jiān)持「產(chǎn)模結(jié)合」的公司,出門(mén)問(wèn)問(wèn)聲音大模型與「魔音工坊」的配合典型地體現(xiàn)了「產(chǎn)模結(jié)合」數(shù)據(jù)飛輪效應(yīng)。一方面「魔音工坊」自身的用戶(hù)數(shù)據(jù)晝夜不息地反哺著聲音大模型的訓(xùn)練,另一方面,聲音大模型讓「魔音工坊」不斷自我突破,有著“超寫(xiě)實(shí)”自然音色的驚艷表現(xiàn),吸引著全球數(shù)以百萬(wàn)計(jì)的用戶(hù)深度玩轉(zhuǎn)。
以「魔音工坊」新華社的合作為例,新華社將AI配音加入到新媒體AIGC創(chuàng)新平臺(tái)后,分別用磁性播音腔、溫柔女聲、治愈童聲等不同類(lèi)型的聲音為推文配上情緒匹配、朗讀準(zhǔn)確的音頻。從文本導(dǎo)入到AI配音成本,通常只要幾分鐘,大幅縮短了文本配音時(shí)間,為新華社工作人員釋放更多工作精力。
新華社還可以通過(guò)形象克隆和聲音克隆技術(shù),為記者或者主持人1:1克隆形象,極大的提升后續(xù)拍攝和剪輯的效率。在新華社客戶(hù)端“問(wèn)證”板塊中,便新增了“數(shù)字記者”角色。根據(jù)真人記者形象,出門(mén)問(wèn)問(wèn)為其1:1克隆出了數(shù)字記者,并通過(guò)短視頻形式出鏡,隨時(shí)隨地為讀者科普播報(bào),報(bào)道新聞事件。
出門(mén)問(wèn)問(wèn)成立于2012年,是一家以生成式AI和語(yǔ)音交互為核心的人工智能公司,為全球多個(gè)國(guó)家和地區(qū)提供AI智能硬件、AI政企服務(wù),以及面向創(chuàng)作者的AIGC產(chǎn)品。
出門(mén)問(wèn)問(wèn)以「Make AGI Accessible and AI CoPilot everywhere」為愿景,致力于打造國(guó)際領(lǐng)先的通用大模型,通過(guò)AI技術(shù)、產(chǎn)品及商業(yè)化三位一體發(fā)展,成為全球AI CoPilot的引領(lǐng)者。
出門(mén)問(wèn)問(wèn)擁有行業(yè)領(lǐng)先的AI基礎(chǔ)設(shè)施能力、前沿通用大模型「序列猴子」,以及豐富的垂直領(lǐng)域軟硬結(jié)合的優(yōu)化算法技術(shù)模塊,是為數(shù)不多的同時(shí)服務(wù)于內(nèi)容創(chuàng)作者、企業(yè)、消費(fèi)者三大類(lèi)不同群體的公司。
面向內(nèi)容創(chuàng)作者用戶(hù),出門(mén)問(wèn)問(wèn)致力于通過(guò)AIGC賦能內(nèi)容創(chuàng)作,目前已構(gòu)建豐富的AIGC CoPilot產(chǎn)品矩陣,包括AI配音助理「魔音工坊」及海外版「DupDub」、AI數(shù)字分身「奇妙元」及海外版「LivGen」、企業(yè)AI交互式數(shù)字員工生成平臺(tái)「奇妙問(wèn)」、可一鍵成片的AI短視頻生成平臺(tái)「元?jiǎng)?chuàng)島」等,打造一站式內(nèi)容創(chuàng)作平臺(tái),賦能創(chuàng)作者實(shí)現(xiàn)高效內(nèi)容生成。
在應(yīng)用和大模型的垂直整合下,出門(mén)問(wèn)問(wèn)形成了獨(dú)特的AIGC商業(yè)模式。相較于傳統(tǒng)的ToB和ToC,AIGC公司可以形成獨(dú)特的新商業(yè)模式——服務(wù)SMB或Professional Consumer(ToSMB/ToPC)。這樣的商業(yè)模式既可以避免傳統(tǒng)ToB的項(xiàng)目制,也可以避免跟ToC互聯(lián)網(wǎng)巨頭競(jìng)爭(zhēng)停止增長(zhǎng)的流量。
在「產(chǎn)模結(jié)合」戰(zhàn)略和ToSMB/ToPC商業(yè)模式的指引下,截至目前,出門(mén)問(wèn)問(wèn)的AIGC產(chǎn)品累計(jì)服務(wù)的用戶(hù)數(shù)量已超1500萬(wàn),注冊(cè)用戶(hù)數(shù)量超1000萬(wàn),其中付費(fèi)的用戶(hù)數(shù)量約86.5萬(wàn),公司已由傳統(tǒng)AI項(xiàng)目制模式成功轉(zhuǎn)型可持續(xù)增長(zhǎng)的AIGC業(yè)務(wù)模式。
未來(lái),出門(mén)問(wèn)問(wèn)將繼續(xù)AIGC應(yīng)用場(chǎng)景中深耕,借助公司的領(lǐng)先及先發(fā)優(yōu)勢(shì),持續(xù)探索AIGC的技術(shù)與應(yīng)用邊界,為推動(dòng)我國(guó)生成式人工智能的建設(shè)與發(fā)展貢獻(xiàn)力量。