首頁(yè)|必讀|視頻|專(zhuān)訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|智能汽車(chē)|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片|報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 移動(dòng)互聯(lián)網(wǎng) >> 正文

出門(mén)問(wèn)問(wèn)多模態(tài)大模型又添新備案!「序列猴子」語(yǔ)音大模型成功完成備案

2024年12月11日 16:25  CCTIME飛象網(wǎng)  

出門(mén)問(wèn)問(wèn)多模態(tài)大模型又添新備案!近日,出門(mén)問(wèn)問(wèn)(02438.HK)語(yǔ)音大模型「序列猴子」成功通過(guò)上海市生成式人工智能服務(wù)備案,這是出門(mén)問(wèn)問(wèn)繼「序列猴子」大模型完成相應(yīng)備案后的又一次成就。

此次備案的順利通過(guò),不僅標(biāo)志著「序列猴子」語(yǔ)音大模型在技術(shù)落地應(yīng)用上取得了重要進(jìn)展,也彰顯了出門(mén)問(wèn)問(wèn)在多模態(tài)大模型領(lǐng)域發(fā)展的雄厚實(shí)力。

 

「序列猴子」語(yǔ)音大模型以出門(mén)問(wèn)問(wèn)自研并完成備案的「序列猴子」大模型為基座模型,采用第六代TTS引擎 MeetVoice Pro以及語(yǔ)音合成標(biāo)記語(yǔ)言(SSML)技術(shù)進(jìn)行開(kāi)發(fā)!感蛄泻镒印拐Z(yǔ)音為通用大模型,提供多種文本和語(yǔ)音應(yīng)用功能。

其中,文字轉(zhuǎn)語(yǔ)音功能可以將文字快速轉(zhuǎn)換成自然、流暢的語(yǔ)音,可用于制作有聲書(shū)、語(yǔ)音廣告或自動(dòng)播報(bào);聲音克隆功能可以對(duì)語(yǔ)音樣本的深度學(xué)習(xí)訓(xùn)練,產(chǎn)生極富自然感和表現(xiàn)力的合成聲音;發(fā)音校正則是對(duì)于發(fā)音不準(zhǔn)或多音字提供了校正功能,確保語(yǔ)音合成的準(zhǔn)確性;智能文案創(chuàng)作可以為用戶(hù)提供多種風(fēng)格的改寫(xiě)建議,幫助用戶(hù)更高效地創(chuàng)作文案。

「序列猴子」語(yǔ)音大模型為AI在聲音方面的探索提供了更多的可能性,出門(mén)問(wèn)問(wèn)旗下的「魔音工坊」(海外版 DupDub)就是其重要應(yīng)用之一!改б艄し弧故且豢罴陌、配音、剪輯全流程一站式 AI 軟件,在海內(nèi)外擁有超過(guò)800萬(wàn)注冊(cè)會(huì)員,付費(fèi)會(huì)員超60萬(wàn)。其具有六大核心功能,即軟件配音、文字轉(zhuǎn)語(yǔ)音、真人配音、聲音商店、效率工具、聲音克隆及視頻編輯,并擁有有聲音克隆、聲音搜索、情感合成 / 角色遷移以及聲音合成四方面聲音黑科技。依托序列猴子大模型,「魔音工坊」可通過(guò) 3-10 秒的短音頻,快速地實(shí)現(xiàn)聲音克隆,并支持跨語(yǔ)言遷移、情感語(yǔ)氣生成。其海外版 DupDub 還支持多語(yǔ)言生成,目前已涵蓋英語(yǔ)、法語(yǔ)、日語(yǔ)、西班牙語(yǔ)、 葡萄牙語(yǔ)、泰語(yǔ)等。

作為業(yè)內(nèi)稀缺的堅(jiān)持「產(chǎn)模結(jié)合」的公司,出門(mén)問(wèn)問(wèn)聲音大模型與「魔音工坊」的配合典型地體現(xiàn)了「產(chǎn)模結(jié)合」數(shù)據(jù)飛輪效應(yīng)。一方面「魔音工坊」自身的用戶(hù)數(shù)據(jù)晝夜不息地反哺著聲音大模型的訓(xùn)練,另一方面,聲音大模型讓「魔音工坊」不斷自我突破,有著“超寫(xiě)實(shí)”自然音色的驚艷表現(xiàn),吸引著全球數(shù)以百萬(wàn)計(jì)的用戶(hù)深度玩轉(zhuǎn)。

以「魔音工坊」新華社的合作為例,新華社將AI配音加入到新媒體AIGC創(chuàng)新平臺(tái)后,分別用磁性播音腔、溫柔女聲、治愈童聲等不同類(lèi)型的聲音為推文配上情緒匹配、朗讀準(zhǔn)確的音頻。從文本導(dǎo)入到AI配音成本,通常只要幾分鐘,大幅縮短了文本配音時(shí)間,為新華社工作人員釋放更多工作精力。

新華社還可以通過(guò)形象克隆和聲音克隆技術(shù),為記者或者主持人1:1克隆形象,極大的提升后續(xù)拍攝和剪輯的效率。在新華社客戶(hù)端“問(wèn)證”板塊中,便新增了“數(shù)字記者”角色。根據(jù)真人記者形象,出門(mén)問(wèn)問(wèn)為其1:1克隆出了數(shù)字記者,并通過(guò)短視頻形式出鏡,隨時(shí)隨地為讀者科普播報(bào),報(bào)道新聞事件。

 

出門(mén)問(wèn)問(wèn)成立于2012年,是一家以生成式AI和語(yǔ)音交互為核心的人工智能公司,為全球多個(gè)國(guó)家和地區(qū)提供AI智能硬件、AI政企服務(wù),以及面向創(chuàng)作者的AIGC產(chǎn)品。

出門(mén)問(wèn)問(wèn)以「Make AGI Accessible and AI CoPilot everywhere」為愿景,致力于打造國(guó)際領(lǐng)先的通用大模型,通過(guò)AI技術(shù)、產(chǎn)品及商業(yè)化三位一體發(fā)展,成為全球AI CoPilot的引領(lǐng)者。

出門(mén)問(wèn)問(wèn)擁有行業(yè)領(lǐng)先的AI基礎(chǔ)設(shè)施能力、前沿通用大模型「序列猴子」,以及豐富的垂直領(lǐng)域軟硬結(jié)合的優(yōu)化算法技術(shù)模塊,是為數(shù)不多的同時(shí)服務(wù)于內(nèi)容創(chuàng)作者、企業(yè)、消費(fèi)者三大類(lèi)不同群體的公司。

面向內(nèi)容創(chuàng)作者用戶(hù),出門(mén)問(wèn)問(wèn)致力于通過(guò)AIGC賦能內(nèi)容創(chuàng)作,目前已構(gòu)建豐富的AIGC CoPilot產(chǎn)品矩陣,包括AI配音助理「魔音工坊」及海外版「DupDub」、AI數(shù)字分身「奇妙元」及海外版「LivGen」、企業(yè)AI交互式數(shù)字員工生成平臺(tái)「奇妙問(wèn)」、可一鍵成片的AI短視頻生成平臺(tái)「元?jiǎng)?chuàng)島」等,打造一站式內(nèi)容創(chuàng)作平臺(tái),賦能創(chuàng)作者實(shí)現(xiàn)高效內(nèi)容生成

 

在應(yīng)用和大模型的垂直整合下,出門(mén)問(wèn)問(wèn)形成了獨(dú)特的AIGC商業(yè)模式。相較于傳統(tǒng)的ToB和ToC,AIGC公司可以形成獨(dú)特的新商業(yè)模式——服務(wù)SMB或Professional Consumer(ToSMB/ToPC)。這樣的商業(yè)模式既可以避免傳統(tǒng)ToB的項(xiàng)目制,也可以避免跟ToC互聯(lián)網(wǎng)巨頭競(jìng)爭(zhēng)停止增長(zhǎng)的流量。

在「產(chǎn)模結(jié)合」戰(zhàn)略和ToSMB/ToPC商業(yè)模式的指引下,截至目前,出門(mén)問(wèn)問(wèn)的AIGC產(chǎn)品累計(jì)服務(wù)的用戶(hù)數(shù)量已超1500萬(wàn),注冊(cè)用戶(hù)數(shù)量超1000萬(wàn),其中付費(fèi)的用戶(hù)數(shù)量約86.5萬(wàn),公司已由傳統(tǒng)AI項(xiàng)目制模式成功轉(zhuǎn)型可持續(xù)增長(zhǎng)的AIGC業(yè)務(wù)模式。

未來(lái),出門(mén)問(wèn)問(wèn)將繼續(xù)AIGC應(yīng)用場(chǎng)景中深耕,借助公司的領(lǐng)先及先發(fā)優(yōu)勢(shì),持續(xù)探索AIGC的技術(shù)與應(yīng)用邊界,為推動(dòng)我國(guó)生成式人工智能的建設(shè)與發(fā)展貢獻(xiàn)力量。

編 輯:T01
飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國(guó)移動(dòng)王曉云:6G已經(jīng)進(jìn)入面向產(chǎn)業(yè)技術(shù)創(chuàng)新的全新階段
精彩專(zhuān)題
2024中國(guó)算力大會(huì)
2024年國(guó)際信息通信展
中國(guó)信科亮相2024年國(guó)際信息通信展
第25屆中國(guó)國(guó)際光電博覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像