亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財(cái)經(jīng)媒體
科技·商業(yè)·財(cái)經(jīng)

AI語音賽道新星Cartesia獲英偉達(dá)等1億美元融資 斯坦福華人團(tuán)隊(duì)攜Sonic-3模型入局

   時(shí)間:2025-11-04 15:43 作者:馮璃月

美國語音生成領(lǐng)域迎來重要突破——初創(chuàng)企業(yè)Cartesia正式推出新一代語音模型Sonic-3,并宣布完成1億美元戰(zhàn)略融資,英偉達(dá)成為核心投資方。這款采用非Transformer架構(gòu)的模型,憑借其低延遲特性在實(shí)時(shí)語音交互領(lǐng)域引發(fā)關(guān)注,數(shù)千家企業(yè)已將其應(yīng)用于每月數(shù)百萬次的對話處理。

技術(shù)團(tuán)隊(duì)構(gòu)成堪稱"學(xué)術(shù)全明星":由5位斯坦福AI實(shí)驗(yàn)室研究員創(chuàng)立的Cartesia,其核心成員包括Mamba架構(gòu)主要開發(fā)者Albert Gu、前谷歌大腦工程師Brandon Yang,以及擁有斯坦福與卡內(nèi)基梅隆雙重學(xué)術(shù)背景的CEO Karan Goel。團(tuán)隊(duì)將狀態(tài)空間模型(SSM)研究成果轉(zhuǎn)化為商業(yè)應(yīng)用,Albert Gu更憑借技術(shù)貢獻(xiàn)入選《時(shí)代》雜志2024年全球影響力人物榜單。

與傳統(tǒng)Transformer模型不同,Sonic-3采用的SSM架構(gòu)通過持續(xù)理解對話脈絡(luò)實(shí)現(xiàn)高效預(yù)測。實(shí)測顯示,該模型中文生成響應(yīng)時(shí)間僅2秒,雖流暢度待提升,但英文表現(xiàn)已達(dá)自然水準(zhǔn),紀(jì)錄片旁白測試中幾乎無法分辨AI痕跡。其90毫秒的模型延遲與190毫秒內(nèi)端到端響應(yīng),使系統(tǒng)躋身全球最快實(shí)時(shí)語音AI之列。

功能層面,Sonic-3支持42種語言與500余種音色選擇,中文提供10種聲線,英文細(xì)分為11種地域口音。通過API參數(shù)與SSML標(biāo)簽,用戶可精確控制音量、語速及情感表達(dá),甚至實(shí)現(xiàn)笑聲、語調(diào)等微妙情感轉(zhuǎn)換。新增的語音克隆功能支持微調(diào),使生成語音更貼近參考原聲,自動(dòng)緩沖技術(shù)則顯著提升實(shí)時(shí)交互的流暢性。

商業(yè)應(yīng)用方面,Cartesia構(gòu)建的企業(yè)級平臺(tái)集成文本轉(zhuǎn)語音(Sonic)與語音轉(zhuǎn)文本(Ink)模型,支持客戶構(gòu)建具備復(fù)雜任務(wù)處理能力的語音Agent。ServiceNow等企業(yè)已將其用于客戶支持、日程管理等場景,產(chǎn)品副總裁Ravi Krishnamurthy評價(jià)稱:"SSM架構(gòu)為企業(yè)級應(yīng)用帶來了前所未有的速度與質(zhì)量。"

融資進(jìn)程顯示市場高度認(rèn)可:2024年12月獲Index Ventures領(lǐng)投的2700萬美元種子輪融資后,僅隔3個(gè)月便完成6400萬美元A輪融資。此次1億美元戰(zhàn)略融資將加速技術(shù)迭代,在MiniMax、ElevenLabs等競爭對手環(huán)伺的AI音頻生成賽道,Cartesia正以SSM架構(gòu)開辟差異化競爭路徑。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容