微軟人工智能部門在近期宣布了其在自研AI領(lǐng)域的重大突破,正式推出了兩款全新的AI模型:MAI-Voice-1語(yǔ)音模型與MAI-1-preview通用模型。這兩款模型的發(fā)布標(biāo)志著微軟在AI技術(shù)上的又一里程碑。
據(jù)微軟官方介紹,MAI-Voice-1語(yǔ)音模型僅需單塊GPU,便能在極短的時(shí)間內(nèi)——僅需1秒,生成長(zhǎng)達(dá)1分鐘的音頻內(nèi)容。這一高效性能使其在多種應(yīng)用場(chǎng)景中展現(xiàn)出巨大潛力。目前,微軟已將這一模型應(yīng)用于“Copilot Daily”功能,AI主持人通過(guò)該模型流暢播報(bào)每日熱點(diǎn)新聞,并能生成播客風(fēng)格的對(duì)話,幫助用戶更深入地理解各類話題。
為了讓更多用戶體驗(yàn)到這一技術(shù)的魅力,微軟在Copilot Labs平臺(tái)上提供了MAI-Voice-1的互動(dòng)體驗(yàn)。用戶不僅可以輸入希望AI表達(dá)的內(nèi)容,還能自定義語(yǔ)音音色與說(shuō)話風(fēng)格,實(shí)現(xiàn)個(gè)性化定制。
與此同時(shí),微軟還推出了另一款重量級(jí)模型——MAI-1-preview。這款模型的訓(xùn)練過(guò)程極為復(fù)雜,動(dòng)用了約1.5萬(wàn)塊英偉達(dá)H100 GPU。它專為有特定需求的用戶設(shè)計(jì),具備強(qiáng)大的指令遵循能力,能夠?yàn)槿粘W稍兲峁?shí)用且精準(zhǔn)的回應(yīng)。這一模型不僅預(yù)示著Copilot未來(lái)功能的發(fā)展方向,也展現(xiàn)了微軟在AI技術(shù)上的深厚積累。
微軟AI負(fù)責(zé)人穆斯塔法·蘇萊曼曾在一次訪談中透露,公司內(nèi)部研發(fā)的AI模型并未將企業(yè)級(jí)應(yīng)用場(chǎng)景作為首要目標(biāo)。他強(qiáng)調(diào),微軟致力于打造一款對(duì)消費(fèi)者體驗(yàn)極佳的產(chǎn)品,并針對(duì)自身應(yīng)用場(chǎng)景進(jìn)行深度優(yōu)化。憑借在廣告業(yè)務(wù)、消費(fèi)者行為數(shù)據(jù)等領(lǐng)域的海量高預(yù)測(cè)性、高實(shí)用性數(shù)據(jù),微軟正專注于構(gòu)建真正適配“消費(fèi)者伙伴”定位的AI模型。
值得注意的是,微軟計(jì)劃將MAI-1-preview模型應(yīng)用于Copilot助手的特定文本使用場(chǎng)景。目前,Copilot主要依賴OpenAI的大型語(yǔ)言模型,而MAI-1-preview的加入將為其帶來(lái)全新的功能和體驗(yàn)。該模型還已在AI基準(zhǔn)測(cè)試平臺(tái)LMArena上進(jìn)行公開測(cè)試,其表現(xiàn)備受期待。
微軟AI團(tuán)隊(duì)在官方博客中表示,他們對(duì)未來(lái)發(fā)展充滿信心。通過(guò)不斷推進(jìn)技術(shù)突破,并整合一系列針對(duì)不同用戶需求與應(yīng)用場(chǎng)景的專業(yè)模型,微軟相信將釋放出巨大的價(jià)值,為用戶帶來(lái)更加智能、便捷的體驗(yàn)。