亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財(cái)經(jīng)媒體
科技·商業(yè)·財(cái)經(jīng)

群核科技空間大模型新突破:SpatialGen助力AI視頻生成,破解時(shí)空難題

   時(shí)間:2025-08-27 02:32 作者:蘇婉清

群核科技在近日舉辦的首屆技術(shù)開(kāi)放日上,震撼發(fā)布了其空間大模型的最新研究成果——SpatialLM 1.5空間語(yǔ)言模型與SpatialGen空間生成模型,并向與會(huì)者透露了新模型的開(kāi)源計(jì)劃。作為業(yè)內(nèi)首個(gè)專(zhuān)注于3D室內(nèi)場(chǎng)景理解與生成的模型體系,群核空間大模型在提供真實(shí)感全息漫游、結(jié)構(gòu)化可交互體驗(yàn)及處理復(fù)雜室內(nèi)場(chǎng)景方面展現(xiàn)出卓越能力。

除了開(kāi)源模型,群核科技還首次公開(kāi)了AI團(tuán)隊(duì)基于SpatialGen探索的AI視頻生成解決方案,該方案旨在通過(guò)創(chuàng)新范式解決AI視頻制作中的時(shí)空一致性難題。

SpatialLM 1.5,這款基于大語(yǔ)言模型訓(xùn)練的空間語(yǔ)言模型,允許用戶(hù)通過(guò)對(duì)話(huà)交互系統(tǒng)SpatialLM-Chat,實(shí)現(xiàn)從文本到可交互場(chǎng)景的端到端生成。相較于傳統(tǒng)大語(yǔ)言模型對(duì)物理世界空間關(guān)系的理解局限,SpatialLM 1.5不僅能解析文本指令,還能輸出包含空間結(jié)構(gòu)、物體關(guān)聯(lián)及物理參數(shù)的“空間語(yǔ)言”。用戶(hù)只需輸入簡(jiǎn)單文本描述,該模型即可自動(dòng)生成結(jié)構(gòu)化場(chǎng)景腳本,智能匹配家具模型并完成布局,且支持后續(xù)的自然語(yǔ)言問(wèn)答或編輯。更為關(guān)鍵的是,SpatialLM 1.5生成的場(chǎng)景富含物理正確的結(jié)構(gòu)化信息,并能快速批量產(chǎn)出多樣化的符合要求的場(chǎng)景,這些場(chǎng)景可用于機(jī)器人路徑規(guī)劃、避障訓(xùn)練及任務(wù)執(zhí)行等多個(gè)領(lǐng)域,有效解決機(jī)器人訓(xùn)練數(shù)據(jù)稀缺的問(wèn)題?,F(xiàn)場(chǎng)演示中,群核科技首席科學(xué)家周子寒展示了機(jī)器人在養(yǎng)老場(chǎng)景中的應(yīng)用,當(dāng)輸入“去客廳餐桌拿藥”的指令后,模型不僅識(shí)別了相關(guān)物體,還自動(dòng)規(guī)劃出最優(yōu)行動(dòng)路徑,展現(xiàn)了機(jī)器人在復(fù)雜家庭環(huán)境中執(zhí)行任務(wù)的巨大潛力。

而SpatialGen則專(zhuān)注于“生成與呈現(xiàn)”,它是一款基于擴(kuò)散模型架構(gòu)的多視角圖像生成模型。通過(guò)文字描述、參考圖像及3D空間布局,SpatialGen能生成具有時(shí)空一致性的多視角圖像,并進(jìn)一步生成3D高斯場(chǎng)景,渲染出可自由漫游的視頻。依托群核科技海量的室內(nèi)3D場(chǎng)景數(shù)據(jù)與多視角擴(kuò)散模型技術(shù),SpatialGen生成的多視角圖像能確保同一物體在不同視角下保持準(zhǔn)確的空間屬性和物理關(guān)系。用戶(hù)可以在生成的3D高斯場(chǎng)景和真實(shí)感全息漫游視頻中自由穿梭,獲得沉浸式的體驗(yàn)。

群核科技AI產(chǎn)品總監(jiān)龍?zhí)鞚商岬?,盡管當(dāng)前的AIGC文生視頻與圖生視頻工具已經(jīng)推動(dòng)了視頻創(chuàng)作的潮流,但由于時(shí)空一致性問(wèn)題的制約,距離真正的商業(yè)化應(yīng)用還有一定距離。群核科技正在研發(fā)一款基于3D技術(shù)的AI視頻生成產(chǎn)品,并計(jì)劃年內(nèi)正式發(fā)布,這或?qū)⒊蔀槿蚴卓钌疃热诤?D能力的AI視頻生成工具。通過(guò)構(gòu)建3D渲染與視頻增強(qiáng)一體化的生成管線(xiàn),有望顯著彌補(bǔ)當(dāng)前AIGC視頻生成中的時(shí)空一致性不足問(wèn)題。

群核科技聯(lián)合創(chuàng)始人兼董事長(zhǎng)黃曉煌在活動(dòng)現(xiàn)場(chǎng)分享了公司在空間智能布局上的最新思考?;谌蜃畲蟮目臻g設(shè)計(jì)平臺(tái)酷家樂(lè),群核科技構(gòu)建了“空間編輯工具-空間合成數(shù)據(jù)-空間大模型”的空間智能飛輪,通過(guò)工具沉淀數(shù)據(jù),用數(shù)據(jù)加速模型訓(xùn)練,用模型提升工具體驗(yàn),從而在工具的廣泛應(yīng)用中沉淀更為豐富的場(chǎng)景數(shù)據(jù)。截至2025年6月30日,群核科技已擁有超過(guò)4.41億個(gè)3D模型及超過(guò)5億個(gè)結(jié)構(gòu)化3D空間場(chǎng)景。

黃曉煌表示,開(kāi)源是公司戰(zhàn)略的重要關(guān)鍵詞之一。自2018年起,群核科技就啟動(dòng)了開(kāi)源戰(zhàn)略,逐步開(kāi)放數(shù)據(jù)與算法能力。他認(rèn)為,當(dāng)前空間大模型還處于初級(jí)階段,希望通過(guò)開(kāi)源推動(dòng)全球空間智能技術(shù)的快速發(fā)展,成為全球領(lǐng)先的空間智能服務(wù)提供商。

據(jù)悉,本次技術(shù)開(kāi)放日分享的兩款模型將逐步在HuggingFace、GitHub等平臺(tái)面向全球開(kāi)發(fā)者開(kāi)源。其中,空間生成模型SpatialGen已在技術(shù)開(kāi)放日當(dāng)天開(kāi)放下載使用,而空間語(yǔ)言模型SpatialLM 1.5也將以“SpatialLM-Chat”的形式完成開(kāi)源。

 
 
更多>同類(lèi)內(nèi)容
全站最新
熱門(mén)內(nèi)容