亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財經(jīng)媒體
科技·商業(yè)·財經(jīng)

群核科技空間大模型新突破:有望破解AI視頻生成時空一致性瓶頸

   時間:2025-08-26 13:47 作者:柳晴雪

在人工智能視頻生成領(lǐng)域,盡管技術(shù)日新月異,但仍面臨著一系列挑戰(zhàn),其中最為突出的便是時空一致性問題。這一問題如同一道枷鎖,束縛著AI視頻技術(shù)向商業(yè)化邁進的步伐,導(dǎo)致生成的視頻中常常出現(xiàn)物體位置錯亂、空間邏輯不連貫以及遮擋關(guān)系錯誤等現(xiàn)象。

近日,群核科技在其首屆技術(shù)開放日(TechDay)上,隆重推出了兩款旨在解決上述難題的新模型——SpatialLM 1.5與SpatialGen。這兩款模型不僅代表了群核科技在空間智能領(lǐng)域的最新研究成果,更為整個行業(yè)帶來了全新的技術(shù)范式。

SpatialLM 1.5是一款基于大語言模型訓(xùn)練的空間語言模型,它打破了傳統(tǒng)大語言模型對物理世界理解的局限,能夠不僅理解文本指令,還能生成包含空間結(jié)構(gòu)、物體關(guān)系以及物理參數(shù)的“空間語言”。這一特性使得SpatialLM 1.5能夠生成富含物理正確性的結(jié)構(gòu)化信息場景,且能夠快速批量產(chǎn)出多樣化的符合要求場景,為機器人路徑規(guī)劃、避障訓(xùn)練等領(lǐng)域提供了豐富的數(shù)據(jù)支持。

在活動現(xiàn)場,群核科技首席科學(xué)家周子寒通過演示展示了SpatialLM 1.5在機器人養(yǎng)老場景中的應(yīng)用。當(dāng)輸入“去客廳餐桌拿藥”的指令后,模型不僅準確識別了相關(guān)物體,還自動規(guī)劃出了最優(yōu)行動路徑,展現(xiàn)了機器人在復(fù)雜家庭環(huán)境中執(zhí)行任務(wù)的巨大潛力。

而SpatialGen則是一款專注于“生成與呈現(xiàn)”的多視角圖像生成模型。它基于擴散模型架構(gòu),能夠根據(jù)文字描述、參考圖像以及3D空間布局,生成具有時空一致性的多視角圖像,并進一步生成3D高斯(3DGS)場景并渲染漫游視頻。在群核科技的體驗區(qū),記者親眼見證了SpatialGen如何將一張靜止的老屋照片和一張3D布局草圖,轉(zhuǎn)化為一段可360°漫游的動態(tài)空間視頻,靜止的場景仿佛被賦予了生命,生動逼真。

這兩款模型的發(fā)布,對于電商、設(shè)計、電影等多個行業(yè)來說,無疑是一劑強心針。這些行業(yè)的AI創(chuàng)作者們長期面臨著視角切換導(dǎo)致的時空一致性問題,使得生成的視頻質(zhì)量大打折扣。而SpatialLM 1.5與SpatialGen的推出,有望從根本上解決這一問題,推動AI視頻技術(shù)向更高層次發(fā)展。

知名導(dǎo)演、AIGC創(chuàng)作者神思遠在活動現(xiàn)場表示,盡管目前AI視頻生成工具層出不窮,但在人物一致性與時空一致性問題上仍難以滿足影視級要求。他期待群核科技的新模型能夠為電影行業(yè)帶來更加高效、可控的AI解決方案,加速電影制作的工業(yè)化進程。

群核科技AI產(chǎn)品總監(jiān)龍?zhí)鞚梢餐嘎叮麄冋谘邪l(fā)一款基于3D技術(shù)的AI視頻生成產(chǎn)品,并計劃在今年內(nèi)正式發(fā)布。這款產(chǎn)品將深度融合3D能力,通過構(gòu)建3D渲染與視頻增強一體化的生成管線,有望顯著彌補當(dāng)前AIGC視頻生成中時空一致性不足的問題。

據(jù)悉,SpatialLM 1.5與SpatialGen將逐步在HuggingFace、GitHub、魔搭社區(qū)等平臺面向全球開發(fā)者開源。其中,SpatialGen已在技術(shù)開放日當(dāng)天開放下載使用,而SpatialLM 1.5也將以“SpatialLM-Chat”的形式完成開源。這一舉措無疑將為全球開發(fā)者提供更為廣闊的技術(shù)探索空間,共同推動AI視頻技術(shù)的創(chuàng)新發(fā)展。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容