亚洲精品,日韩av,亚洲国产一区二区三区亚瑟,玩弄寡妇丰满肉体,香蕉久久夜色精品升级完成,亚洲av无码成人精品区一区

  • 科技·商業(yè)·財(cái)經(jīng)媒體
科技·商業(yè)·財(cái)經(jīng)

揭秘具身智能進(jìn)化:元客視界CTO詳談數(shù)據(jù)飛輪與智能大模型突破

   時(shí)間:2025-08-28 11:04 作者:鐘景軒

人形機(jī)器人與具身智能的發(fā)展正處于從實(shí)驗(yàn)室邁向量產(chǎn)的關(guān)鍵階段,但這一領(lǐng)域的進(jìn)步面臨多重挑戰(zhàn)。盡管已能完成抓取、走跑跳等基本動作,人形機(jī)器人仍被視為擁有“初級大腦”,在復(fù)雜長程任務(wù)上的能力相對薄弱,交互表現(xiàn)生硬且不自然。硬件的長期穩(wěn)定性與一致性不足、軟件的泛化能力弱以及數(shù)據(jù)的匱乏與無標(biāo)準(zhǔn)化,構(gòu)成了人形機(jī)器人與具身智能真正落地的三大困境。

為了推動從0到1的智能進(jìn)化,搭建感知、推理、執(zhí)行的完整鏈路至關(guān)重要,而這一過程離不開大量數(shù)據(jù)的支持。數(shù)據(jù)如同燃料,驅(qū)動著大模型支撐的多模態(tài)理解與泛化能力,使其能夠適應(yīng)復(fù)雜任務(wù)與動態(tài)環(huán)境。在具身智能大模型領(lǐng)域,模型的性能遵循Scaling Law,即當(dāng)模型的參數(shù)或計(jì)算量按比例擴(kuò)大時(shí),性能也會相應(yīng)提升。然而,要實(shí)現(xiàn)這一提升,必須跨越某個(gè)參數(shù)規(guī)模的閾值,大模型才會“涌現(xiàn)”出上下文學(xué)習(xí)、復(fù)雜推理等能力。因此,無論是真實(shí)環(huán)境交互產(chǎn)生的操作數(shù)據(jù),還是通過遠(yuǎn)程操縱或人類示范獲取的學(xué)習(xí)數(shù)據(jù),都是不可或缺的。

為了克服數(shù)據(jù)采集的難題,北京和上海等地的創(chuàng)新中心以及智元等頭部企業(yè)正在加速搭建“仿真-真機(jī)融合”的數(shù)據(jù)訓(xùn)練場。這些訓(xùn)練場通過并行機(jī)器人、遠(yuǎn)程操控、仿真回放等機(jī)制,高效采集覆蓋不同場景、任務(wù)和交互模式的大規(guī)模數(shù)據(jù),旨在打通數(shù)據(jù)采集、處理、訓(xùn)練、仿真、部署的全棧式解決方案。這一舉措旨在構(gòu)建高標(biāo)準(zhǔn)、可擴(kuò)展的訓(xùn)練場,以開啟數(shù)據(jù)飛輪與產(chǎn)品迭代的良性循環(huán)。

在數(shù)據(jù)采集方面,動捕技術(shù)扮演著重要角色。動捕技術(shù)主要分為光學(xué)捕捉和慣性捕捉兩大流派。光學(xué)動捕以其高精度,可達(dá)0.1毫米級,能夠?qū)崟r(shí)捕捉人或物體的運(yùn)動軌跡,尤其適用于手指靈巧作業(yè)等高精度要求場景。而慣性動補(bǔ)則以其數(shù)據(jù)連續(xù)性好、不怕遮擋的特點(diǎn),在應(yīng)急救援等領(lǐng)域受到青睞。元客視界的FZMotion運(yùn)動捕捉系統(tǒng)采用了光學(xué)與慣性融合的技術(shù)路線,既保證了高精度數(shù)據(jù)的獲取,又解決了被遮擋的困擾,顯著提升了數(shù)據(jù)采集的連續(xù)性。

元客視界CTO陳溥指出,人形機(jī)器人與具身智能目前仍處于“幼兒園孩子階段”,對于復(fù)雜交互性強(qiáng)的工作仍處于探索期。他強(qiáng)調(diào)了三大核心問題:硬件的穩(wěn)定性、智能與數(shù)據(jù)的匱乏、以及執(zhí)行任務(wù)的效率低下。為了解決這些問題,元客視界采取了降低真機(jī)采集數(shù)據(jù)的成本、擴(kuò)大真機(jī)數(shù)據(jù)采集的效率的策略,并與仿真平臺公司合作,完善物理仿真引擎,以彌補(bǔ)仿真環(huán)境訓(xùn)練數(shù)據(jù)遷移的泛化性不足。

在數(shù)據(jù)應(yīng)用方面,行業(yè)目前主要按照“仿真+真機(jī)”比例混合訓(xùn)練模型。純真實(shí)數(shù)據(jù)訓(xùn)練雖然更貼近實(shí)際,但采集效率低、成本高,且模型難以從失敗中學(xué)習(xí)。而單靠互聯(lián)網(wǎng)與仿真數(shù)據(jù),雖然建設(shè)通用性的場景感知和指令理解能力速度快,卻存在明顯的Sim2Real Gap。因此,真實(shí)數(shù)據(jù)用于糾偏與對齊,仿真數(shù)據(jù)用于規(guī)模擴(kuò)展和多樣性覆蓋,二者融合訓(xùn)練成為行業(yè)公認(rèn)的發(fā)展方向。

元客視界還嘗試開發(fā)了一套人體Human to Robot的映射重定向算法,能夠?qū)⑷梭w關(guān)節(jié)的物理量及空間坐標(biāo)等參數(shù)轉(zhuǎn)化為機(jī)器人運(yùn)動控制的目標(biāo)位置、速度、力矩等,從而讓機(jī)器人在自由度限制內(nèi)更絲滑地完成動作。這一算法打破了單模態(tài)的局限,提高了數(shù)據(jù)采集的效率。

在數(shù)據(jù)采集到應(yīng)用的量化評估體系方面,元客視界正在與頭部企業(yè)合作,基于實(shí)際應(yīng)用定義標(biāo)準(zhǔn),并嘗試與國內(nèi)標(biāo)準(zhǔn)機(jī)構(gòu)對接,推動國標(biāo)行標(biāo)的制定。這一評估體系旨在綜合評估機(jī)器人產(chǎn)品的技術(shù)性能、安全性、可靠性、經(jīng)濟(jì)性及場景適配性等多項(xiàng)指標(biāo)。

對于能耗這一機(jī)器人商業(yè)化的關(guān)鍵瓶頸,元客視界也提出了通過運(yùn)動學(xué)與動力學(xué)分析,優(yōu)化關(guān)節(jié)運(yùn)動軌跡和精準(zhǔn)計(jì)算功耗的解決方案,以期長遠(yuǎn)降低機(jī)器人功耗。

在談到機(jī)器人數(shù)據(jù)訓(xùn)練場所需的數(shù)據(jù)規(guī)模時(shí),陳溥表示,具體需看場景任務(wù)復(fù)雜度。對于環(huán)境變化較大的場景,可能需要百萬條以上的數(shù)據(jù)。而對于工業(yè)場景,如工廠中的分揀、碼垛等環(huán)節(jié),可能需要千萬條級別的數(shù)據(jù)規(guī)模。

最后,陳溥還分享了元客視界在具身智能數(shù)據(jù)采集領(lǐng)域的核心優(yōu)勢,包括數(shù)據(jù)采集端的高精度與連續(xù)性、重定向算法方面的深厚經(jīng)驗(yàn),以及向產(chǎn)業(yè)鏈后端延伸,構(gòu)建完整的“Real-to-Sim-to-Real”數(shù)據(jù)應(yīng)用閉環(huán)的能力。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容