具身智能評測將“有標(biāo)可依”
關(guān)鍵詞: 具身智能 行業(yè)標(biāo)準(zhǔn) 評測 機(jī)器人
近日,中國信息通信研究院聯(lián)合40余家單位共同起草的具身智能領(lǐng)域首個行業(yè)標(biāo)準(zhǔn)正式發(fā)布。該標(biāo)準(zhǔn)為具身智能領(lǐng)域構(gòu)建了統(tǒng)一基準(zhǔn)測試框架,標(biāo)志著具身智能評測邁入“有標(biāo)可依”的新階段。 據(jù)了解,這項標(biāo)準(zhǔn)聚焦人工智能關(guān)鍵基礎(chǔ)技術(shù)和具身智能基準(zhǔn)測試方法,明確了具身智能系統(tǒng)框架和能力要求,將于6月1日正式實施。 “具身智能正處于從實驗室走向商業(yè)化落地的關(guān)鍵階段?!敝袊畔⑼ㄐ叛芯吭喝斯ぶ悄苎芯克L魏凱說。 數(shù)據(jù)顯示,2025年,國內(nèi)整機(jī)企業(yè)數(shù)量超140家,發(fā)布人形機(jī)器人產(chǎn)品超330款。 然而,魏凱認(rèn)為,目前具身智能產(chǎn)業(yè)發(fā)展面臨兩大瓶頸。一是“作坊式”研發(fā)模式。模型調(diào)優(yōu)和部署往往極度依賴算法工程師的經(jīng)驗;數(shù)據(jù)散落在各家數(shù)采廠,難以有效整合和復(fù)用;硬件多為非標(biāo)組裝,交付后往往需要廠家進(jìn)行“保姆式”維護(hù)和調(diào)試,難以規(guī)?;桓?。二是“碎片化”生態(tài)格局。模型性能與本體強(qiáng)綁定,換個硬件就容易失效;系統(tǒng)能力高度依賴具體場景的實訓(xùn)效果,場景一變就容易失靈;供應(yīng)鏈缺乏統(tǒng)一標(biāo)準(zhǔn),導(dǎo)致技術(shù)成果難以復(fù)用,產(chǎn)業(yè)鏈協(xié)同效率不高。 “可信具身智能評測體系正是連接技術(shù)研究與大規(guī)模產(chǎn)業(yè)應(yīng)用的橋梁,為行業(yè)提供統(tǒng)一的技術(shù)規(guī)范框架,建立互信基礎(chǔ),推動具身智能從‘作坊式’開發(fā)走向產(chǎn)業(yè)化發(fā)展。”魏凱說。 在他看來,建立評測體系就是為行業(yè)打造一把可信標(biāo)尺,量出真智能、好產(chǎn)品、強(qiáng)可靠。 一方面,通過驗證模型在真實場景下的泛化能力和部署成效,標(biāo)準(zhǔn)幫助用戶區(qū)分真智能與炫技,可以倒逼企業(yè)研發(fā)真正可規(guī)模化、可復(fù)制的具身基礎(chǔ)模型。另一方面,標(biāo)準(zhǔn)讓企業(yè)明確什么是合格的產(chǎn)品,從而降低技術(shù)選型和適配成本,優(yōu)化整個產(chǎn)業(yè)鏈供應(yīng)鏈的資源配置。 “全面評估具身智能在復(fù)雜環(huán)境下的穩(wěn)定性與可靠性,也可以為產(chǎn)品大規(guī)模落地提供安全保障?!蔽簞P說,“更重要的是,有了這把可信標(biāo)尺,產(chǎn)業(yè)鏈上下游就有了共同的協(xié)同基礎(chǔ),技術(shù)研發(fā)、硬件制造、場景應(yīng)用能夠有效銜接?!?/span> 新發(fā)布的標(biāo)準(zhǔn)規(guī)范了在仿真環(huán)境和真實環(huán)境下,面向具身智能系統(tǒng)的基準(zhǔn)測試框架、方法和指標(biāo)。這項標(biāo)準(zhǔn)提出的評測體系支持基礎(chǔ)能力、認(rèn)知推理能力以及全鏈路閉環(huán)能力的測試,覆蓋靜態(tài)仿真測試、動態(tài)仿真測試、真實環(huán)境測試和組合式測試四種方法。 “作為具身智能領(lǐng)域首份正式發(fā)布的行業(yè)標(biāo)準(zhǔn),具身智能基準(zhǔn)測試方法的出臺對推動技術(shù)進(jìn)步、應(yīng)用落地和產(chǎn)業(yè)發(fā)展具有重要意義,為行業(yè)發(fā)展指明了方向?!蔽簞P說。 其中,技術(shù)研發(fā)層面,這項標(biāo)準(zhǔn)為具身智能的能力評估提供了統(tǒng)一的度量依據(jù),能夠指引技術(shù)迭代方向,幫助行業(yè)及早識別高價值技術(shù)路線,減少研發(fā)資源的無效投入;應(yīng)用落地層面,為行業(yè)用戶開展產(chǎn)品選型與應(yīng)用驗證提供標(biāo)準(zhǔn)規(guī)范支撐,避免“劣幣驅(qū)逐良幣”;產(chǎn)業(yè)發(fā)展層面,將加速具身智能從實驗室走向真實場景,促進(jìn)具身智能技術(shù)成果的工程化落地和產(chǎn)業(yè)化應(yīng)用。 魏凱認(rèn)為,自主評測標(biāo)準(zhǔn)的建立有助于引導(dǎo)全國的創(chuàng)新資源向符合我國產(chǎn)業(yè)優(yōu)勢和技術(shù)路線的方向匯聚,避免在他人設(shè)定的賽道上被動追趕。此外,評測標(biāo)準(zhǔn)一旦成熟并被國際采納,將有利于我國具身智能產(chǎn)品、方案、平臺出海,進(jìn)一步打造具身智能領(lǐng)域的“中國樣板”。(記者 崔 爽)
【責(zé)任編輯:朱家齊】