人形機(jī)器人行業(yè)近年來(lái)備受資本追捧,但其商業(yè)化路徑的模糊性與技術(shù)挑戰(zhàn)的復(fù)雜性,正引發(fā)行業(yè)內(nèi)外的激烈爭(zhēng)議。金沙江創(chuàng)投管理合伙人朱嘯虎的“批量退出”言論,將這一爭(zhēng)議推向高潮,同時(shí)也揭示了行業(yè)在資本狂熱與技術(shù)攻堅(jiān)之間的復(fù)雜處境。
商業(yè)化爭(zhēng)議:泡沫還是未來(lái)?
朱嘯虎的退出理由直指人形機(jī)器人商業(yè)化前景不明。他認(rèn)為,當(dāng)前人形機(jī)器人的客戶需求“更像是想象而非真實(shí)存在”,單臺(tái)售價(jià)動(dòng)輒數(shù)十萬(wàn)元,遠(yuǎn)超實(shí)際場(chǎng)景的付費(fèi)意愿。這一觀點(diǎn)引發(fā)了行業(yè)內(nèi)的激烈反應(yīng)。經(jīng)緯創(chuàng)投創(chuàng)始人張穎反駁稱,機(jī)器人領(lǐng)域“大賽道,百花齊放”,短期內(nèi)存在泡沫是正常現(xiàn)象,長(zhǎng)期來(lái)看必將誕生大公司。眾擎機(jī)器人CEO趙同陽(yáng)則批評(píng)朱嘯虎“用眼前否定未來(lái)”,認(rèn)為人形機(jī)器人需要長(zhǎng)期投入,五年內(nèi)將“無(wú)處不在”。
智源研究院院長(zhǎng)王仲遠(yuǎn)指出,具身智能的訓(xùn)練非常復(fù)雜,需要海量數(shù)據(jù),5年時(shí)間都是樂(lè)觀的,也許需要10年后才能成熟。不同風(fēng)格的投資機(jī)構(gòu)對(duì)產(chǎn)業(yè)落地的時(shí)間預(yù)期存在分歧,短期內(nèi)商業(yè)化路徑不明晰,導(dǎo)致部分資本選擇退出。然而,從長(zhǎng)期來(lái)看,多模態(tài)大模型、世界模型與硬件迭代的共振,可能逐步將具身智能推向“數(shù)字-物理”融合的臨界點(diǎn)。
技術(shù)挑戰(zhàn):數(shù)據(jù)瓶頸與硬件成熟度
數(shù)據(jù)是具身智能發(fā)展的核心難題。銀河通用創(chuàng)始人王鶴指出,當(dāng)前數(shù)據(jù)分為真實(shí)數(shù)據(jù)與仿真合成數(shù)據(jù)兩類。真實(shí)數(shù)據(jù)中,互聯(lián)網(wǎng)視頻雖量大但“不足夠”,無(wú)法直接應(yīng)用于機(jī)器人訓(xùn)練。他主張“用合成數(shù)據(jù)做預(yù)訓(xùn)練,用真機(jī)數(shù)據(jù)完成后訓(xùn)練”,并類比自動(dòng)駕駛:“人形機(jī)器人存量達(dá)百萬(wàn)臺(tái)前,合成數(shù)據(jù)是最寶貴資產(chǎn)。”樂(lè)聚機(jī)器人冷曉琨坦言,硬件采集觸覺(jué)等模態(tài)數(shù)據(jù)成本高企,當(dāng)前采集的數(shù)據(jù)模態(tài)數(shù)量不夠,且模型未完全確定時(shí),投入大量精力采集的數(shù)據(jù)有被推翻的可能性。
硬件成熟度不足也是人形機(jī)器人商業(yè)化的重要障礙。樂(lè)聚機(jī)器人冷曉琨表示,硬件從實(shí)驗(yàn)室到產(chǎn)業(yè)化需要3-5年,軟硬件最終合起來(lái)才能真正迎來(lái)質(zhì)變。當(dāng)前人形機(jī)器人完成的任務(wù)相對(duì)簡(jiǎn)單,如搬箱子等,更多精細(xì)性任務(wù)需要后期更復(fù)雜的訓(xùn)練。銀河通用王鶴認(rèn)為,輪式機(jī)器人與人形機(jī)器人有不同的適應(yīng)場(chǎng)景,輪式機(jī)器人成本低、續(xù)航長(zhǎng),但復(fù)雜地形需要人形機(jī)器人穿越,最終目標(biāo)是走進(jìn)家庭,但距離這一目標(biāo)還有很長(zhǎng)的路要走。
人形必要性:噱頭還是必需?
關(guān)于“人形必要性”的爭(zhēng)論由來(lái)已久。行業(yè)里有觀點(diǎn)認(rèn)為,當(dāng)前70%的場(chǎng)景并不需要機(jī)器人具備“人形”,因此“機(jī)器人做成人形”的必要性是否不夠充分。智源研究院王仲遠(yuǎn)在一定程度上認(rèn)同這一觀點(diǎn),他舉例說(shuō)明,行業(yè)內(nèi)也有不少機(jī)器人公司已開(kāi)始迭代輪式構(gòu)型機(jī)器人,以克服雙足機(jī)器人穩(wěn)定性欠佳的問(wèn)題。然而,從長(zhǎng)遠(yuǎn)來(lái)看,人形機(jī)器人具有獨(dú)特優(yōu)勢(shì),因其與人的構(gòu)型相似,能更好地適應(yīng)社會(huì)基礎(chǔ)設(shè)施,復(fù)用技能,從互聯(lián)網(wǎng)數(shù)據(jù)中學(xué)習(xí)人類技能,推動(dòng)具身智能和具身大腦模型的迭代。
穹徹智能盧策吾從工具使用角度力挺靈巧手:“拿錘子、筷子需五指靈活調(diào)整,二指無(wú)法完成復(fù)雜操作。”當(dāng)前,隨著具身機(jī)器人任務(wù)種類和任務(wù)量不斷增加,如何在跨本體、跨場(chǎng)景以及跨任務(wù)的情況下解決具身機(jī)器人的泛化問(wèn)題,成為具身機(jī)器人和具身智能領(lǐng)域面臨的重大挑戰(zhàn)。
未來(lái)展望:耐心等待技術(shù)爆發(fā)
對(duì)于人形機(jī)器人的爆發(fā)節(jié)點(diǎn),行業(yè)內(nèi)觀點(diǎn)不一。穹徹智能盧策吾認(rèn)為,具身智能的ChatGPT時(shí)刻不是單一的,而是一批場(chǎng)景,階梯性、漸進(jìn)地實(shí)現(xiàn)。“兩年一周期,物流、食品加工等場(chǎng)景可能會(huì)有第一波變化。”銀河通用王鶴預(yù)測(cè),輪式機(jī)器人貨架級(jí)別的智能可能在2025年、2026年迎來(lái)突破,但如果是每個(gè)人都用上人形機(jī)器人,這個(gè)目標(biāo)實(shí)現(xiàn)的周期就會(huì)比較長(zhǎng),尤其未來(lái),人形機(jī)器人走進(jìn)家庭,需要硬件成本與安全性再突破。
智源研究院王仲遠(yuǎn)類比深度學(xué)習(xí)發(fā)展史:“從2006年論文到ChatGPT用了16年,具身智能受硬件制約,比較可能的突破時(shí)刻,可能是會(huì)現(xiàn)在受限的場(chǎng)景下具備可用性、一定的智能性以及一定程度的泛化,積累幾年之后,逐步進(jìn)化。”他指出,受到大模型快速迭代的正面影響,具身智能的發(fā)展也會(huì)加速。
朱嘯虎的“撤退”,揭開(kāi)了人形機(jī)器人行業(yè)理想與現(xiàn)實(shí)的激烈碰撞。短期內(nèi),商業(yè)化路徑不明、數(shù)據(jù)成本高企、硬件成熟度不足仍是攔路虎;但長(zhǎng)期來(lái)看,多模態(tài)大模型、世界模型與硬件迭代的共振,可能逐步將具身智能推向“數(shù)字-物理”融合的臨界點(diǎn)。泡沫是技術(shù)爆發(fā)的前奏,耐心者才能等到春天。當(dāng)人形機(jī)器人真正走入家庭時(shí),今天的爭(zhēng)議或許會(huì)成為一段精彩的注腳。