
【導語】前段時間世界人形機器人運動會中,機器人們“狀況百出”,各種搞笑畫麵令人捧腹。在這場運動會裏,人形機器人“具身天公 Ultra”奪得百米短跑冠軍,引人關注。而為何機器人學奔跑困難、為何專注“人形”等問題,將糖心免费视频引向“具身智能”這一概念。究竟什麽是具身智能?它和傳統離身智能有何不同?為何人形機器人是未來發展方向?讓糖心免费视频一探究竟。
前段時間舉行的世界人形機器人運動會上,機器人們各種“出洋相”的視頻大家還印象深刻吧!沒看到的請下滑欣賞起來,看過的就再看一遍!(無論看多少次都很想笑啊!)(多 gif 預警~)


古風小機器人來也

疊羅漢和再起不能

機器人撞人事件

哎呦這地兒是不是不平啊

我頭呢我頭呢

我倒了,大家加油
在田徑、足球、拳擊等項目中,最引人注目的無疑是百米短跑。當發令槍響,一台名為“具身天公 Ultra”的人形機器人從起跑線上衝出,它由北京人形機器人創新(xīn)中(zhōng)心(xīn)自(zì)主研(yán)發(fā)的(de)機(jī)器(qì)人(rén),最(zuì)終(zhōng)以(yǐ) 21.50 秒(miǎo)的(de)成(chéng)績(jī)奪(duó)冠(guān)。而(ér)在(zài)所(suǒ)有(yǒu)矽(guī)基(jī)運(yùn)動(dòng)員(yuán)中(zhōng),“天(tiān)公(gōng) Ultra”是(shì)唯(wéi)一(yī)一(yī)台(tái)采用(yòng)全自(zì)主導(dǎo)航(háng)係(xì)統(tǒng),全程(chéng)無(wú)需(xū)人(rén)工(gōng)遙(yáo)控(kòng)在(zài)賽(sài)場(chǎng)奔(bēn)跑(pǎo)的(de)選手。

宇樹科技王興興賽後總結
相信大家在看完運動會中機器人的諸多洋相精彩表現之後,會產生一些疑問:
為什麽學會奔跑——這個人類幼童即可掌握的技能(néng)——對(duì)機(jī)器(qì)人(rén)而(ér)言(yán)如(rú)此(cǐ)困(kùn)難(nán)?為(wèi)什(shén)麽(me)不(bù)讓(ràng)輪(lún)胎(tāi)機(jī)器(qì)人(rén)參(cān)賽(sài),著(zhe)重(zhòng)於(yú)“人(rén)形(xíng)”機(jī)器(qì)人(rén)?
這(zhè)些(xiē)問(wèn)題(tí),將(jiāng)我(wǒ)們(men)引(yǐn)向(xiàng)一(yī)個(gè)重(zhòng)新(xīn)審(shěn)視(shì)“智(zhì)能(néng)”本(běn)質(zhì)的(de)概(gài)念(niàn):具(jù)身(shēn)智(zhì)能(néng)。這(zhè)意味著 AI 試著從虛擬的數字空間回歸物理現實,從抽象的符號處理走向與世界互動的真實存在。
莫拉維克悖論
要理解機器人奔跑的意義,糖心免费视频必須首先麵對人工智能領域一個基本難題,即 “莫拉維克悖論”(Moravec's Paradox)。
這是由人工智能和機器人學者所發現的一個和常識相左的現象,在 1980 年代提出,其核心是:人類所獨有的高階智慧能力隻需要非常少的計算能力,例如推理,但是無意識的技能和直覺卻需要極大的運算能力。
如莫拉維克所說,要讓電腦如成人般地下棋是相對容易的,但是要讓電腦有如一歲小孩般的感知和行動能力卻是相當困難甚至是不可能的。
莫拉維克曾經根據自己的研究,繪製了一張“人類能力景觀圖”。

在這張圖中,被海洋所淹沒的部分就是當時已經可以被人工智能和機器人所取代的工作,而隨著海平麵的上升,岸邊、平原和高原的技能對AI來說難度逐漸上升。
莫拉維克悖論的根源來自於生物演化的漫長曆史。人類引以為傲的抽象推理能力,如邏輯和數學,從演化的時間尺度上看,是最近幾千年才發展出的新能力。莫拉維克將其形容為“人類思想最薄的一層表皮” 。
與之相反,感知和運動控製這些糖心免费视频幾乎不假思索就能完成的“簡單”技能,是曆經數億年自然選擇精心雕琢和優化的結果。大腦皮層中,有大量區域用於視覺、聽覺、運動控製等感知與行動。糖心免费视频低估了這些任務的複雜性,正是因為它們演化得非常高效,以至於大部分過程在糖心免费视频無意識時就已完成了。

但隨著深度學習、神經網絡和傳感器技術的發展,某些“莫拉維克難題”已經被(bèi)部(bù)分(fēn)攻(gōng)克(kè),“具(jù)身(shēn)智(zhì)能(néng)”也(yě)逐(zhú)漸(jiàn)在(zài)現(xiàn)實(shí)世(shì)界(jiè)嶄(zhǎn)露(lù)頭(tóu)角(jiǎo)。
具(jù)身(shēn)智(zhì)能(néng)
具(jù)身(shēn)智(zhì)能(néng)(Embodied Intelligence)是(shì)一(yī)種(zhǒng)強(qiáng)調(diào)智(zhì)能(néng)係(xì)統(tǒng)必(bì)須(xū)擁(yōng)有(yǒu)物(wù)理(lǐ)身(shēn)體(tǐ),並(bìng)通(tōng)過(guò)這(zhè)個(gè)身(shēn)體(tǐ)與(yǔ)動(dòng)態(tài)、複(fù)雜(zá)的(de)真(zhēn)實(shí)環境進行實時交互,從而在交互中學習、優化並展現其智能的理論。

具身智體的典型架構
其實質是人工智能與機器人技術的深度融合:AI 為機器人提供“大腦”,使其具備感知、思考和決策的能力;而機器人則為 AI 提供“身體”,使其能夠與真實世界互動,獲取經驗和知識 。
AI 領域著名大佬李飛飛曾指出:“具身的含義不是身體本身,而是與環境交互以及在環境中做事的整體需求和功能。”

具身智能的體係架構
早在 1950 年,艾倫・圖靈發表了經典的《計算機器與智能》(Computing Machinery and Intelligence)一文,標誌著人工智能理論的奠基。
在這篇論文的最後兩個段落裏,圖靈展望了人工智能未來可能的兩種發展途徑。一種是比較抽象的、比如算術所需的智能,一種則是擁有感官、能學習甚至能說英語的智能。而後者,正是具身智能。
1986年,美國計算機科學家羅德尼・布魯克斯從控製論角度出發,強調智能是具身化 (Embodied) 和情境化的。換言之,智能體必須擁有“身體”才能由虛擬世界進入到真實世界,並通過與真實世界的交互來發育或(huò)進(jìn)化(huà)出(chū)智(zhì)能(néng)。
1991 年(nián),布(bù)魯(lǔ)克(kè)斯(sī)提(tí)出(chū)了(le)“行(xíng)為(wèi)智(zhì)能(néng)”,認(rèn)為(wèi)智(zhì)能(néng)係(xì)統(tǒng)應(yīng)直(zhí)接(jiē)通(tōng)過(guò)與(yǔ)環(huán)境(jìng)互(hù)動(dòng)來(lái)體(tǐ)現(xiàn)其(qí)高(gāo)度(dù)的(de)適(shì)應(yīng)性(xìng),而非依賴內部模型。這一工作引導研究者從計算能力轉向身體與環境的交互。

羅德尼・布魯克斯
2023 年,英偉達創始人黃仁勳在半導體大會上指出,具身智能是能夠理解、推理並與物理世界互動的智能係統,預示著其將成為人工智能的下一波浪潮。
2025 年,“具身智能”首次被寫入政府工作報告,成為未來產業發展的重點方向之一。
今年舉辦的全球機器人馬拉鬆、世界機器人大會、世界人形機器人運動會,都讓最新的機器人乃至具身智能“幼兒”們一個亮相的機會。

沒“斷奶”也可以來比賽!
具身認知
如前文所言,圖靈對人工智能未來的展望,除了具身智能,它的對立麵則是糖心免费视频更為熟悉的——離身智能(Disembodied Intelligence)。
像 ChatGPT 或 AlphaGo 這樣的模型,就是離身智能的典型代表。它們存在於服務器的虛擬世界中,處理的是抽象的符號數據(文字、圖片、棋盤狀態),能夠輸出信息,但無法直接作用於物理世界。
AlphaGo 雖然精於棋局推演,但麵對真實的棋盤,它可能連一顆棋子都拿不穩。
但具身智能與離身智能並不相互排斥, 特別是在方法層麵上, 包括深度學習、強化學習等方法都已成為解決離身智能和具身智能問題的重要工具。

具身智能的核心機製,是感知-行動循環。
這與傳統 AI 線性的“輸入數據-輸出答案”模式截然不同。具身智能體在一個持續不斷的閉環中運作:它通過傳感器(如攝像頭、觸覺傳感器)感知世界;這種感知信息經過處理,形成決策,並驅動執行器(如馬達、機械臂)產生行動;行動改變了智能體自身以及環境的狀態;這種改變又立刻被智能體感知到,形成新的輸入,從而開始下一輪循環。
在這個循環中,感知與行動互為因果,智能體不再是被動的決策器,而是能夠主動幹預物理世界並實時適應變化的能動主體。

具身形態計算的典型信息論分析方法結構
這一循環,與認知科學中的具身認知不謀而合。
具身認知主張,人類的思維、感知、語言和情感等認知活動與身體的物理結構、感官體驗和動作密切相關。認知不僅僅是大腦內的信息處理,而是身體與外部世界動態互動的產物。其包含了幾個概念:
1.具身認知:認知不是抽象的符號操作,是通過身體和環節的互動實現的。身體不僅是認知的工具,更是認知內容的塑造者。
2.感知-行動循環:認知過程不僅依賴大腦的計算,還與身體的動作和感官反饋形成動態循環。若感知和行動被人為分離,認知能力會顯著下降。
3.身體形態:身體的物理結構和動作模式在認知中起著至關重要的作用,人類的思維和概念受到身體形態的深刻影響。比如“抓握”這一概念就是來源於人類手指形態。
4.情景化:認知活動並非孤立,而是嵌入在具體的身體和環境背景中的。同樣的動作在不同文化中可能具有不同的涵義。
在生物學驗證上,通過著名的“小貓實驗”(kittens experiment),驗證了視覺、發展和運動之間的關係。

科學家把兩隻小貓放進了圓筒內,圓筒內壁上畫著豎條紋,兩隻小貓都在圓筒內部繞圈,稱作“小貓旋轉木馬”,得到了相同的視覺輸入。但它們的區別是——第一隻小貓是自己走的,第二隻小貓則被放在與中心軸相連的盒子裏,被盒子帶著移動。
結果發現,主動移動的小貓能夠發展出正常的感官-運動係統,而被動移動的小貓則表現出嚴重的感官-運動障礙。這說明了自我運動與環境主動互動在視覺感知和協調的關鍵作用。
隨著新的具身認知的發展,認知科學也能幫助具身智能更好的描摹這個世界,認識這個世界。

競爭對手也可以抱一抱~
最後,讓糖心免费视频回到開頭的世界人形機器人運動會,試想,為什麽要用人形機器人?
(說起來,今年舉辦的機器人大會中,隻有“運動會”的名字裏加上了“人形”呢)
首先,糖心免费视频的世界——從建築、工具到社會規範——都是為人類的(de)身(shēn)體(tǐ)形(xíng)態(tài)量(liàng)身(shēn)定(dìng)做(zuò)的(de)。因(yīn)此(cǐ),製(zhì)造(zào)人(rén)形(xíng)機(jī)器(qì)人(rén),擁(yōng)有(yǒu)兩(liǎng)隻(zhǐ)手(shǒu)兩(liǎng)條(tiáo)腿(tuǐ),讓(ràng)它(tā)們(men)能(néng)夠(gòu)無(wú)縫(fèng)地(de)融(róng)入(rù)我(wǒ)們的環境,是一個非常務實的選擇。

人,不要阻擋我的跳舞之魂
其次,機器人學習現實世界中的技能,能夠直接學習現成的人類行為。比如對機器人學習打打乒乓球,可以直接觀察人類動作進行多模態學習,分析人類的技巧、速度、肌肉等等。
還有,人們對具有人形的機器人有更多親近感,也能更好理解彼此的動作信號——比如點頭、比 ok 等等。

當然,這些並不意味著非人形機器人的弱勢。無論是宇樹的四足機器人,還是場景賽中的分揀機器人,都以非人的方式呈現。根據具體的需要,能夠以不同的形態更好地滿足。

真正的、通用的、擁有常識並能適應糖心免费视频這個混亂且不可預測的世界的智能,不可能在純粹抽象的數字真空中誕生。它需要被具身化、它需要擁有一個身體,去與世界互動,去將其知識植根於物理經驗,去在永不停歇的感知與行動的循環中學習和進化。

機器人,幸會
參考文獻
[1]陳思維(2024). 具身認知研究進展綜述.心理學進展, 14(1), 387-394. DOI: 10.12677/ap.2024.141054
[2]http://zhuanlan.zhihu.com/p/1920853960635450532
[3]http://www.simplypsychology.org/held-and-hein-1963.html
[4] Huaping Liu, Di Guo, and Angelo Cangelosi. 2025. Embodied Intelligence: A Synergy of Morphology, Action, Perception and Learning. ACM Comput. Surv. 57, 7, Article 186 (March 2025), 36 pages.
[5] http://www.zhihu.com/question/398460589
[6] http://news.qq.com/rain/a/20250821A03OGO00
[7] http://mp.weixin.qq.com/s/lZH4oM3WJPfpsFG8D6hrtA
[8] http://mp.weixin.qq.com/s/Sw6FPYlVM6DCWTCCInKgyA
[9] http://mp.weixin.qq.com/s/aNbIV7sa7G-97axStFtE7Q
策劃製作
來源丨中科院物理所(id:cas-iop)
責編丨甄曦
審校丨徐來、張林林
本文封麵圖片及文內圖片來自版權圖庫
轉載使用可能引發版權糾紛
AI校園體育抖音號
AI校園體育視頻號
AI城市更新抖音號
AI城市更新視頻號
微信公眾號