近日,跨維智能重磅發布人形機器人DexFoece W1,關于這款新產品,機器人大講堂獨家采訪到了跨維智能CTO金毅博士,拿到了更多的技術細節。
此前,跨維智能作為一家具身智能大腦和傳感器為核心的企業,開發出了全球范圍內為數不多的已經完成商業落地閉環的DexVerse™ 具身智能引擎。本次推出W1新品,不但能進一步驗證與探索跨維DexVerse™ 引擎助力人形機器人與具身智能的強大能力,更表明了跨維正在積極探索與拓展具身智能商業化落地的更多可能。
▍AI驅動下,最貼合場景需求的機器人本體
從外觀來看,該機器人整體采用黃與黑的融合配色,構型為輪足底盤與人形上半身,執行機構有雙臂以及靈巧手,整體集成度較高,輪廓曲線流暢優美,W1展開站立后與人高度類似,具備更多場景的適應性和親和力,頭部還能進行上下左右轉動,便于全方位感知環境及對象情況。
設計一款人形機器人到底難不難?對跨維智能而言,或許已經掌握了從研發到落地的正確方法論。因為W1這款人形新品,在跨維內部從0到1,從設計研發到實際成型部署,僅花費了極短時間。而且金博士透露,W1全身34個動力單元由一套高實時的控制系統協調控制,這就使得W1能夠在移動的同時快速完成雙臂、雙手及其他關節的控制,增加了作業效率和靈活性。
W1頸部有兩個自由度,頭部采用6厘米基線距離的雙目仿人傳感器,能實現人類作業場景下多任務作業的感知閉環。W1搭載7自由度柔性機械臂和6自由度力控靈巧手,單臂最大負載達10KG,續航時間8小時并能實現1小時快速充電,底層運動控制頻率達1000次/秒,通信帶寬100Mbps,能滿足大部分科研、工業制造、物流等場景需求。
快速開發出一款作業能力強悍的人形機器人,這本質上得益于跨維團隊在機器人大小腦以及感知等核心技術的積累。例如在W1的設計階段,跨維智能依托DexVerse™ 引擎,在仿真階段就從各個角度完善產品設計,從W1的視角去感知環境,以W1的雙臂、雙手去與周邊交互,不僅確保了機器人的作業空間可達性、減少了動作干涉,更通過這個交互的過程反復優化了本體的結構設計。這個反復優化本體結構設計的過程結合了跨維的AI技術,有別于傳統設計過程完全依賴機械設計工程師的經驗的方式,跨維創新性的采用了在參數空間中進行離散加局部連續優化的方法,使得W1的構型對各種作業場景及任務的適應能力更強,同時保留了設計師的原創概念。
W1雙目純視覺傳感器的設計模擬了人類的雙眼,能夠克服傳統視覺傳感器對強光、透明、高反射等物體識別、定位能力弱的特點,能夠更好地實現復雜環境下的感知。使W1具備類人級別的空間感知能力,最終將這種感知能力映射到實際的人類生產、生活的環境和日常任務中。
除此之外,再配合頸部2個自由度,W1能實現相對更大的水平和垂直視野,在部分作業任務需求時,W1還可以通過轉動頸部來獲得更優質的視覺圖像支持。這種方式相較轉動腰部等身體其他關節無疑更為高效。
金博士表示,輪式底盤的機器人更適合在相對結構化的場景下落地。一方面,從場景特性來看,在絕大多數智能制造、酒店、商超等場景下,地面絕大部分還是平地,并不需要機器人爬樓梯或者進入復雜地形。另一方面從構型來看,雙足人形機器人雙腿需要搭載12個電機,但W1這種輪式底盤卻相當于減少了8個電機,無論是從整體構型的復雜度、成本,還是能源使用效率上,輪式底盤都是更優解。而且可以發現,W1這種輪式底盤能將搭載鋰電池的部位下移,20公斤重的電池放在底盤上,就能讓機器人作業時重心整體下沉,提高了作業穩定性與安全性,同時增加了續航。在闡述了為什么跨維的第一款人形機器人選擇了輪式底盤之后,金博士表示,跨維也在積極的布局雙足人形機器人,并且它們會共享同一套具身智能軟硬件平臺。
可以說跨維智能在W1上已經驗證,基于Sim2Real具身智能引擎,開發者能夠更高效地探索廣泛的設計空間,在最大化強度的同時最小化材料的使用以進行各種結構上的創新,讓本體及末端執行器構型等在機器人任務執行成功率、執行效率、硬件成本等方面不斷趨于最優解。
▍跨越仿真與現實的界限,實現多元化場景部署
更值得一提的是,在軟件與系統架構層面,W1人形機器人也是業內首款基于Sim2Real具身智能引擎定義的新產品,其采用的DexVerse™ 引擎,能夠實現海量數據生成+高效仿真實現場景的快速模型訓練及部署。
人形機器人并不能只是空殼,還需要有完成任務的“打工魂”。從具體任務落地來看,W1能夠通過空間智能傳感器,智能的識別目標對象,看清裝載了物體的料箱,并分解任務步驟,柔順地自主完成抓取、搬運等任務,同時,W1還可以完成組裝、打螺絲等柔性化任務,從而滿足大多數工業場景的任務需求。
W1等人形機器人產品實現該能力并非易事,基礎模型的訓練決定了人形機器人對復雜環境的感知與理解的速度,決定了機器人的對復雜任務的自主執行能力,進而影響甚至決定機器人進入陌生場景的部署周期長短和局部任務的執行效率。
跨維在機器人訓練數據上有著領先優勢,從而能夠在現實任務過程中表現優異。據金博士透露,在W1的基礎模型訓練階段,跨維首先采用大量的網絡數據以及視頻合成數據,通過DexVerse™ 引擎仿真出海量且全面的場景及作業數據集,合成數據并自動生成精準標注,并在這些海量數據的基礎上訓練W1的基礎模型。這個過程大大減少了數據采集的時間和人力成本。
由于經過了數據本身的Real2Sim過程和Sim的擴增過程,跨維可以輕易地完成數據多樣性的增加(例如變更仿真物體的資產,從而實現類別級泛化;變更場景,從而增加面向不同環境的魯棒性;變更物體的姿態,從而實現空間泛化),來保障在模型訓練階段是獲得了充分的變量學習的。這使得W1的基礎模型在經過訓練后具備相當的泛化性,提升了其在不同作業環境及作業任務中的魯棒性。
在機器人產品的實際落地中,尤其在部分連續長任務或者離散抓取任務中,由于仿真器的碰撞幾何學中大多存在簡化假設,動作通過執行器和傳動裝置傳遞的方式可能并不準確,從仿真模擬器中訓練的策略遷移到機器人上,可能存在實際運行效率低下和準確性差的情況。W1搭載的跨維自研視覺-動作模型形成誤差調整的閉環,雙目作為可高頻獲取隱式3D信息的傳感器是這條閉環的重要保障。在裝配任務中,我們看到W1能夠眼手配合,操作工具完成毫米級高精準的螺絲裝配任務。
▍更遠的未來
金博士對機器人大講堂透露,跨維正在W1的基礎上,持續完善大腦+小腦+感知的各種基礎技術,積極開展軟硬件和算法的縱向研發。與此同時,跨維也基于其視覺靈巧操作的研發積累,開展產學研合作,尋求W1在科研與工業等領域的落地以及商業化的探索,逐步擴充W1的基礎技能以及提升落地成功率,最終由點帶面讓W1落地更多商業場景。
“這波機器人浪潮與以往數十年最大的不同在于機器人開始有了大腦加持,以及得益于行業過往硬件技術的持續突破,我們開始認識到有了大腦的人形機器人原來真的可以進入千家萬戶。這個改變使得當前的時代,值得熱衷于研發的我們全力以赴。”金博士說道。
基于DexVerse™ 引擎的整套方案,跨維早已具備“三維數字資產生成-數據合成與標注-物理仿真-模型訓練-模型部署”全鏈條自動化能力,掌握了空間智能與具身智能的核心底座。
“因此對于跨維而言,推出人形機器人,其實只不過是把在單個機械臂或者工作站落地的技術,換到了人形機器人這個更好的載體。”金博士總結到。