1. 機(jī)器人算法:融合機(jī)械+自控+ICT 的邊界
本章解釋機(jī)器人學(xué)科融合的問題。機(jī)械、輕工、家電、汽車背景的產(chǎn)業(yè)公司,認(rèn)為傳 感器已經(jīng)相對成熟,好奇軟件算法決定的智能化程度。TMT 背景的科技公司,往往對機(jī) 械零組件、工程化,較為陌生。機(jī)器人與能源的關(guān)系問題,也是未解之謎。
1.1 三個(gè)流派:機(jī)械,自控,ICT
存在三個(gè)機(jī)器人的流派:機(jī)械、自動(dòng)控制、ICT,三者的思路、代表人物、代表產(chǎn)品、 里程碑著作如下表。一言以蔽之,機(jī)械圈核心思路是結(jié)構(gòu)與力學(xué),自動(dòng)控制圈核心思路是 系統(tǒng)與規(guī)劃;ICT 圈核心發(fā)力點(diǎn)是智能與生態(tài)。
依照三大流派的思路,可以得到主流機(jī)器人倚重的知識和流派。例如豐田機(jī)器人、波 士頓動(dòng)力 Atlas、UCLA Artmiss 主要依靠自動(dòng)控制,不同程度的倚重機(jī)械與 ICT。而近期 的特斯拉 Optimus、Figure1、宇樹科技、云深處科技,主要倚重 ICT 流派的思路,也融 入相對成熟的機(jī)械、自動(dòng)控制思路。宇樹科技、云深處都強(qiáng)調(diào)強(qiáng)化學(xué)習(xí)、多模態(tài),前者還 額外強(qiáng)調(diào)本體感知控制。這都是近年 AI 的思路。
1.2 當(dāng)前算法:機(jī)械與自控圈認(rèn)為的“堵點(diǎn)”
“堵點(diǎn)”或在算法。機(jī)械流派、自動(dòng)控制流派發(fā)展機(jī)器人過程中,自然會(huì)發(fā)現(xiàn)最需要 “大局觀”的運(yùn)動(dòng)控制是“堵點(diǎn)”。而運(yùn)動(dòng)控制又是“路徑規(guī)劃”的基礎(chǔ)。 當(dāng)前算法主要包括自上而下決策部分、自下而上傳感部分。大模型與端到端 AI,實(shí)際 上會(huì)讓“自上而下”部分做較大改變。1)以 Atlas、Artemiss 機(jī)器人為例:傳感器模塊將機(jī)器人狀態(tài)量(廣義坐標(biāo)、力/力矩、接觸狀態(tài)等)向運(yùn)動(dòng)規(guī)劃器和全身控制器傳送, 運(yùn)動(dòng)規(guī)劃器通過機(jī)器人自身選擇的動(dòng)態(tài)模型、穩(wěn)定性判定和優(yōu)化方法進(jìn)行步態(tài)規(guī)劃,落腳 點(diǎn)軌跡和關(guān)節(jié)軌跡也由此計(jì)算得出。2)若采用大模型甚至端到端 AI 改變上述流程,缺點(diǎn) 是消耗資源多了,“幻覺”即錯(cuò)誤或也增加,換來的優(yōu)點(diǎn)是“智能化”大幅增加。即上述 “自上而下決策”部分,可更多的體現(xiàn)“大模型”的特征:自動(dòng)做決策,創(chuàng)造力增強(qiáng)。
如果詳細(xì)的論述機(jī)器人主要算法,可總結(jié)為下表。值得說明的是: 1)主要探討大模型/端到端之前的成熟算法(其中三維、NLP 已經(jīng)涉及大模型); 2)規(guī)劃算法可以采用大模型/端到端明顯優(yōu)化,因此沒有詳細(xì)展開; 3)運(yùn)動(dòng)控制算法差異化較大,此處采用典型代表,例如 Artemiss 和 Atlas 機(jī)器人。
既然主要算法已經(jīng)分解出來,那么問題就轉(zhuǎn)化成:上述 AI 算法,若應(yīng)用在機(jī)器人, 哪些可以伴隨 AI 產(chǎn)業(yè)的發(fā)展,明顯提高智能化。尤其大模型、端到端算法的使用。
1.3 未來算法的劃分:GPU 數(shù)學(xué),大模型,端到端
機(jī)器人算法,在未來,哪些部分可以大模型化?哪些部分可以端到端? 我們繪制機(jī)器人三大分支(感知和定位、控制和決策、規(guī)劃)AI 算法的情況。這也是 未來機(jī)器人智能化程度提升的示意圖。結(jié)論是,幾乎所有分支都可以考慮大模型化,當(dāng)前 部分領(lǐng)域已經(jīng)可以“端到端”,尤其規(guī)劃的部分。 值得說明的是: 1)高時(shí)效場景適合小模型,而高復(fù)雜度/高精度場景適合大模型 2)線性系統(tǒng)一般用小模型,復(fù)雜非線性系統(tǒng)可以用大模型。
2.機(jī)器人工程:融合智能車,鋪路未來低空
第一章解釋技術(shù),本章解釋產(chǎn)業(yè)數(shù)個(gè)關(guān)鍵問題。機(jī)器人產(chǎn)業(yè)與國內(nèi)已經(jīng)甚為發(fā)達(dá)的 AD/ADAS 產(chǎn)業(yè),有約 2-3 年的時(shí)間差,可以歷史借鑒 AD/ADAS 的發(fā)展過程。 兩個(gè)重要議題。一方面,投資者不必?fù)?dān)心機(jī)器人蓬勃發(fā)展刺激過于旺盛的產(chǎn)能,因?yàn)?其借鑒了此前“AD/ADAS”領(lǐng)域的經(jīng)驗(yàn),并可以后續(xù)“技術(shù)外溢”到“低空經(jīng)濟(jì)”。另 一方面,朝向“人形機(jī)器人”發(fā)展過程中,被低估的是行業(yè)機(jī)器人、消費(fèi)機(jī)器人,這類似 科技圈“攀登珠峰,沿途下蛋”的說法。而 2025 年可能就是這些邏輯得到證明的開始。
2.1 歷史借鑒:智能車 ADAS/AD 領(lǐng)域,或出現(xiàn)“智能井噴”
發(fā)展機(jī)器人,有一個(gè)非常好的歷史借鑒,即智能車的歷史過程。業(yè)界普遍認(rèn)為兩者產(chǎn) 業(yè)成熟度相差大約 2-3 年。 多域融合的代表:2017 年特斯拉 Model 3:特斯拉在 Model 3 上突破了功能域的 框架,實(shí)現(xiàn)了中央計(jì)算 + 區(qū)域控制器框架,將 IVI(信息娛樂系統(tǒng))、ADAS/Autopilot (輔助駕駛系統(tǒng))和車內(nèi)外通信 3 部分整合為一體,成為汽車電子架構(gòu)向中央計(jì)算式演變 的重要里程碑。后續(xù) 2023 年廣汽星靈架構(gòu)、2023 年比亞迪璇璣架構(gòu)、2023 年零跑 LEAP 3.0 架構(gòu)都是重要證據(jù)。 傳感器前融合的代表:2019 年毫米波雷達(dá)突破。1)2019 年 5 月底,森思泰克 77GHz 車載毫米波雷達(dá)隨著一汽紅旗 HS5 的上市,成為國內(nèi)較早 “上路” 的 ADAS 毫 米波雷達(dá)傳感器。2)類似的,2019 年,行易道 3 月實(shí)現(xiàn)了支持 AEB 功能的 77GHz 中 程雷達(dá)裝車上路。6 月該雷達(dá)具備了測高功能、自校準(zhǔn)功能并面向數(shù)據(jù)融合開發(fā),10 月又 全新發(fā)布了 77GHz 近程毫米波雷達(dá) ASRR100 和 77GHz 中程毫米波雷達(dá) AMRR112。 后續(xù),5R1V(5 毫米波雷達(dá) 1 攝像頭)、5R5V(5 毫米波雷達(dá) 5 攝像頭)、4D 成像毫 米波雷達(dá)(理想 L7 2 片級聯(lián) 4D 成像雷達(dá) STA77-6 )的量產(chǎn),都是傳感器前融合的重 要證據(jù)。
行泊一體化的代表:TI TDA4, Nvidia Xavier/Orin,2022 年后大規(guī)模量產(chǎn)。1)小 鵬 P7 搭載英 Nvidia Xavier 芯片,實(shí)現(xiàn)了高速場景下的上下匝道、低速場景下的自動(dòng)泊 車及代客泊車等功能。2) Nvidia Orin 于 2022 年開始量產(chǎn)并應(yīng)用于行泊一體化方案, 實(shí)現(xiàn)高階智能駕駛功能,如城市 NOA、自動(dòng)泊車等。3)根據(jù)高工智能汽車研究院監(jiān)測數(shù) 據(jù),2022 年中國市場乘用車前裝標(biāo)配搭載行泊一體域控制器交付上險(xiǎn)為 77.98 萬輛,同 比增長 99.63%,搭載率目前為 3.91%,當(dāng)時(shí)處于市場爆發(fā)前期。行泊一體化的其他案例 包括 TI TDA4 方案、地平線 J5 與比亞迪部分車型合作等。 大模型端到端的代表: 2023 年熱議,2024 年多家宣稱“端到端”量產(chǎn)。 1) 2020-2022 年,特斯拉 AI Day 重點(diǎn)描述了 BEV、占用網(wǎng)絡(luò) Occupancy Network,這是 大模型和端到端的基礎(chǔ)。2) CVPR2023 最佳論文之一有關(guān)端到端,即《Planningoriented Autonomous Driving》(以路徑規(guī)劃為導(dǎo)向的自動(dòng)駕駛)。上海人工智能實(shí)驗(yàn) 室、武漢大學(xué)及商湯科技聯(lián)合論文提出了感知決策一體化的端到端自動(dòng)駕駛大模型 UniAD。3)2024 年多家領(lǐng)軍公司宣布應(yīng)用“端到端”量產(chǎn)。小鵬汽車在 2024 年 5 月 稱發(fā)布了國內(nèi)較早量產(chǎn)上車的端到端大模型,成為行業(yè)較早量產(chǎn)端到端大模型的車企。華 為在 2024 年的智能汽車解決方案發(fā)布會(huì)上發(fā)布 ADS 3.0 系統(tǒng),采用端到端架構(gòu) GOPDP,將 GOD 及 PDP 網(wǎng)絡(luò)升級為端到端神經(jīng)網(wǎng)絡(luò)。理想汽車智能駕駛副總裁郎咸朋表 示,對智駕核心的思路是 “端到端 + 大模型”,也就是 “系統(tǒng) 1 + 系統(tǒng) 2” 的理念, 并且認(rèn)為這種方式更接近人類駕駛。