最近,階躍星辰和吉利汽車搞了個大動作,直接把兩家聯手研發的兩款"全能型"人工智能模型免費開放給全球開發者。這事兒簡單來說就是:以后不管你是技術極客還是創業團隊,都能用上這兩套頂尖工具,相當于普通人突然拿到了好萊塢特效團隊的資源包,門檻大大降低。

先說說第一個寶貝——視頻生成模型Step-Video-T2V。舉個例子,你開電動車遇到暴雨天,路上突然沖出來一只流浪貓。現在的自動駕駛系統可能沒見過這種極端場景,但吉利用這個模型能瞬間生成幾百段"虛擬車禍現場",讓AI在模擬訓練中學會緊急避讓。更厲害的是,這模型能直接輸出高清視頻,清晰度相當于手機拍的短視頻,而且一口氣能生成7秒連貫畫面(204幀),比市面上其他開源工具強一大截。
另一個語音交互模型Step-Audio就更貼心了。想象一下:你開車趕時間說"導航,快遲到了",車機不光會規劃路線,還會像副駕的老友一樣問"要不要放點輕音樂緩緩?"。更絕的是,系統能聽懂四川話、粵語等方言,還能定制專屬語音——比如用你家娃的笑聲當提示音,或者把AI聲音調成山泉流水聲,堵車時瞬間切換成冥想模式。這些過去要花大價錢定制的功能,現在開源后很可能變成10萬元級家用車的標配。

吉利這次可不是突然搞黑科技。他們早就在布局"智能汽車AI全家桶":從自研芯片到衛星聯網,從智能座艙到云端數據中心。去年發布的星睿AI大模型就像個老司機教練,專門給自動駕駛系統出難題——比如在立體車庫里模擬突然滾出來的輪胎,或是大雪天識別模糊的交通標志。現在加上新開源的視頻和語音模型,相當于給這個教練配了更強大的教具。
實際開車時你會發現,這些技術正在悄悄改變體驗:比如雨天系統自動縮短跟車距離,地庫泊車時車機主動提醒"左后方有購物車",甚至等紅燈時AI突然問"要續訂保養套餐嗎?剛發現你常去的4S店有活動"。今年3月吉利還要放大招,據說要讓人工智能滲透到方向盤反饋、底盤調校這些核心環節。開過銀河E8的人可能已經發現,車機語音助手能像真人一樣插話打斷:"您剛說取消導航,是要改去充電站嗎?"
這種技術開放最實在的好處是——你我未來買的車會更"聰明"且更便宜。就像手機市場當年開源安卓系統后,千元機也能用上旗艦功能。現在車企們拿著開源模型,既能快速開發方言語音包,也能低成本訓練自動駕駛系統。說不定過兩年,十萬塊的國產車就能實現"說句四川話指揮自動泊車,車機還能用東北腔跟你嘮嗑"的魔幻場景了。