在NVIDIA GTC 2025大會(huì)上,卓馭AI的首席執(zhí)行官陳曉智帶來了一場(chǎng)別開生面的演講,主題聚焦于智能駕駛技術(shù)的最新進(jìn)展——《基于端到端世界模型的生成式智駕體驗(yàn)》。在此次演講中,卓馭不僅展示了其在智能駕駛領(lǐng)域的最新研究成果,還正式推出了一個(gè)劃時(shí)代的產(chǎn)品:可支持自然語言交互的個(gè)性化生成式智能駕駛方案——GenDrive。
卓馭認(rèn)為,高階智能駕駛不僅要追求擬人化的駕駛體驗(yàn),更要深度滿足用戶的個(gè)性化需求。正是基于這樣的理念,卓馭首次在行業(yè)內(nèi)提出了“生成式智駕”的概念,并通過GenDrive方案將其變?yōu)楝F(xiàn)實(shí)。相較于傳統(tǒng)的智能駕駛體驗(yàn),生成式智駕不僅能夠提供高度擬人化的駕駛感受,更能根據(jù)用戶的個(gè)人偏好進(jìn)行靈活調(diào)整。
傳統(tǒng)端到端智能駕駛架構(gòu)往往基于預(yù)測(cè)范式,即根據(jù)傳感器輸入預(yù)測(cè)下一步動(dòng)作,這一過程相對(duì)固定且缺乏靈活性。而卓馭的GenDrive則采用了生成式技術(shù),通過構(gòu)建世界模型來預(yù)測(cè)未來可能發(fā)生的多種場(chǎng)景,并結(jié)合用戶偏好和環(huán)境信息,從中選擇最優(yōu)的駕駛軌跡。
卓馭的端到端世界模型架構(gòu)層次分明,底層由硬件平臺(tái)支撐,包括適用于英偉達(dá)計(jì)算平臺(tái)的智駕控制器,如DRIVE Orin和Thor SoC,同時(shí)能夠適配多種類型的傳感器配置。在模型輸入層面,卓馭通過Vision Encoder和Tokenizers對(duì)傳感器數(shù)據(jù)、導(dǎo)航信息以及歷史軌跡進(jìn)行編碼,同時(shí)還將駕駛風(fēng)格和語音指令融入模型之中。
模型的輸出則涵蓋了周圍環(huán)境的語義和幾何理解,以及對(duì)未來多種可能性的預(yù)測(cè)。最終的駕駛軌跡,是在綜合用戶風(fēng)格偏好、語音指令以及環(huán)境信息后得出的最優(yōu)結(jié)果。
卓馭在訓(xùn)練端到端世界模型時(shí),采用了大模型典型的預(yù)訓(xùn)練與后訓(xùn)練相結(jié)合的方式,并實(shí)現(xiàn)了“硬件無關(guān)”的平臺(tái)化訓(xùn)練。這意味著,針對(duì)不同傳感器配置和芯片類型,只需訓(xùn)練一個(gè)模型,即可輕松部署到不同硬件上。
基于這一先進(jìn)的架構(gòu),卓馭的生成式智能駕駛方案GenDrive具備了一系列令人矚目的功能。例如,用戶可以根據(jù)自己的喜好自定義場(chǎng)景級(jí)別的駕駛風(fēng)格,包括跟車風(fēng)格、速度控制、路口轉(zhuǎn)彎和變道方式等。GenDrive還能在線學(xué)習(xí)和模仿用戶的駕駛風(fēng)格,只需利用車端算力,無需云端交互,即可自動(dòng)學(xué)習(xí)用戶的駕駛偏好。結(jié)合座艙內(nèi)的人臉識(shí)別技術(shù),GenDrive還能自動(dòng)綁定不同的用戶ID,激活相應(yīng)的駕駛風(fēng)格。
更令人驚嘆的是,GenDrive支持自然語言交互,用戶可以通過語音指令來控制駕駛風(fēng)格和具體動(dòng)作。無論是請(qǐng)求更柔和或更激進(jìn)的駕駛風(fēng)格,還是指示車輛進(jìn)入特定車道、輔路或停在指定位置,GenDrive都能準(zhǔn)確理解用戶意圖,并實(shí)時(shí)調(diào)整駕駛軌跡。
據(jù)卓馭官方透露,這一革命性的生成式智能駕駛體驗(yàn)將在今年內(nèi)搭載于相關(guān)車型上,實(shí)現(xiàn)量產(chǎn)落地。這一消息無疑為智能駕駛技術(shù)的發(fā)展注入了新的活力,也讓人們對(duì)未來智能駕駛的個(gè)性化體驗(yàn)充滿了期待。
本文鏈接:http://www.tebozhan.com/showinfo-45-11617-0.html卓馭AI發(fā)布GenDrive:個(gè)性化生成式智駕,今年量產(chǎn)上市
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com