本報(bào)記者 劉釗
汽車行業(yè)開始進(jìn)入全新的大模型研發(fā)浪潮。
4月14日,廣州小鵬汽車科技有限公司(以下簡稱“小鵬汽車”)在中國香港舉辦AI技術(shù)分享會(huì),首次披露正在研發(fā)720億參數(shù)的超大規(guī)模自動(dòng)駕駛大模型,即“小鵬世界基座模型”。未來,小鵬汽車將通過云端蒸餾小模型的方式將基模部署到車端,給“AI汽車”配備全新的大腦。這款模型同時(shí)也將賦能小鵬汽車的AI機(jī)器人、飛行汽車等。
小鵬汽車自動(dòng)駕駛負(fù)責(zé)人李力耘介紹,小鵬世界基座模型是一個(gè)以大語言模型為骨干網(wǎng)絡(luò),使用海量優(yōu)質(zhì)駕駛數(shù)據(jù)訓(xùn)練的多模態(tài)大模型,具備視覺理解能力、鏈?zhǔn)酵评砟芰蛣?dòng)作生成能力。通過強(qiáng)大的強(qiáng)化學(xué)習(xí)訓(xùn)練,基座模型不斷自我進(jìn)化,將逐步發(fā)展出媲美甚至超越人類的自動(dòng)駕駛技術(shù)。
基座模型具備長思維鏈推理能力
早在2024年下半年,小鵬汽車已開始面向L4級別的自動(dòng)駕駛研發(fā)全新的“AI大腦”,即小鵬世界基座模型。
李力耘透露,為了研發(fā)基座模型,小鵬汽車早在去年就開始布局AI基礎(chǔ)設(shè)施,現(xiàn)已建成國內(nèi)汽車行業(yè)首個(gè)萬卡智算集群,用以支持基座模型的預(yù)訓(xùn)練、后訓(xùn)練、模型蒸餾、車端模型訓(xùn)練等任務(wù),小鵬汽車將這套從云到端的生產(chǎn)流程稱之為“云端模型工廠”。
工廠“車間”涵蓋基座模型預(yù)訓(xùn)練和后訓(xùn)練(強(qiáng)化學(xué)習(xí)訓(xùn)練)、模型蒸餾、車端模型預(yù)訓(xùn)練到部署上車的完整生產(chǎn)鏈路。“云端模型工廠”采用強(qiáng)化學(xué)習(xí)、模型蒸餾的技術(shù)路線,能夠高效生產(chǎn)“小身材、大智商”的端側(cè)模型,甚至為不同需求的汽車定制不同的“大腦”,讓“千人千面”的模型研發(fā)成為可能。
目前,小鵬汽車“云端模型工廠”擁有10EFLOPS的算力,集群運(yùn)行效率常年保持在90%以上,從云到端的全鏈路迭代周期可達(dá)平均5天一次。
小鵬汽車研發(fā)團(tuán)隊(duì)利用優(yōu)質(zhì)自動(dòng)駕駛訓(xùn)練數(shù)據(jù),先后開發(fā)了多個(gè)尺寸的基座模型,目前已經(jīng)著手推進(jìn)72B超大規(guī)模參數(shù)世界基座模型的研發(fā),參數(shù)量是主流VLA模型的35倍左右。
據(jù)小鵬世界基座模型負(fù)責(zé)人介紹,小鵬世界基座模型的一大優(yōu)勢是具備鏈?zhǔn)酵评砟芰Γ诔浞掷斫猬F(xiàn)實(shí)世界的基礎(chǔ)上,能夠像人類一樣進(jìn)行復(fù)雜的常識推理,并將推理結(jié)果轉(zhuǎn)化為行動(dòng),例如輸出方向盤、剎車等控制信號,實(shí)現(xiàn)和物理世界的交互。未來,經(jīng)由基座模型的賦能,智能駕駛系統(tǒng)有望從“模仿人類”進(jìn)化到“超越人類”,最終能夠處理全場景的自動(dòng)駕駛問題,包括一些模型從來沒在訓(xùn)練數(shù)據(jù)中遇到的問題。
從設(shè)計(jì)之初,小鵬汽車就將基座模型定位為一個(gè)可以泛化到多種具身終端的基座模型。李力耘對《證券日報(bào)》記者表示:“小鵬世界基座模型是小鵬汽車自動(dòng)駕駛真正走向L3、L4的基礎(chǔ),也會(huì)是未來小鵬汽車所有物理AI終端的通用模型。”后續(xù),小鵬世界基座模型將全面賦能小鵬AI體系全圖譜,應(yīng)用到小鵬汽車的AI汽車、AI機(jī)器人、飛行汽車上。
小鵬開啟AI時(shí)代模型生產(chǎn)新范式
小鵬汽車從2024年開始搭建AI基礎(chǔ)設(shè)施,當(dāng)前已建立起萬卡規(guī)模的智能算力集群,是目前國內(nèi)汽車行業(yè)最大的自動(dòng)駕駛算力集群。小鵬汽車的算力儲備達(dá)到10 EFLOPS,集群利用率常年高達(dá)90%以上,高峰時(shí)期的運(yùn)行效率甚至達(dá)到98%。
小鵬世界基座模型上述負(fù)責(zé)人介紹,多模態(tài)模型訓(xùn)練的主要瓶頸不僅是GPU,也需要解決數(shù)據(jù)訪問的效率問題。小鵬汽車自主開發(fā)了底層的數(shù)據(jù)基礎(chǔ)設(shè)施,使數(shù)據(jù)上傳規(guī)模提升22倍、訓(xùn)練中的數(shù)據(jù)帶寬提升15倍;通過聯(lián)合優(yōu)化GPU/CPU以及網(wǎng)絡(luò)I/O,最終使模型訓(xùn)練速度提升了5倍。目前,小鵬汽車用于訓(xùn)練基座模型的視頻數(shù)據(jù)量高達(dá)2000萬clips,這一數(shù)字今年將增加到2億clips。
基座模型研發(fā)是小鵬汽車“AI化”轉(zhuǎn)型的重要一步,不過,即便來到“大模型時(shí)代”,過去“規(guī)則時(shí)代”的領(lǐng)先經(jīng)驗(yàn)仍在發(fā)揮作用。在開發(fā)強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)模型時(shí),研發(fā)團(tuán)隊(duì)基于規(guī)則經(jīng)驗(yàn)設(shè)計(jì)了獎(jiǎng)勵(lì)函數(shù),將規(guī)則時(shí)代的沉淀轉(zhuǎn)化為了訓(xùn)練基座模型的生產(chǎn)力。
同時(shí),小鵬汽車已經(jīng)著手開發(fā)世界模型,作為“云端模型工廠”的重要一環(huán),支持基座模型的性能優(yōu)化。據(jù)了解,小鵬的世界模型是一種實(shí)時(shí)建模和反饋系統(tǒng),能夠基于動(dòng)作信號模擬出真實(shí)環(huán)境狀態(tài),渲染場景,并生成場景內(nèi)其他智能體(也即交通參與者)的響應(yīng),從而構(gòu)建一個(gè)閉環(huán)的反饋網(wǎng)絡(luò),幫助基座模型不斷進(jìn)化,逐漸突破過去“模仿學(xué)習(xí)”的天花板。
(編輯 喬川川)
多地召開“新春第一會(huì)” 高質(zhì)量發(fā)展、改革創(chuàng)新等被“置頂”
隨著春節(jié)假期結(jié)束,全國多地在蛇年首個(gè)工作……[詳情]
版權(quán)所有《證券日報(bào)》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報(bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日報(bào)社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注