本報訊 (記者李喬宇)4月24日,昆侖萬維科技股份有限公司(以下簡稱“昆侖萬維”)宣布正式開源多模態(tài)推理模型的全新升級版本——Skywork-R1V2.0(以下簡稱“R1V2.0”)。
昆侖萬維披露的公告顯示,Skywork-R1V2.0是當(dāng)前最均衡兼顧視覺與文本推理能力的開源多模態(tài)模型,該多模態(tài)模型在高考理科難題的深度推理與通用任務(wù)場景中均表現(xiàn)優(yōu)異,實現(xiàn)多模態(tài)大模型的“深度+廣度”統(tǒng)一。
據(jù)悉,升級后的R1V2.0模型理科學(xué)科題目(數(shù)學(xué)、物理、化學(xué))推理效果拔群,能夠成為免費AI解題助手;38B權(quán)重+技術(shù)報告全面開源,推動多模態(tài)生態(tài)建設(shè);能夠?qū)崿F(xiàn)多模態(tài)獎勵模型(SkyworkVLReward)與混合偏好優(yōu)化機制(MPO),全面提升模型泛化能力;選擇性樣本緩沖區(qū)機制(SSB),突破強化學(xué)習(xí)“優(yōu)勢消失”瓶頸。
據(jù)介紹,在多個權(quán)威基準(zhǔn)測試中,R1V2.0相較于R1V1.0在文本與視覺推理任務(wù)中均實現(xiàn)顯著躍升。無論是專業(yè)領(lǐng)域任務(wù),如數(shù)學(xué)推理、編程競賽、科學(xué)分析,還是通用任務(wù),如創(chuàng)意寫作與開放式問答,R1V2.0都呈現(xiàn)出極具競爭力的表現(xiàn)。
為實現(xiàn)多模態(tài)大模型在“深度推理”與“通用能力”之間的最佳平衡,R1V2.0引入了全新的“多模態(tài)獎勵模型Skywork-VLReward”及“規(guī)則驅(qū)動的混合強化訓(xùn)練機制”,在顯著增強推理能力的同時,進一步穩(wěn)固了模型在多任務(wù)、多模態(tài)場景中的穩(wěn)定表現(xiàn)與泛化能力。
(編輯 張明富)
多地召開“新春第一會” 高質(zhì)量發(fā)展、改革創(chuàng)新等被“置頂”
隨著春節(jié)假期結(jié)束,全國多地在蛇年首個工作……[詳情]
22:09 | 五糧液連續(xù)十年穩(wěn)增長 回報股東現(xiàn)... |
22:03 | AI重構(gòu)消費電子產(chǎn)業(yè)價值鏈 天音控... |
22:01 | 中山公用2024年歸母凈利潤11.99億... |
21:59 | 中證投服中心公開提名獨立董事并征... |
21:58 | 卓馭科技陳曉智:預(yù)埋L3級硬件 深... |
21:57 | 國際化戰(zhàn)略成效顯著 望變電氣2024... |
21:56 | 零跑汽車朱江明:智能駕駛是未來制... |
21:56 | 廣汽集團與廣州工控集團深化戰(zhàn)略合... |
21:54 | 眾安信科攜手中移金科揭牌“AI+保... |
21:52 | 君正集團:第六屆監(jiān)事會第九次會議... |
21:52 | 格林達:第三屆董事會第九次會議決... |
21:52 | 華嶸控股:第九屆監(jiān)事會第二次會議... |
版權(quán)所有《證券日報》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀法律申明,風(fēng)險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注