本報訊 (記者謝嵐見習記者梁傲男)3月4日,北京智譜華章科技有限公司(以下簡稱“智譜”)發布2025開源年的首個模型——CogView4,這是首個支持生成漢字的開源文生圖模型,也是首個遵循Apache2.0協議的圖像生成模型。
記者了解到,CogView4在DPG-Bench基準測試中綜合評分排名第一,在開源文生圖模型中達到SOTA(最先進的)水平。DPG-Bench(DensePromptGraphBenchmark)是一個用于評估文本到圖像生成模型的基準測試,主要關注模型在復雜語義對齊和指令跟隨能力方面的表現。
在業內人士看來,CogView4具有兩大技術領先性。
首先,CogView4支持中英雙語提示詞輸入,擅長理解和遵循中文提示詞,是首個能夠在畫面中生成漢字的開源文生圖模型,能更好地滿足廣告、短視頻等領域的創意需求。在技術實現上,CogView4將文本編碼器從純英文的T5encoder換為具備雙語能力的GLM-4encoder,并通過中英雙語圖文進行訓練,使CogView4模型具備雙語提示詞輸入能力。
其次,CogView4支持輸入任意長度提示詞,能夠生成范圍內任意分辨率圖像,不僅使用戶創作更加自由,也提升了訓練效率。CogView4模型實現了任意長度的文本描述和任意分辨率圖像的混合訓練范式。
智譜相關人士表示:“作為國內最早的開源大模型公司,智譜始終致力于推動AI普惠。2025年是智譜開源年,我們還將陸續開源基礎模型、推理模型、多模態模型、Agent模型等。在這片孕育智慧的熱土上,我們愿作深扎的根脈,以開源為信仰,以技術為養分,托舉AGI之樹的參天成長。”
(編輯 郭之宸)
00:25 | 場景創新、技術賦能、生態協同 零... |
00:25 | 三一重工去年營收凈利雙增長 擬派... |
00:25 | 搶抓集成電路關鍵工藝材料發展機遇... |
00:25 | 醫療服務價格項目立項指南支持技術... |
00:25 | 一體化布局成效漸顯 美諾華去年凈... |
00:25 | 華立科技游戲游藝設備業務穩健發展... |
00:25 | 融創公布境外債務重組方案 “全額... |
00:25 | 構建多元化酒生活消費場景 貴州省... |
00:25 | 江蘇證監局聯合多方召開宣介會 推... |
00:25 | 公司零距離 ? 新經濟 新動能 | 濰... |
00:25 | 聚焦基金一季報 | 透視基金一季度... |
00:25 | 年內10家持牌消費金融公司“甩賣”... |
版權所有《證券日報》社有限責任公司
互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證 京B2-20250455
京公網安備 11010602201377號京ICP備19002521號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關注
掃一掃,加關注