本報訊 (記者袁傳璽)4月15日,可靈AI舉行“靈感成真”2.0模型發布會,宣布基座模型再次升級,面向全球正式發布可靈2.0視頻生成模型及可圖2.0圖像生成模型。
數據顯示,自去年6月份發布以來,可靈AI已累計完成超20次迭代,截至目前,全球用戶規模突破2200萬。來自世界各地的超1.5萬開發者和企業客戶,將可靈的API應用于不同的行業場景中。
據悉,可靈2.0模型在動態質量、語義響應、畫面美學等維度,保持全球領先;可圖2.0模型在指令遵循、電影質感及藝術風格表現等方面顯著提升。
快手高級副總裁、社區科學線負責人蓋坤介紹,兩款模型在團隊內部的多項勝負率評測中,均穩居業內第一。例如在文生視頻領域,可靈2.0對比谷歌Veo2的勝負比為205%,對比Sora的勝負比達367%,在文字相關性、畫面質量、動態質量等維度上顯著超越對手。
作為全球首個用戶可用的DiT視頻生成模型,截至目前,可靈AI全球用戶規模已突破2200萬,累計生成1.68億個視頻及3.44億張圖片素材。自去年6月上線至今的10個月時間里,可靈AI的月活用戶數量增長25倍。
一直以來,可靈AI致力于提升模型基礎質量和模型效果,并引入更多創新功能,以滿足用戶的多樣化需求。在本次2.0模型的迭代中,可靈AI正式發布AI視頻生成的全新交互理念Multi-modal Visual Language(MVL),讓用戶能夠結合圖像參考、視頻片段等多模態信息,將腦海中包含身份、外觀、風格、場景、動作、表情、運鏡在內的多維度復雜創意,直接高效地傳達給AI。
基于MVL理念,可靈AI正式推出多模態編輯功能。“從今天起,大家可以在可靈AI的平臺上體驗我們的多模態編輯能力。用戶可以非常直接地把自己的想法用圖像等方式作為輸入,生成符合自己想法的創意視頻。”蓋坤介紹,MMW(多模態描述子)將不只局限于圖片和視頻,也可以引入其它模態的信息,例如聲音、運動軌跡等,讓用戶實現更加豐富的表達。
基于MVL這一全新交互方式,發布會現場,快手副總裁、可靈AI負責人張迪發布了全新的可靈2.0大師版,在語義響應、動態質量、畫面美學等方面顯著提升生成效果。
“可靈2.0大師版不僅僅是一次簡單的技術升級,更是一次全方位的體驗躍升。”張迪介紹,可靈2.0大師版實現了技術、體驗、美學的三重突破。
除了C端訂閱用戶,可靈AI也面向B端商家提供API接入等服務。目前,可靈AI已與包括小米、亞馬遜云科技、阿里云、Freepik、藍色光標等在內的數千家國內外企業客戶建立了合作關系。
蓋坤披露,來自世界各地的超1.5萬開發者,已將可靈的API應用于不同的行業場景中,累計生成的圖像數量約1200萬個,生成的視頻素材超過4000萬個。
如今,可靈正在成為AI時代視頻創作的新基礎設施。AIGC技術的迅猛發展,也正在重構包括廣告營銷、專業創作、影視、娛樂創意等在內的多個行業。
面向未來,蓋坤表示,可靈AI將持續大力推動技術創新,用人與AI交互的全新語言,幫助用戶實現復雜創意的精確表達,“我們的初心,是讓每個人都能用AI講出好的故事,我們也真切地希望這一天更快到來。”他表示。
(編輯 張昕)
15:18 | 諾誠健華新一代泛TRK抑制劑Zurletr... |
15:18 | 國盛金控:公司吸收合并全資子公司... |
15:18 | 國機精工:目前尚不能準確預計泊片... |
15:18 | 國機精工:公司軸承業務訂單保持平... |
15:18 | 國機精工:2025年預算目標是基于當... |
15:18 | 國機精工:2025年投資項目包括伊濱... |
15:18 | 鋼研納克:公司將繼續在包括分析儀... |
15:17 | 富特科技:截至2025年3月31日公司... |
15:17 | 東方中科:公司為包括半導體設計公... |
15:17 | 東方中科:公司控股股東擬通過公開... |
15:17 | 德明利:將繼續依托存儲主業優勢,... |
15:17 | 德明利:公司將繼續深化國內供應鏈... |
版權所有《證券日報》社有限責任公司
互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證 京B2-20250455
京公網安備 11010602201377號京ICP備19002521號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關注
掃一掃,加關注