本報記者 王麗新 見習記者 陳瀟
繼史無前例的大降價后,阿里云再次送出人人都能用上的AI“大禮包”。6月1日,在阿里云峰會·粵港澳大灣區分會場,阿里云公布了通義大模型的進展,聚焦音視頻內容的AI新品“通義聽悟”正式上線,成為國內首個開放公測的大模型應用產品。
圖為阿里云發布AI新品“通義聽悟”企業/供圖
“換一種方式,讓音視頻可以被輕松閱讀、整理和分享。”阿里云CTO周靖人介紹,通義聽悟是一款工作學習AI助手,它瞄準具有高知識附加值的音視頻內容場景,比如開會、上課、訪談、培訓、面試、直播、看視頻、聽播客等,能通過大模型等最新AI技術快速提煉和沉淀知識。
據了解,通義聽悟接入了通義千問大模型的理解與摘要能力,可高效完成對音視頻內容的轉寫、檢索、摘要和整理,比如,用大模型自動做筆記、整理訪談、提取PPT等。
根據現場演示,通義聽悟可高準確度生成會議記錄、區分不同發言人,還可以在一秒內給音視頻劃分章節并形成摘要、總結全文及每個發言人的觀點、整理關注重點和待辦事項。此外,大模型一鍵提取PPT、針對多個音視頻內容向AI提問、概括特定段落等功能也將于近期上線。
針對一些細分場景,通義聽悟還設置了不少“寶藏功能”:打開Chrome插件,外語學習者和聽障人士可以借助雙語懸浮字幕條隨時隨地看無字幕視頻;日程沖突時,通義聽悟還可成為職場人士的“開會替身”,在靜音情況下入會AI可代為記錄會議、整理要點;轉寫結果可下載為字幕文件,方便新媒體從業者視頻后期制作;通義聽悟梳理的問答回顧可以讓記者、分析師、律師、HR等群體整理訪談更高效。
通義聽悟另一顯著優勢是,與阿里云盤打通,一鍵就能轉寫云盤上的音視頻內容,公測期間注冊的用戶后續還將獲得更大的阿里云盤存儲空間,在云盤內在線播放視頻時可自動出字幕。
周靖人介紹,通義聽悟集成了阿里最先進的語音和語言技術。其內置阿里新一代工業級語音識別模型,識別準確率在多個權威中文數據集上名列第一;融合自研語音語義多模態說話人算法,能對10人以上說話場景進行角色區分;接入通義千問大模型后,能夠對上萬字的音視頻內容進行摘要總結,事實準確性與要點完備性在國內領先,支持跨多音視頻內容的精準問答理解。
值得一提的是,公測期間,阿里云官方微博、微信及各大平臺社區還會發放大量20小時轉寫口令碼,用戶獲得的福利權益可累加,一年內有效,免費時長達100小時以上。
據了解,通義聽悟聽悟除個人版本外,還有企業級應用。此前,通義聽悟企業版已在阿里集團內部廣泛使用,幫助使用者減少了大量會議記錄和整理的工作,廣受好評。同時,通義聽悟的能力也可嵌進各類音視頻平臺,形成實時字幕、智能摘要等,釘釘的“釘閃記”就是集成了通義聽悟的功能。未來,通義聽悟還將在夸克APP、阿里云盤等端口提供服務。
(編輯 汪世軍)
20:26 | 云天化:第九屆監事會第三十八次會... |
20:26 | 新筑股份:第八屆董事會第二十七次... |
20:26 | 上港集團:第三屆董事會第五十五次... |
20:26 | 石頭科技:第三屆監事會第五次會議... |
20:26 | 利柏特:第五屆董事會第十四次會議... |
20:26 | 利柏特:第五屆監事會第十四次會議... |
20:26 | 云天化:第九屆董事會第四十三次(... |
20:26 | 凌霄泵業:第十一屆董事會第十一次... |
20:26 | 江山歐派:第五屆董事會第十一次會... |
20:26 | 海立股份:第十屆董事會第十二次會... |
20:26 | 安必平:第四屆監事會第七次會議決... |
20:26 | 深科技:第十屆董事會第九次會議決... |
版權所有證券日報網
互聯網新聞信息服務許可證 10120180014增值電信業務經營許可證B2-20181903
京公網安備 11010202007567號京ICP備17054264號
證券日報網所載文章、數據僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網站電話:010-83251800 網站傳真:010-83251801電子郵件:xmtzx@zqrb.net
掃一掃,即可下載
掃一掃,加關注
掃一掃,加關注