阿里雲近日宣佈聚焦音視頻內容的AI新品“通義聽悟”正式上線,成爲國內首個開放公測的大模型應用產品。公測期間,用戶可領取00小時以上聽悟免費轉寫時長。據瞭解,通義聽悟接入了通義千問大模型的理解與摘要能力,可成爲用戶工作學習中的得力AI助手,幫助隨時隨地高效完成對音視頻內容的轉寫、檢索、摘要和整理。
點擊查看:阿里雲產品優惠鏈接
通義聽悟是一款工作學習AI助手,它瞄準具有高知識附加值的音視頻內容場景,比如開會、上課、訪談、培訓、面試、直播、看視頻、聽播客等,能通過大模型等最新AI技術快速提煉和沉澱知識。通義聽悟還會與阿里雲盤打通,一鍵就能轉寫雲盤上的音視頻內容,公測期間註冊的聽悟用戶後續還將獲得更大的阿里雲盤存儲空間,在雲盤內在線播放視頻時也可自動出字幕。
通義聽悟集成了阿里最先進的語音和語言技術。其內置阿里新一代工業級語音識別模型,識別準確率在多箇權威中文數據集上名列第一;融合自研語音語義多模態說話人算法,能對0人以上說話場景進行角色區分;接入通義千問大模型後,能夠對上萬字的音視頻內容進行摘要總結,事實準確與要點完備性國內領先,支持跨多音視頻內容的精準問答理解。
此外,阿里雲再次送出人人都能用上的AI“大禮包”。此前國內語音廠商AI轉寫定價達9.8元每小時,而通義聽悟用戶可通過每日登陸等多種任務領取免費轉寫時長。
據瞭解,通義聽悟除個人版本外,還有企業應用。此前,通義聽悟企業版已在阿里集團內部被廣泛使用,幫助減少了大量會議記錄和整理的工作,受到好評。同時,通義聽悟的能力也可嵌進各類音視頻平臺,形成實時字幕、智能摘要等,典型應用如釘釘的“釘閃記”背後便集成了聽悟。未來聽悟還將在夸克APP、阿里雲盤等端口提供服務。