(資料圖)
【億邦原創】阿里云大模型應用產品持續升級。
8 月 2 日,阿里云通義聽悟上線了三大新功能,包括國內音視頻 AI 領域首創的視頻自動提取 PPT,以及瀏覽器插件、釘釘和微信小程序,幫助用戶在 PC 和移動端隨時隨地聽懂、理解、閱讀各類音視頻內容,提升職場人士和學生的工作學習效率。
今年 6 月,阿里云首次宣布通義聽悟開放公測。此次升級,在原有實時記錄、音視頻文件轉寫、全文概要、章節速覽等功能之上,新增 " 提取 PPT" 功能。這一功能通過引入視覺 AI 算法,自動將 PPT 講解視頻分割為演示文稿,并對每頁 PPT 進行要點總結,形成一份圖文并茂的大綱,解決培訓、網課學習等場景 " 求 PPT 難 " 的問題。
通義聽悟還增加了瀏覽器插件和移動端的支持。
用戶開會、上網課、看直播、看視頻時,Chrome 和 Edge 瀏覽器插件功能可全程錄制,并實時生成雙語字幕,幫助用戶更輕松地瀏覽視頻內容。
瀏覽器插件可實時生成雙語懸浮字幕在移動端,通義聽悟釘釘和微信小程序不僅支持 PC 端的基礎功能,還可以一鍵轉寫手機和聊天記錄的音視頻文件,僅需一部手機即可記錄、回顧和整理音視頻內容。
為了讓更多用戶體驗到這些功能,本次新功能上線期間,阿里云繼續聯合各大平臺和社區推出定制口令碼,用戶根據口令碼可隨機抽取 20h、30h、66h、88h、100h 的免費轉寫時長。
據了解,通義聽悟集成了阿里云先進的語音、語言和視覺 AI 技術,未來還將陸續上線適用于更多場景的新功能。
通義聽悟產品及研發負責人鄢志杰表示:" 繼語音 AI 與大語言模型碰撞出火花后,我們持續將視覺 AI 引入通義聽悟這一創新產品,圍繞人們工作和學習中的音視頻內容,希望通過全新的體驗成為大家的 AI 助手。"