蘋果FastVLM模型開放試用:Mac用戶秒享“閃電級”視頻字幕,生成速度較同類AI快85倍
9 月 2 日消息, 科技 媒體 9to5Mac 昨日(9 月 1 日)發布博文,報道稱 蘋果 公司在 Hugging Face 平臺上,推出了 FastVLM 視覺語言模型的瀏覽器試用版。
IT之家注:FastVLM 以其“閃電般”的視頻字幕生成速度著稱,只要用戶擁有搭載 Apple Silicon 芯片的 Mac 設備,即可輕松上手體驗這一前沿技術。
FastVLM 模型的核心優勢在于其卓越的速度和效率。該模型利用蘋果自研的開源機器學習框架 MLX 進行優化,專為 Apple Silicon 芯片設計。與同類模型相比,FastVLM 模型體積僅為三分之一左右,不過在視頻字幕生成速度上卻能提升 85 倍。
蘋果此次發布的 FastVLM-0.5B 輕量版,可在瀏覽器內直接加載運行。根據該媒體實測,在 16GB M2 Pro MacBook Pro 上,首次加載模型需數分鐘,不過在啟動后,便能精準描述畫面中的人物、環境、表情及各種物體。
值得一提的是,該模型支持本地運行,所有數據均在設備端處理,無需上傳至云端,從而保障了用戶的數據隱私。
FastVLM 的本地運行能力及其低延遲特性,讓其在可穿戴設備和輔助技術領域展現出巨大潛力。例如,在虛擬攝像頭應用中,該工具能即時詳細描述多場景內容,FastVLM 未來有望成為這些設備的核心技術,為用戶提供更智能、更便捷的交互體驗。
【來源: IT之家 】