欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

蘋果攜手復旦大學推 StreamBridge 端側視頻大語言模型框架

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

5 月 13 日消息, 科技 媒體 marktechpost 今天(5 月 13 日)發布博文,報道稱 蘋果 公司聯合復旦大學, 推出 StreamBridge 端側視頻大語言模型(Video-LLMs)框架,助力 AI 理解直播流視頻。

直播流視頻理解的挑戰與需求

傳統視頻大語言模型擅長處理靜態視頻,但無法適應機器人技術和自動駕駛等需要實時感知的場景,在這些場景下,要求模型能快速理解直播視頻流內容,并做出反應。

現有的模型面臨兩大難題:一是多輪實時理解,即在處理最新視頻片段時需保留歷史視覺和對話上下文;二是主動響應,要求模型像人類一樣主動監控視頻流,并在無明確指令的情況下及時輸出反饋。

StreamBridge 框架與創新技術

為解決上述問題,蘋果公司與復旦大學的研究者開發了 StreamBridge 框架。該框架通過內存緩沖區和輪次衰減壓縮策略,支持長上下文交互。

蘋果攜手復旦大學推 StreamBridge 端側視頻大語言模型框架

該框架還引入了一個輕量化的獨立激活模型,無縫集成現有視頻大語言模型,實現主動響應功能。研究團隊還推出了 Stream-IT 數據集,包含約 60 萬個樣本,融合了視頻與文本序列,支持多樣化的指令格式,旨在提升流式視頻理解能力。

StreamBridge 在主流離線模型如 LLaVA-OV-7B、Qwen2-VL-7B 和 Oryx-1.5-7B 上進行了測試。結果顯示,Qwen2-VL 在 OVO-Bench 和 Streaming-Bench 上的平均分分別提升至 71.30 和 77.04,超越了 GPT-4o 和 Gemini 1.5 Pro 等專有模型。

Oryx-1.5 也取得了顯著進步,而 LLaVA-OV 性能略有下降。Stream-IT 數據集的微調進一步提升了所有模型的表現,證明了 StreamBridge 在流式視頻理解領域的強大潛力。

【來源: IT之家

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 中文字幕在线看日本大片 | 年级的后妈妈2中文翻译 | 日韩中文精品亚洲第三区 | 国产国语一级毛片中文 | 四虎最新免费观看网址 | 综合久久综合久久 | 久久伦理| 亚洲日本一区二区三区 | 国产女人又爽又大 | 一级毛片特黄久久免费看 | 毛片一级在线 | 久久久精品视频免费观看 | 国产一区二区在线视频 | 精品国产综合区久久久久99 | 久久久国产精品福利免费 | 国产精品久久综合桃花网 | 任我鲁精品视频精品 | 国产综合欧美日韩视频一区 | 女人18毛片a级毛片免费视频 | 曰本女人性配视频 | 国产a毛片清高视频 | aaaa级日本片免费视频 | www精品视频| 欧美一级特黄乱妇高清视频 | 中国大乳久久 | 国产啪视频1000部免费视频 | 狠狠色噜噜狠狠狠狠色综合久 | 国产在线精品一区二区高清不卡 | 婷婷国产在线 | 99999久久久久久亚洲 | 4hu影院最新地址www | 亚洲国产高清一区二区三区 | 3d动漫精品成人一区二区三 | 超级乱淫视频aⅴ播放视频 超级乱淫视频播放日韩 | 奇米久久久 | 福利国产在线 | 欧美色综合高清免费 | 欧美成人国产 | 西西做人爱免费视频 | 2018天天操| 免费日韩毛片 |