久久久国产精品视频_国产成人精品日本亚洲专_日本午夜大片免费观看视频_97av麻豆蜜桃一区二区

首頁 > 生活分享 > 免費教學 > 蘋果聯合研究照亮多模態AI未來方向:早期融合 + 稀疏架構

蘋果聯合研究照亮多模態AI未來方向:早期融合 + 稀疏架構

發布時間:2025-04-16 15:37:23來源: 12055991234

 4 月 16 日消息,科技媒體 marktechpost 昨日(4 月 15 日)發布博文,報道稱蘋果工程師聯合法國索邦大學,通過對比早期融合和后期融合模型,發現從頭訓練的早期融合模型在計算效率和擴展性上更具優勢。

多模態 AI 現狀與面臨的挑戰

IT之家援引博文介紹,多模態 AI 旨在同時處理圖像、文本等多種數據類型,但整合這些異構數據仍是一大難題。當前技術多采用后期融合(late-fusion)策略,即組合使用預訓練的單模態模型(如視覺編碼器和語言模型)。

這種方法雖然操作簡便,卻難以實現真正的多模態理解,單模態預訓練帶來的固有偏差,可能限制模型捕捉跨模態依賴關系。

此外,隨著系統規模擴大,各組件的參數、預訓練需求和擴展特性差異顯著,導致計算資源分配復雜,影響性能,尤其是在需要深度多模態推理的任務中。

早期融合與稀疏架構的突破

蘋果聯合團隊挑戰了傳統架構選擇,深入研究從頭訓練的原生多模態模型(NMMs)的擴展特性。

團隊對比了早期融合(early-fusion)和后期融合模型,發現從頭訓練時,兩者性能相當,但早期融合模型在低計算預算下更高效且易于擴展。

研究還探索了專家混合(MoE)稀疏架構,發現其能動態分配參數,針對不同模態進行專項優化,相較于稠密模型,可以顯著提升性能,這點在小規模模型中優勢明顯。

分析顯示,稀疏模型更傾向于優先擴展訓練數據(training tokens)而非活躍參數(active parameters),這與稠密模型的擴展模式形成鮮明對比。

研究團隊通過系統實驗,訓練了從 0.3 億到 40 億活躍參數的多模態模型,驗證了早期融合和稀疏架構在多模態處理中的潛力。

結果表明,原生多模態模型的擴展規律與語言模型相似,但跨模態數據類型和訓練組合會略微影響擴展系數。此外,稀疏模型在等效推理成本下持續優于密集模型,展現出處理異構數據的強大能力。

這些發現挑戰了傳統設計理念,表明統一早期融合架構結合動態參數分配,或將成為未來高效多模態 AI 系統的重要方向。

免費教學更多>>

壓力給到蔚來門店?史上最大優惠果真給力 狂飆的智能化有無安全底線?廣汽智能化安全峰會這樣說 抖音安全與信任中心開放日:算法有人工“護航”,多樣化推薦打破“信息繭房” 抖音:可幾乎不依賴打標簽,通過神經網絡計算預估用戶行為 隴縣供銷電商\"云端\"助農 蒜香飄出鄉村振興新路徑 青春聚吉筑夢電商 產教融合賦能振興 “千億扶持”加碼農業,拼多多如何改寫鄉村供應鏈? 京東七鮮“繁花計劃”啟動 通過產地直采+包銷重塑鮮花即時零售新生態 淘寶天貓:助力外貿“外轉內”六大舉措 “日光盤”再現,深圳新房市場為何表現“搶眼” 取消限售限價、探索商品房共有產權 無錫樓市新政“放大招” 房產政策“大禮包” 購房優惠多多多 問界M8汽車預訂量超14萬臺,鴻蒙智行家族全新成員明日揭曉 問界M8小訂突破15萬輛 iPadOS 19瞄準桌面級體驗,蘋果欲打破平板“輕生產力”瓶頸 蘋果聯合研究照亮多模態AI未來方向:早期融合 + 稀疏架構 一季度蘋果成中國智能手機市場前五名中唯一下滑廠商 榮耀GT Pro電競性能旗艦4月23日發布 一加手機徹底妥協,驍龍8Gen3+16GB+512GB+6100mAh,低至2124元起 一加Nord CE5手機渲染圖首曝:垂直雙攝,硬朗外觀 小屏手機性能崛起!一加13T性能首測出爐 五大手機廠家3-5年用不卡的手機到底怎么選? 電量焦慮退退退!2025手機續航大橫評來了 榮耀GT Pro手機配備144Hz高刷旗艦電競直屏 超長續航手機榮耀Power發布:開辟輕戶外手機新賽道 今年最干凈+最值?TCL AI超級筒洗烘一體機 T7R Pro 實測體驗 極致服務,智贏未來 | 華蘇科技成功承辦第四屆中興服務生態論壇 沒必要上pro,紅米k80標準版已經很強了 極簡主義者的「無聲告白」-魅族21 真我GT7全新三款配色登場,正面屏幕也驚喜