久久久国产精品视频_国产成人精品日本亚洲专_日本午夜大片免费观看视频_97av麻豆蜜桃一区二区

首頁 > 活動線報 > 每日福利 > 音效師狂喜!谷歌推出首個AI視頻自動配音工具,一個人干了后期活

音效師狂喜!谷歌推出首個AI視頻自動配音工具,一個人干了后期活

發布時間:2024-06-19 22:58:50來源: 15210273549

提供1000+款AI效率工具丨AIEVA.CN丨歡迎訪問

AI奇點網-AI工具特刊丨6月19日


谷歌發布新一代AI視頻自動配音工具,AI視頻開啟「有聲時代」!

6月17日,谷歌人工智能團隊DeepMind發布了一個名為V2A(Video-to-Audio)的AI架構系統,顧名思義即“視頻轉音頻”,能根據畫面內容或者手動輸入的提示詞直接為視頻配音。

該模型最大的功能在于,可為任何視頻自動創建合適的音軌BGM,在實踐中取得了十分有效的進展,可以大大降低視頻配音的制作成本。


當前Sora、Pika、可靈以及Runway等視頻模型已經能輸出逼真的短片,但它們均輸出的是默片。

谷歌V2A系統的特點,便是V2A能依靠自身的多模態視覺能力理解視頻當中的信息。V2A能看懂畫面,知道畫面里正在發生什么,應該出現什么聲音。

舉個例子,比如輸入一則主題為「在黑暗中行走」的無聲視頻,添加“電影、恐怖片、音樂、緊張、混凝土上的腳步聲”等文本提示后,AI模型就能根據提示詞生成恐怖片風格的背景音效,十分逼真。

 

00:00 / 00:12


腳步聲基本吻合人物走動的節奏,隨著畫面的切換,腳步聲也隨之消失,毛骨悚然的緊張感拉滿。

為了能夠貼近Sora熱點,谷歌V2A的開發團隊使用了不少Sora生成的視頻片段作為輸入范例。

 

00:00 / 00:08


比如上邊這段Sora生成的水母漂蕩影像,營造出了負壓十足的深海水壓感。

下方這則短片也是Sora的樣片,經由V2A生成的音樂配樂后的視頻頗有西部大片的感覺。

每日福利更多>>

奧迪再放大招2025款RS 3狂飆3.8秒!五缸神機+黑科技四驅炸裂登場 寶馬回應兩部委智駕規范 安全底線絕非說說而已 高階智駕+第五代DM技術,中級轎車秦L DM-i智駕版限時8.98萬元起 紐北最速手動車,還得是保時捷911 長城將坦克Hi4四驅搭載在11萬級別新車上 硬派與舒適兼得,15.29萬起,深藍G318無憂穿越版購車指南 山海T2/旅行者加長版齊發,捷途方盒子家族開啟全新旅程 3月中大型MPV銷量榜單有點慘 沒一款銷量過萬 威然第十 啟辰汽車“四爆”測試:以硬核技術重新定義新能源安全標桿 比方程豹豹5尺寸還大 配兩把鎖 深藍G318無憂穿越版值得買嗎? 地平線CEO余凱:L2是L3的基礎,5000TOPS算力才能實現L5 極氪放出“大招”:最美獵裝007GT僅售19.99萬起,零百不到3秒還帶空懸 這一夜過后,哈弗肩負起“全民四驅”重任 2025年3月皮卡銷量TOP10:江淮重回前二,上汽大通跌至第五,雷達成黑馬 高階智駕+第五代DM技術 比亞迪秦L DM-i智駕版限時8.98萬元起 全新智己L6:全系800V+激光雷達,預售21.99萬元起 把“安全”焊進DNA,沃爾沃對豪華車內卷正式宣戰 預售權益價21.99萬起/5月上市 新款智己L6首發并開啟預售 15萬級硬派SUV新標桿,深藍G318無憂穿越版全場景適配 新款起亞 K4 Hatchback 官圖發布!定位緊湊型兩廂轎車,外觀微調 2025上海車展|增程插混哪家強?這份攻略請收好 微軟Win11 24H2修復Chrome等瀏覽器屏幕共享色彩失真問題 首批搭載驍龍第四代8S,vivo終于硬氣了?小米怎么看! vivo Pad5 Pro:旗艦平板新標桿,高效與娛樂兼具 怎么檢查電腦硬盤壞道/MHDD掃描硬盤壞道 ROG STRIX B850-I GAMING WIFI 主板評測:小尺寸下的銳龍全能小鋼炮 埃安UT不卑不亢,價格對標熱銷競品,配置上還一視同仁 房價異動暗藏玄機!最新數據揭示2025樓市三大新趨勢 OPPO/一加官宣支持微信朋友圈發布Live圖:陸續覆蓋70+機型 一加13T影像規格公布:5000萬索尼大底主攝 +2倍光學長焦