首页 > 新车报告 > 新车报告 > 音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

音效师狂喜!谷歌推出首个AI视频自动配音工具,一个人干了后期活

发布时间:2024-06-19 22:58:50

提供1000+款AI效率工具丨AIEVA.CN丨欢迎访问

AI奇点网-AI工具特刊丨6月19日


谷歌发布新一代AI视频自动配音工具,AI视频开启「有声时代」!

6月17日,谷歌人工智能团队DeepMind发布了一个名为V2A(Video-to-Audio)的AI架构系统,顾名思义即“视频转音频”,能根据画面内容或者手动输入的提示词直接为视频配音。

该模型最大的功能在于,可为任何视频自动创建合适的音轨BGM,在实践中取得了十分有效的进展,可以大大降低视频配音的制作成本。


当前Sora、Pika、可灵以及Runway等视频模型已经能输出逼真的短片,但它们均输出的是默片。

谷歌V2A系统的特点,便是V2A能依靠自身的多模态视觉能力理解视频当中的信息。V2A能看懂画面,知道画面里正在发生什么,应该出现什么声音。

举个例子,比如输入一则主题为「在黑暗中行走」的无声视频,添加“电影、恐怖片、音乐、紧张、混凝土上的脚步声”等文本提示后,AI模型就能根据提示词生成恐怖片风格的背景音效,十分逼真。

 

00:00 / 00:12


脚步声基本吻合人物走动的节奏,随着画面的切换,脚步声也随之消失,毛骨悚然的紧张感拉满。

为了能够贴近Sora热点,谷歌V2A的开发团队使用了不少Sora生成的视频片段作为输入范例。

 

00:00 / 00:08


比如上边这段Sora生成的水母漂荡影像,营造出了负压十足的深海水压感。

下方这则短片也是Sora的样片,经由V2A生成的音乐配乐后的视频颇有西部大片的感觉。

新车报告更多>>

极豆科技与中科创达、Rightware达成战略合作,共建智能座舱HMI全栈方案 福特不排除重返轿车市场 因应成本与价格压力 连签20多家改装大牌!首家NAJ京东养车改装中心在武汉开业 荣耀官方提醒Magic8 Pro Air避免使用一体式全包镜头膜 苹果iOS 27系统Siri将升级为完整聊天机器人,不会成独立应用 刘强东与其造车,不如造共享单车 前比亚迪腾势品牌负责人赵长江正式加盟鸿蒙智行-智界汽车 余承东:中国新能源市场50万以上 每卖出10台车就有7辆问界M9 9大车企要卖超1800万台,鸿蒙智行冲刺销量翻番,四家车企瞄准300万年销 扎克伯格改革绩效评级体系:Meta“卓越贡献奖”可获三倍奖金 张文宏:拒绝把AI引入医院病历系统 医生需要训练专业诊断能力 Gartner:英伟达2025年成为首家半导体销售年收入破1000亿美元企业 苹果官宣iPhone将搭载最强AI!马斯克第一个跳出来骂 打破BBA垄断!享界12月冲到中大型车销量榜第四 直追宝马5系 美媒实测:ChatGPT内置应用体验不佳 难撼动苹果App Store地位 罗永浩否认与华为有过节:提遥遥领先是开玩笑 Yann LeCun炮轰Alexandr Wang缺乏经验:Meta AI会有更多人离职 消息称苹果A20芯片单颗成本高达280美元,2nm先进制程芯片恐成“史上最贵” 马斯克引领“比基尼换装”风潮引争议,xAI承认Grok修图功能遭滥用 一骑绝尘:挪威2025年电动汽车渗透率达95.9%,12月接近98% 2025年未能上市!特朗普土豪金T1手机再度推迟 宝马官宣专属独立品牌BMW ALPINA:专属定制、精选材质、标志性驾驶质感 事关债市、稳定币、个人征信等 潘功胜称多项政策举措即将实施 前三季度GDP增长5.6%,首都经济成绩单预示了怎样的未来? 前三季度我国黄金消费量同比下降:金饰遇冷、金条需求仍然旺盛 雷军回应YU7首拆:欢迎同行和专家指点 以“质量基石”护航中国新能源汽车创新与出海,共筑产业“白金标准”​ 曝欧盟拟于12月官宣新规,推动小型电动车平价化 保时捷中国研发中心正式启用,开发周期有望大幅缩短 月薪高达12万!字节发力人形机器人