实测全球爆火的Veo3,体验如何?

zhq 2025-05-24 阅读:314 评论:0
题图来自:Veo3 生成上一代寂寂无名,这一代全球爆火—— 说的就是 Veo3。这周过去的 Google I/O 大会,带来的最惊艳的更新,莫过于 Veo3。上一个版本,也就是 Veo2 出来时,正好是 OpenAI...

题图来自:Veo3 生成

上一代寂寂无名,这一代全球爆火—— 说的就是 Veo3。

这周过去的 Google I/O 大会,带来的最惊艳的更新,莫过于 Veo3。上一个版本,也就是 Veo2 出来时,正好是 OpenAI 用生图魔法咔咔乱杀的时候,Veo2 就这么被遗忘在角落。

这一次在谷歌以 Gemini 为主角进行全系大升级的情况下,Veo3 终于扬眉吐气了一把。它的强大也毋庸置疑,金标准就是“史密斯吃面条”。

史密斯不再是手指乱飞、五官狰狞的样子,而是慢条斯理地吸溜意大利面。从拿起叉子,到送入口中,整个过程流畅丝滑。食物的物理特性表现得也很好,意大利面的缠绕和拉伸效果很写实。

而 Veo3 本次的更新最大的亮点,在于可以同步生成符合视频内容的音效。史密斯“吸溜”面条的声音,跟画面完全一致。

Veo3 作为视频生成模型,搭载于 Google 全新推出的整合型视频平台 Flow 和 Whisk。目前对美区用户开放,需要订阅 Google AI Ultra,价格为每季度 124.99 美元。

毫不费力,实现音画同步

看看这个水波纹的动态效果,渲染得非常真实细腻,水面反射的效果也很自然。纸船在水面上的漂浮状态、随着水流的波动轻微晃动,符合实际物理规律。

尤其是最后镜头切换到排水口时,水流的湍急程度和漩涡的形成,以及水花的飞溅都被表现得极为生动和真实。

这种复杂的流体动力学效果通常需要高精度的物理模拟。更重要的是,所有的声音也完全按照纸船的运动轨迹,毫不出戏。

生成式视频的物理逻辑问题,无限趋近于解决,除了不够稳定之外。除了纸船流水,这支视频里的奶茶还在锅中时,液体细节比如气泡、流动等,表现得非常细腻。

从锅中液体到倒入杯子的过程中,泡沫的形成和扩散也很自然。这种细腻的表现力是 Veo3 无比强大的地方。

特殊画幅也不在话下。像这个鱼眼镜头,同时又保持了货架上的商品细节,以及人物动作的连贯。伸手拿取商品、观察货架等动作,都毫无瑕疵。

甚至,这个仿监控摄像的画面还带有时间戳,相当有迷惑性。

AI 生成的魅力在于能够组合各种意想不到的元素,比如这个应用了老式录像带的画风,却是一个蜥蜴人 / 恐龙人(?)作为主角。

虽然有点诡异,但恐龙角色的动作细节毫不马虎,例如握持吉他时的手部姿势和弹奏动作,以及手持饮料罐时的细节处理,都很到位。恐龙的外形同样栩栩如生,皮肤纹理、眼睛的动态效果以及整体的表情变化都非常灵动。

还有一个切开毛毡奇异果的视频,羊毛球柔软、蓬松的质感,表面的纤维纹理和刀刃的反光都处理得非常好,剖面展示出来那一刻相当流畅。

配套的音效,完全不是常规水果的声音,而是硬羊毛和金属摩擦的声音 —— 太准确了。

Veo3 的声音生成包括非语言类的元素,以及语言类的台词、旁白,同时支持非英语的旁白生成。

像这支视频里,青蛙的表情和动作变化非常连贯,从眼神的转动到嘴巴的微动,都跟台词保持高度同步。

这个角色是青蛙,它不仅在外形上高度拟真,皮肤质感、眼睛的动态效果以及表情的变化都非常写实。尤其是爪子紧握吧台边缘,甚至能让人感觉到重量感和摩擦力。

画面能跟音乐结合吗?安排。这支视频里,Rap 与动作的高度同步,节奏和强度与人物的动作完美结合,使整个场景充满了活力和动感。镜面反射的效果不仅增加了视觉上的复杂性,还使得动作显得更加立体和富有层次感。

仔细看,人物的动作非常连贯,从一个动作到下一个动作的过渡自然,显示出高水平的动画控制能力。

最让人震撼的是一个车展的视频,背景中的汽车展示区、展位标识以及人群活动都几乎毫无瑕疵 —— 盯着看了老半天,也没看出什么错处来。连展台设计和摆放位置跟三次元的车展,不说是一模一样,简直是毫无区别。主持人在介绍时的手势引导,与他人互动时的身体语言,包括专业的语调专业和感染力都无可挑剔。

这么复杂的画面,大量的人像,而且是运动人像,复杂的音效,Veo3 全都 hold 住了,这是非常震撼的一个用例。

车展这个视频已经非常完备了,还有没有更完备的?

Veo3 很认得清自己的位置:创意工具。所有的 AI 生成工具都是这样,应该为了实现创意而服务,而非喧宾夺主。所以有网友通过 Veo3,打造了一条“打破第四堵墙”的 AI 控诉视频。

这才是《黑镜》该有的样子。

目测有一定拼接剪辑工作,但不妨碍展示 Veo3 在电影风格方面的实力。

人物的表情和动作非常逼真,尤其是情绪激动时的细节处理。环境和背景的设计也体现了 AI 的强大能力,例如废墟街道的破败景象和医院的安静氛围,都表现出高度的还原。

每个场景都通过细腻的表情、动作和环境设计,实现了多层次的情感表达和氛围渲染,虽然台词是讽刺,但品质上来看,可以说是接近电影级的出品。

One More Thing

Veo3 的爆火也迅速吸引了浑水摸鱼的乐子人,拿着明明是真人视频,假装炸裂地高呼:天呐!AI 都这样了可怎么办呐!

比如用电影段落来混淆视听的,像《头号玩家》,视觉效果拉满的段落,人很难记得细节,只能记得一些感受。偷来搞乐子,确实很容易让人中招。

而在人物方面,扎克伯格是最容易中枪的 —— 不是因为别的,而是因为他本人“伪人感”也太重了。

无论是表情,还是肢体语言,仿佛刚刚驯服四肢 ……

小扎,被当作 AI 样片挂出来,要反思一下是谁的问题啊!

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

发表评论
热门文章
  • 遇见小面闯关港股:单店日均销售额下滑,屡因食品安全被点名

    遇见小面闯关港股:单店日均销售额下滑,屡因食品安全被点名
    记者|赵阳戈 一家“接地气”的公司将要亮相联交所。近日,广州遇见小面餐饮股份有限公司(以下简称遇见小面)披露招股说明书,拟登陆联交所,招银国际为独家保荐人。 来源:联交所遇见小面成立已11年,开店增至380家,2024年卖出了11亿元的营业额。盈利方面,虽说在2022年因疫情录得亏损,但2023年实现扭亏,2024年有逾6000万元的净利润。 据了解,遇见小面还将继续扩张,2025年、2026年及2027年,计划在中国内地、中国香港及海外分別新开设约...
  • “免签圈”扩容,旅游平台:今年以来巴西等国入境游订单显著增加

    “免签圈”扩容,旅游平台:今年以来巴西等国入境游订单显著增加
    据新华社报道,外交部发言人林剑5月15日在例行记者会上说,为进一步便利中外人员往来,中方决定扩大免签国家范围,自2025年6月1日起至2026年5月31日,对巴西、阿根廷、智利、秘鲁、乌拉圭持普通护照人员试行免签政策。上述5国持普通护照人员来华经商、旅游观光、探亲访友、交流访问、过境不超过30天,可免办签证入境。“免签圈”扩容将进一步促进中国入境旅游的利好发展。当天,携程数据显示,今年以来,该平台上入境游订单量比去年增长接近翻倍。新增的五国入境游潜力巨大,今年以来阿根廷入境游...
  • 长城基金梁福睿:解码创新药的DeepSeek时刻

    长城基金梁福睿:解码创新药的DeepSeek时刻
      今年以来,医药板块尤其是创新药领域迎来一波强劲复苏,但在近期市场调整中也出现了波动。不过,创新药板块的长期投资价值依然显著。长城医药产业精选基金经理梁福睿认为,类似于DeepSeek,未来市场会更加认知到中国创新药从追赶到超越的实力。   在“515”全国投资者保护宣传日来临之际,基金经理...
  • 外交部:国际社会广泛理解和支持中方不同意台参加世卫大会的决定

    外交部:国际社会广泛理解和支持中方不同意台参加世卫大会的决定
    5月15日,外交部发言人林剑主持例行记者会。有记者提问,据了解,第78届世界卫生大会将于5月19日开幕,台湾地区方面迄今没有收到与会邀请。中国政府对此有何评论?林剑表示,在中国台湾地区参与国际组包括世界卫生组织问题上,中方的立场是一贯明确的,即必须按照一个中国原则来处理,这也是联合国大会第2758号决议和世界卫生大会25.1号决议确认的根本原则。中国台湾地区在未经中央政府同意的前提下,没有任何根据理由或权利参加世卫大会。台民进党当局顽固坚持“台独”分裂立场,导致台湾地区参加世...
  • 美联储主席鲍威尔:美国可能进入更频繁、更持久的 “供应冲击” 时期

    美联储主席鲍威尔:美国可能进入更频繁、更持久的 “供应冲击” 时期
      美联储主席杰罗姆・鲍威尔周四表示,美国可能进入供应冲击更频繁、通胀更不稳定的时期,这需要央行采取更透明的沟通方式。   鲍威尔在启动对央行货币政策框架五年一次的评估时发表了上述言论。   “关键问题在于如何让公众更广泛地理解经济普遍面临的不确定性,” 鲍威尔在华盛顿的演讲中表示,并预测 “...
标签列表