爆点资讯

这项由牛津大学视觉几何组(VGG)团队开展的研究发表于2025年1月，论文编号为arXiv:2601.09499v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

想象一下，当你在看一段视频时，你的大脑能够同时理解画面中物体的三维形状、它们的运动轨迹，以及摄像机的移动。现在，牛津大学的研究人员成功让计算机也具备了这种"立体视觉"能力。他们开发的V-DPM系统能够从一段普通视频中同时重建出场景的3D结构、物体的运动轨迹，甚至摄像机的参数——这就像给机器装上了一双能够"看透"视频背后三维世界的眼睛。

这项技术的突破性在于，它是首个能够在单次处理中完成所有这些任务的系统。以往的方法要么只能处理静态场景，要么需要多个步骤才能分别处理形状和运动。而V-DPM就像一位全能的"视频分析师"，能够一眼看出视频中的所有三维信息。更令人惊叹的是，研究团队巧妙地利用了在静态场景上训练的现有模型VGGT，通过相对少量的动态数据微调，就让它学会了处理复杂的动态场景——这就像让一位擅长画静物的画家，通过少量练习就学会了画动态人像。

这项研究解决了计算机视觉领域一个长期存在的挑战：如何让机器同

牛津VGG团队突破：单一网络实现视频动态3D重建

日本新一代货...

李娜×新狮铂...

美股半导体板...

下辈子换我长...

马竞主场战热...

大疆「摔跤」...

43岁张杰正式宣布退出！原因令人意外

日产全新中大型SUV曝光！配激光雷达+800V平台，增程/纯电双动力

高管减持、股东跑路、产品爆炸：上市公司的“中年危机”

77亿的工厂16亿卖自主“捡漏”合资产能背后的车市剧变

聚焦高额彩礼杀猪盘，反诈电影《极限人生》首映

男子犯病救命药滞留酒店前台5个小时后死亡酒店回应

普京：若使用＂战斧＂导弹袭击俄领土将招致惊人回应

美客机万米高空风挡玻璃破裂资深机长：或为陨石撞击

推广中奖名单-更新至2025年12月19日推广

特朗普施压伊朗：美军舰队规模比在委内瑞拉的还大

售32.99万起 2026款岚图梦想家正式上市

特朗普向60国发出邀请之际多国正商量怎么对付美国

全红婵夺金新搭档身份不简单赛后发文信息量大

智能早报丨黄仁勋造访台积电3nm产线索取产能；万华化学突破机器人“仿生皮肤”材料

华为Momenta争夺保时捷，全球大厂智驾再度“投华”

联合国官员：加沙惨状如末日电影

仅自己可见：腾讯QQ群聊消息官宣支持元宝AI总结功能

6万人欢呼！西蒙尼带队狂飙：儿子助攻西甲4场10分杀进前4

外媒：美国已输掉了对伊朗的战争一个动作令中国获益

乌镇大佬聚会现场有好多人被瘦下来的郝蕾惊艳了

搭载雷神AI电混2.0技术吉利银河星耀7申报信息发布

东方通4年虚增3.14亿利润，两家审计机构为何失守？

美将暂停实施对华海事等301调查措施一年

17.64亿！理想MEGA召回预估成本创纪录，主动担责撬动行业规范变革｜封面独家