关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者1737人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

卫衣+半裙=早秋流行混搭套路,时髦极了!

Yuki女人故事 浏览 3610

“双引擎”再提速:中国资本市场改革释放创新红利

财经众议院 浏览 2484

纯电续航提升 新款小鹏X9纯电版申报图曝光

车质网 浏览 2010

小儿子拜师少林寺 邹市明称3个儿子没有一个子承父业

环球网资讯 浏览 8440

中央定调!“十五五”目标确立,未来5年养老金还会涨吗?

数字财经智库 浏览 2735

中超第28轮传球成功率榜:国安88.4%居首,本赛季第9次登顶

懂球帝 浏览 2728

中国人自己的敞篷跑车来了!腾势Z敞篷版曝光

优视汽车 浏览 2230

鲁本-迪亚斯:经验告诉我们,如果不在最佳状态就无法夺冠

懂球帝 浏览 1983

50+姐姐别乱穿!这4个秋天“显贵”的搭配思路,越老越有韵味

静儿时尚达人 浏览 4395

悉尼海滩枪击事件已致16死 两名枪手1死1伤系父子关系

扬子晚报 浏览 7929

荣耀MagicOS 10十二月升级资讯:新增支持与Mac一碰互传等

IT之家 浏览 2131

18.51亿元!这家信托100%股权,第三次挂牌!

券商中国 浏览 1744

《水龙吟》《天地剑心》一弃一追

古木之草记 浏览 2584

巴菲特大举买入谷歌,股神为何爱上科技股?

郭施亮 浏览 2403

Vogue这一夜太抓马了

细语 浏览 2569

印巴空战震撼全球:PL-15导弹为何一击必杀

浏览 6624

美印友谊的中流砥柱被FBI大张旗鼓拘捕 被控"串通中国"

澎湃新闻 浏览 8300

上映27天被观众赶出院线!网播也救不了它,事实证明烂片已无市场

娱乐圈笔娱君 浏览 1527

丹麦国防部:若美国武力夺岛 丹麦士兵可先开枪再请示

环球网资讯 浏览 11999

别这样P图了,真的好假!

Yuki女人故事 浏览 1971

外媒:克宫称普京愿与马克龙就俄乌冲突对话

环球网资讯 浏览 1944
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1