关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者1522人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

豆瓣9.1,宫崎骏大师动画神作最后告别放映!

幕味儿 浏览 2589

冬季穿衣别显得太臃肿!大衣收腰、搭配围巾,有质感又高级

静儿时尚达人 浏览 1920

实弹射击 禁止驶入 山东潍坊发布警告

极目新闻 浏览 2663

关于生成式AI,这三个问题很关键

经济观察网 浏览 2680

重新定义边界,吉利全域安全进入 2.0 时代

网易汽车 浏览 2079

零跑业绩向好 朱江明持股增加

汽势传媒 浏览 2695

配1.5T增程/猎鹰700辅助驾驶 星途ET5预售15.99万起

网易汽车 浏览 2440

2025年“演技最好女演员”排名,第1实至名归海

皮皮电影 浏览 2053

又一位香港老戏骨离世

皮皮电影 浏览 2534

男子吃饭像兔子去治疗 蒙眼做手术听到医生一句话懵了

1818黄金眼 浏览 31355

报道称明年AI芯片产量拟提高两倍,寒武纪尾盘拉升,深夜“严正声明”:不实

华尔街见闻官方 浏览 2209

母亲被父亲刺28刀死亡 11岁儿子因给父亲开门深深自责

都市报道 浏览 13237

利物浦已遭遇英超四连败,上次顶级联赛五连败还是1953年

懂球帝 浏览 2590

丹麦增兵格陵兰岛 欧洲多国派兵

央视新闻客户端 浏览 1333

美国"全面封锁"受制裁油轮 一艘油轮狂发75次求救信号

红星新闻 浏览 29166

陈伟霆何穗官宣结婚生子,夫妻俩抱娃露面幸福满溢,二人隐藏好深

扒虾侃娱 浏览 2811

为避免与白宫格斗冠军赛冲突 法国推迟举行G7峰会

环球网资讯 浏览 7232

天津98-93逆转广州,詹姆斯23分18板,赖俊豪伤退

懂球帝 浏览 1764

主播让弗洛伦齐向拉齐奥打招呼,弗洛伦齐:永远不会

懂球帝 浏览 2775

韩庚晒卢靖姗官宣生子!一家四口同框照好幸福

一只番茄鱼 浏览 2726

媒体披露:U23国足主帅禁止球员在驻地点外卖

环球网资讯 浏览 18965
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1