关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者2585人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美防长来了 核潜艇议题搅动韩国

环球网资讯 浏览 2616

2-2!英超疯狂之战:1-2落后 10人曼联压哨绝平 0分变1分

叶青足球世界 浏览 2498

宁波方正携手山东未来机器人,聚焦深海机器人业务

财闻 浏览 2730

AI首个「铁饭碗」:在浦东美术馆,我用豆包跟毕加索聊了一上午

雷科技 浏览 1704

1-10月累计同比增长57.1% 深蓝汽车10月全球销量36792辆

网易汽车 浏览 2524

《逐玉》注水风波升级!315评论区沦陷

萌神木木 浏览 754

助力识别、延缓或逆转老年疾病,全新“自然奖项”问世

上观新闻 浏览 3349

欧阳明高警示:中国车企转型需防范“欲速不达”

观察者网 浏览 532

荷媒:阿贾克斯希望租借津琴科,已与阿森纳基本达成一致

懂球帝 浏览 1732

张兰回京仅三天连出四大决策,马筱梅直播拆台

秋别离 浏览 763

陈晓最新露面瘦脱相!新剧要和陈妍希对打,女方离婚后状态更好

萌神木木 浏览 2282

今日热点:迪士尼OpenAI合作;JENNIE和DEX将出演新综艺……

伊周潮流 浏览 1964

上年纪的姐妹们别慌!“反油腻”穿搭就这两招,时髦又显气质

静儿时尚达人 浏览 2702

苹果计划为 iPad Pro 引入 iPhone 17 Pro 的均热板散热

威锋网 浏览 2612

国安部门破获一起直播泄露军事秘密案

上观新闻 浏览 3298

【英超】德利赫特头球绝平 曼联2比2客平热刺

体坛周报 浏览 2588

页岩油超级并购来了?Coterra考虑联姻Devon Energy,股价一度涨超10%

华尔街见闻官方 浏览 1647

权力重构?泽连斯基亲信部队高层遭反腐

浏览 5903

王楚然172cm真实感,有谁不爱

蕾爸退休日记 浏览 1924

理想汽车线上全员会,员工表示“听不懂”

财视传播 浏览 1569

徐正源:永不言弃是成都强大的DNA 韦世豪伤情要等明天才有结果

直播吧 浏览 3515
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1