关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1572人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

亚奇雷AGI将参展CES 2026:展出10000MT/s内存条与Gen5 SSD

IT之家 浏览 2125

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 3520

一汽丰田10月销售新车71407辆 今年累计销售65.8万辆

网易汽车 浏览 2529

笑掉大牙!日票房仅199万,黄晓明的新片,被“小李子”打懵了

温柔娱公子 浏览 2684

拉斯帕多里:意大利拥有成功所需的一切;我对加盟马竞很满意

懂球帝 浏览 2267

比亚迪10月销售441706辆 新能源累计销售超1420万辆

网易汽车 浏览 2546

中国停购后 美国大豆真"爆仓"了人们四处逃散

澎湃新闻 浏览 10659

WTT总决赛男单决赛前,张本智和接受采访时引用高市早苗言论

懂球帝 浏览 2071

在南海坠毁的美军机比F-35还贵 单价1亿美元

参考消息 浏览 1981

美国拟实施载人绕月飞行任务

北京商报 浏览 1688

新款比亚迪夏限时19.68万起售!上车天神之眼B激光版,支持城市NOA

车东西 浏览 2163

特朗普:我100%会加税 欧洲等着吧

澎湃新闻 浏览 10665

告别羽毛球自由,中产迷上匹克球

虎嗅APP 浏览 2832

售价更低 荣威i5新版本车型发动机参数下调

车质网 浏览 2860

界外球都判错!西亚昏哨8次不利判罚气炸U23国足众将,王钰栋质问

我爱英超 浏览 1602

跌落神坛!“逼疯”黄奕,“整了”周迅的他,因王家卫再次被牵连

温柔娱公子 浏览 2061

闫学晶"哭穷"引争议被禁止关注 知名品牌终止其代言

极目新闻 浏览 6468

司晓迪控诉李云迪!趁自己睡着干龌龊事还拉黑她,喊话男方别惹她

萌神木木 浏览 2145

欧摩威展示单雷达AEB方案!已获国内头部主机厂定点,明年将量产

车东西 浏览 2598

21岁韩乒一姐状态下滑?混双+女单皆不敌33岁老将 韩媒:极易崩盘

颜小白的篮球梦 浏览 2800

中东多个海水淡化厂受损 引发饮用水武器化担忧

澎湃新闻 浏览 551
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1