关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者2566人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小米汽车超级工厂供应商,斯坦德机器人赴港IPO|港E声

时代周报 浏览 1760

托辛:很荣幸在队内是资深球员;“叔叔”的外号来自马杜埃凯

懂球帝 浏览 2707

出行场景升级/还支持餐厅排队 方程豹钛7推送第二次OTA

网易汽车 浏览 1713

曾毅手表事件休整后首次露面,发布新团队全家福

迷迭香的记忆a 浏览 1968

61岁华西女教授创业冲刺港股IPO,估值超34亿元,腾讯、启明等参股

红星资本局 浏览 1672

美院硕士在母校附近摆摊卖包子火了 父母也来陪他创业

都市快报橙柿互动 浏览 13552

9家县级农商行、农信社及9家村行大合并,股金、人员处置方案公布

湘财Plus 浏览 1647

TA:热刺几乎没能给森林造成任何威胁,他们需要减少自身失误

懂球帝 浏览 2044

视界大会短剧演员好尴尬!走红毯扎堆不给镜头,后台跟明星分开坐

萌神木木 浏览 2535

小鹏汽车2025年交付超42万台:大增126% 创历史新高

快科技 浏览 1834

牛津VGG团队突破:单一网络实现视频动态3D重建

科技行者 浏览 1656

2026款奔驰GLC AMG 43 4MATIC上市 售58.9万

车质网 浏览 2365

李亚鹏确认,靠卖北京房子和直播卖茶具,5000万债务已还清!

荆楚寰宇文枢 浏览 1874

梅婷陪爷爷种菜,穿连帽卫衣配阔腿裤休闲低调

疯说时尚 浏览 604

一户人家被全楼"孤立":加装电梯没出资 卖房时尴尬了

扬子晚报 浏览 7383

美职联季后赛东部对阵:迈阿密国际VS纳什维尔,赛制三局两胜

懂球帝 浏览 2828

石油巨头裹足不前的心理阴影:委内瑞拉与美国的百年石油恩怨

澎湃新闻 浏览 1763

“双11”本地之战|淘宝便利店剑指美团腹地 电商巨头激战线下“最后一公里”

北京商报 浏览 2617

有多想不开才去巴西投资?

虎嗅APP 浏览 1788

北青:中国女足亚洲杯首战主裁来自泰国,已分析摸底孟加拉

懂球帝 浏览 940

四名日本U17国脚在阿贾克斯试训,并与富安健洋、板仓滉合影

懂球帝 浏览 1010
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1