关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者1508人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

阿里达摩院推出电商智能体全面测试基准

科技行者 浏览 1774

老娘们不会完蛋的

江湖人称艾掌门 浏览 2475

吉利全球全域安全中心发布 领克900完成碰撞测试

太平洋汽车 浏览 1720

黄一鸣宣布新恋情,王思聪或成过去式

赵昉是个热血青年 浏览 1850

李亚鹏称体检后疑似患癌 忙着处理医院欠租没时间恐慌

上观新闻 浏览 6022

电车购置税补贴减半在即,这场兜底之战谁敢不打?

汽车公社 浏览 2666

0.95马赫!全球最快在役公务飞机Global 8000交付

IT之家 浏览 2119

官方通报贵州习水食物中毒事件:学生89人住院

界面新闻 浏览 21337

红旗E-QM5换电版车型正式上市 售8.98万元

车质网 浏览 2449

戴墨镜出席达沃斯会议后 马克龙的支持率提升

参考消息 浏览 5508

猫头鹰联手Prusa推出经典棕色、米色3D打印PLA耗材

IT之家 浏览 2185

Amazon和UCLA团队突破传统界限,开启无监督智能训练新纪元

科技行者 浏览 1803

时隔25年,上一个时代的“英伟达”终于涨回来了

华尔街见闻官方 浏览 2074

曝保时捷正在重新设计718 EV跑车,“反向”适配燃油动力

IT之家 浏览 2130

独家对话旺仔小乔“榜一大哥”:一场直播曾打赏7万元,让自己别为她难过而改名“别难过”

红星新闻 浏览 3076

刚说完"很快结束" 特朗普改口:美国要赢得"终极胜利"

参考消息 浏览 28903

《惊蛰无声》预告质感太差!杨幂没精神刘诗诗像盲人,被嘲像网大

萌神木木 浏览 1634

高德拿了谷歌剧本,餐饮商家想当主角

蓝鲸新闻 浏览 3290

MIT最新发现:这十年,算法进步被高估了

机器之心Pro 浏览 2076

兹维列夫脚踝受伤遭横扫,严重肿胀紧急求医,总决赛征程蒙上阴影

网球之家 浏览 2615

月销破2万辆 极狐年销翻番在望 摸到准一线门槛

乐逗汽车 浏览 2425
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1