关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1699人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2000元抵4000元 阿维塔12四激光版预售

网易汽车 浏览 2751

小米Watch Type-C充电底座发布:磁吸设计、共用手机线,39元

IT之家 浏览 783

特朗普:对委军事行动使用了空中、陆地和海上力量

极目新闻 浏览 1772

手握200亿基金,寻找想打造品类第一的创业者

创业家 浏览 2731

选来选去还是这些穿搭最适合秋天,不老气、不死板,舒适大方

静儿时尚达人 浏览 2489

以军方:一名以军士兵在加沙城遭哈马斯袭击身亡

环球网资讯 浏览 3391

E句话| 邢菲为违反交通规则道歉了?

仙女事件簿 浏览 2076

众泰汽车重组出现变数?

车业杂谈 浏览 1466

特朗普:将取消一些制裁 以平抑国际油价

环球网资讯 浏览 727

登顶Hugging Face GAIA全球榜首!中兴超级智能体终结「AI黑盒」时代

新智元 浏览 2811

抄底时刻已至?新荣记、胡晓明联手入股西贝

首席商业评论 浏览 1558

保时捷的十字路口:奥博穆交棒,勒茨斯的回归与挑战

网易汽车 浏览 2818

《不眠日》大结局!墨远致是乌贼

丹妮观 浏览 3476

周年庆专场|| 我的洗漱台上,真的不能没有它

黎贝卡的异想世界 浏览 2861

卡瓦哈尔谈国家德比:我们渴望复仇,击败他们意义重大

懂球帝 浏览 2752

拜仁独撑门面,德甲遭遇欧冠至暗一周

体坛周报 浏览 1622

同曦126-123双加时逆转深圳,郭昊文31+6+10,史密斯空砍44分

懂球帝 浏览 1446

你恐慌我贪婪!约500亿资金借道ETF蜂拥进场,主力机构正重金下注这些板块(附名单)

每经牛眼 浏览 2869

冲刺第一股,中国最大独立模型厂商的成色、能力与野心

晚点LatePost 浏览 1968

别管怎么质疑《寻秦记》,只要古天乐、林峯在,再烂我都会买单

最爱酷影视 浏览 2071

保剑锋被前妻手撕,不愧是插刀教成员

萌神木木 浏览 1497
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1