关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2810人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

前10月规模以上高技术制造业利润同比增长8.0%

北京商报 浏览 2221

AI代写论文公司曾申请精英人才商标

大象新闻 浏览 2475

阿里正把自己装进赛博分身

虎嗅APP 浏览 1614

队报:比赛中拉门斯的长传频繁且精准,推动了曼联的战术转型

懂球帝 浏览 2625

美媒:特朗普羡慕中国 华盛顿正在模仿北京

观察者网 浏览 5638

涉嫌违反美国移民法规则 吴佩慈"婆婆"在美国被捕

红星新闻 浏览 13296

4399元 一图读懂OPPO Find X9 刘作虎:严重超标的标准版

快科技 浏览 2792

卫星图像显示以军坦克集结加沙城周围

环球网资讯 浏览 3562

美媒承认乌重镇即将被攻克:俄方为此付出了很大代价

环球时报国际 浏览 7245

委内瑞拉外长称已接待美驻委临时代办

国际在线 浏览 1466

伊姐周六热推:电视剧《即刻上场》;电视剧《暗影侦探》......

伊周潮流 浏览 2236

商品交易巨头火上浇油:Mercuria被爆曾计划从LME仓库提取超4万吨铜

华尔街见闻官方 浏览 2215

佘诗曼《新闻女王2》首波口碑出炉了!现场观众的评价一针见血

娱乐圈笔娱君 浏览 2468

马斯克3小时高能量访谈,信息量大到爆炸

深蓝财经 浏览 1692

特朗普亮明"弃台"主张 学者:美在台海已不具军事优势

台海网 浏览 12089

低价"银行直供房"激增 有房产价格低于市价25%

第一财经资讯 浏览 6937

手握200亿基金,寻找想打造品类第一的创业者

创业家 浏览 2741

中国联通原副总经理获刑12年 曾搞权色、钱色交易

政知新媒体 浏览 12321

巴基斯坦与沙特签协议被指影响超越中东 引发多国震动

环球网资讯 浏览 15092

数十款超2米,新能源车越造越宽?车企有“小算盘”,车大还好开

小李车评李建红 浏览 1631

“躺赚”的企查查,是个苦生意?

定焦One 浏览 2895
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1