关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者2526人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

预售13-15万元 北京现代EO羿欧将于10月29日上市

网易汽车 浏览 2816

北京独生女被男友殴打致残:他让我再买房写他儿子名字

黄河新闻网吕梁频道 浏览 7547

美联储年内“三连降”,2026年利率走向何方?

中新经纬 浏览 2158

赌王长孙女近况曝光,定居澳门买下2300平海景房,悲惨人生终逆袭

萌神木木 浏览 2669

巴媒质问:忘恩负义的阿富汗是否正成为印度代理人

澎湃新闻 浏览 7225

马斯克回应争议:没有见过任何由Grok生成的未成年人裸照

IT之家 浏览 1692

Jacob Elordi 最新电影造型,好像鬼!

下水道男孩 浏览 2687

警惕特朗普TACO交易割韭菜

尺度商业 浏览 2794

婚变传闻真相大白一个月,唐嫣高调官宣喜讯

叨唠 浏览 1498

科技范儿·在现场|“AI+智能座舱”让每次出发都是“懂你的陪伴”

上游新闻 浏览 2012

迅雷起诉前CEO陈磊:指控其隐秘掏空公司,追索资产2亿元;知名游戏公司发布反腐公告:3名员工涉嫌收受贿赂,已被拘留;京东成立文旅公司

雷峰网 浏览 1627

泰柬冲突柬方70人死伤 泰国近20万人住进避难中心

财联社 浏览 2195

马竞新援奥贝德:我完全服从教练的战术安排;偶像是格列兹曼

懂球帝 浏览 1418

韩国人终于把自己的“国运”给彻底玩没了

浏览 25530

傅聪团队新作:OnePiece!通用生成式推荐模型新范式

学术头条 浏览 2580

16岁"烤鸡少年"承认用"肉宝王" 曾因日销百只烤鸡爆红

新京报 浏览 7437

宗馥莉“被带走”?谣言背后,一个内讧的娃哈哈

大猫财经Pro 浏览 2448

尼克斯129-101送黄蜂7连败,布伦森33分,哈特22+8+7

懂球帝 浏览 2334

受够了网红滤镜的6亿人,为何涌入高德?

虎嗅APP 浏览 1773

马刺加时134-130爵士取季前赛3连胜,文班22+7,贝利20+7

懂球帝 浏览 2890

AI重塑就业版图 专项政策护航转型之路

北京商报 浏览 1484
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1