关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro1703人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

‍2025年4部新片亏8亿,古天乐终于拿出这部大片

靠谱电影君 浏览 2787

"最快女护士"张水华辞职后首战获第六名 本人赛后回应

每日经济新闻 浏览 5983

助力AI全民创作 万兴科技(300624.SZ)旗下万兴天幕创作广场推出“视频教程共创激励计划”

智通财经 浏览 3383

超千万元罚单屡见不鲜!第三方支付机构这些“坑”别再踩了

国际金融报 浏览 1765

法拉利撞上护栏后迅速起火 知名游戏大佬被困车内身亡

每日经济新闻 浏览 29984

高市政府迟迟不道歉还发出战争威胁 中方8个字宣告结局

时时有聊 浏览 8033

曹操出行Robotaxi 2.0已搭载低轨卫星通信,将上线卫星SOS功能

IT之家 浏览 1476

新春穿搭新趋势,天猫服饰与百大品牌共同演绎新年吉服美学

LinkFashion 浏览 1668

足球:雷恩成为欧洲五大联赛第四大球员输送俱乐部

绿茵情报局 浏览 1707

59元钓鱼3小时,年轻人只想静静

中国企业家杂志 浏览 2291

弗里克:很不满意拉菲尼亚受伤;还没和特尔施特根聊过

懂球帝 浏览 1490

新基金业绩大分化

国际金融报 浏览 2653

微软团队突破性研究:AI网页助手终于学会在新网站"随机应变"了

科技行者 浏览 1577

赵丽颖坦白自己近期“消失”的原因

湘村大余 浏览 2667

阿斯:阿隆索深知西超杯意义重大,去年皇马由此开始走下坡路

懂球帝 浏览 1803

最高预增超32倍 283只医药股“剧透”业绩

北京商报 浏览 1449

北京现代首款纯电平台SUV EO羿欧预售在即

网易汽车 浏览 2849

AI圈再颠覆!中国AI翻译耳机通话翻译,实测震撼

新智元 浏览 2872

修杰楷承认造假!逃役失败因贾静雯怀孕提前退伍,面临牢狱之灾

萌神木木 浏览 2256

退出春晚25年,陈佩斯和朱时茂的生活差别太大了

贵州小娟 浏览 2736

两人偷渡到柬电诈园"赚钱":一天骗五六个人应该差不多

大风新闻 浏览 18942
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1