关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2927人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大众汽车营收微降却亏麻了,利润腰斩暴跌53.5%!

财视传播 浏览 774

吉利雷达地平线新车型上市 售价15.18万元

车质网 浏览 1764

缅甸政府军突袭KK园区 查获30套星链设备

红星新闻 浏览 7989

美股、中概股,全线爆发!机构称A股调整是布局良机!

证券时报e公司 浏览 2813

男生眼中最好看的女生排行榜TOP1

Yuki女人故事 浏览 2779

记者:维拉和埃弗顿也有意路易斯-恩里克,伯恩茅斯的报价最具体

懂球帝 浏览 1528

哲凯还是谢什科?鲁尼:伊萨克谢什科二选一我也还是会选后者

懂球帝 浏览 2693

长安抄底现代工厂,自主瓜分合资资产成新趋势

汽车公社 浏览 2268

斯基拉:尤文、罗马、国米都在关注热那亚中场弗伦德鲁普

懂球帝 浏览 2677

汽车图谱㉔|1月车市调整:上汽销量居首,吉利逆势增长

贝壳财经 浏览 1509

来了!小鹏P7+增程版申报图现身

Nice好车 浏览 2923

常冰玉晋级苏格兰公开赛八强

体坛周报 浏览 2070

以军先斩后奏空袭加沙多地 特朗普:以色列没做错

上观新闻 浏览 2171

升级800V高压架构 新款奔驰EQS谍照曝光

车质网 浏览 1650

《一路繁花2》要封神?5位综艺强者登场,预告连刷4遍不过瘾

娱乐圈笔娱君 浏览 2815

牛弹琴:中国的两个邻国大打出手了 战况很惨烈

大象新闻 浏览 6204

伊朗外长:新任最高领袖将在"一或两天"内被选出

参考消息 浏览 930

锦缎观察:AI应用、储能与机器人在2026年的预期差

锦缎研究院 浏览 1700

OpenAI与亚马逊签署380亿美元算力采购协议,减少对微软依赖

IT之家 浏览 2595

请“村长”当副总裁、拿下7000台订单,何小鹏:汇天飞行汽车2026年将量产

时代财经 浏览 2853

厄德高谈晋级世界杯:这种感觉无法用语言形容,简直疯狂至极

懂球帝 浏览 2437
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1