关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻444人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中俄联合空中巡航期间 俄军机曾在中国机场起降

环球网资讯 浏览 16133

洋河股份第三季度营收为32.95亿元,同比下降29.01%

红星资本局 浏览 319

高考数学难?我们让AI大模型考生答了下……

中国企业家杂志 浏览 15894

查理·芒格:高段位的人,都用这4种思维!低段位差的,不止是能力

60秒商业解读 浏览 11780

网红用特警训练做背景蹭流量,被训诫并道歉

趣看热点 浏览 24788

云南部署打击电诈 政法委书记、公检法一把手均到会

政知新媒体 浏览 86576

苹果掏出所有家底!历数Vision Pro上市之时会有哪些“护航作品”

财联社 浏览 12116

币圈巨震!美国最大的加密货币交易所Coinbase被SEC起诉

财联社 浏览 16258

购置税红利倒计时,头部车企上演“兜底”大战

汽车点评AC 浏览 335

牛莉与16岁女儿穿一身名牌在日本挤地铁 女儿身型猛涨

古希腊掌管月桂的神 浏览 62731

经营分化、债务违约 地方AMC众生相

北京商报 浏览 12217

马航MH370重启搜索方案披露 囊括未探及新区域

红星新闻 浏览 83850

马尔代夫总统访华前 莫迪去了马尔代夫北边的一个小岛

上观新闻 浏览 73802

76人和步行者有意休赛期追求乔治

OnFire 浏览 12135

中国女足战胜韩国女足,获得晋级东京奥运会的入场券

趣看热点 浏览 25330

“2025全球十大工程成就”揭晓,DeepSeek开源大模型等上榜

上观新闻 浏览 587

大量新势力竞逐 2024年高端MPV市场能否迎来爆发?

车市红点 浏览 11966

首艘、首颗、首飞!连续实现重大突破 中国制造硬核实力再出圈

环球网资讯 浏览 384

以军禁止约旦人道主义援助物资进入加沙

北青网-北京青年报 浏览 1273

“蔚小理”行至分水岭

北京商报 浏览 16035

泽连斯基称乌军正对俄军采取"反攻"行动 但拒透露细节

环球网 浏览 91643
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1