关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻442人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

湖北武汉加速构建人形机器人产业发展生态

新华社 浏览 324

博时基金“换帅”

国际金融报 浏览 516

微软研究院突破:让AI真正读懂多种语言的文化密码

科技行者 浏览 409

国米vs凯拉特首发预测:巴雷拉踢后腰,劳塔罗继续首发搭皮奥

懂球帝 浏览 187

热巴《花少》被指表现过度!拿摄像机玩误删所有素材,打工人实惨

萌神木木 浏览 12302

创纪录防卫预算,日本花在哪?

环球网资讯 浏览 12335

法拉第未来称新增9000万美元融资承诺

界面新闻 浏览 14888

我国又添“超级充电宝”:世界坝体最高抽水蓄能电站全面投产发电

IT之家 浏览 355

千禾味业董事及高管计划减持合计48.41万股股份

红星资本局 浏览 10387

美团:“明厨亮灶”补贴将增加至5亿元,已有30万商家加入

IT之家 浏览 1187

有一个学霸人设崩塌?九漏鱼怎么都游向了娱乐圈

八卦三缺一 浏览 12384

世界唯一虎狮虎兽度过生命危险期,已经可以大口吃肉

趣看热点 浏览 25555

台媒:纳粹标志再现台湾社会,以色列与欧盟驻台机构表达关切

环球网资讯 浏览 18360

奥特曼零食之父,要去IPO了

投资家 浏览 348

2021NBA全明星第一轮投票结果出炉,杜兰特力压詹姆斯成票王

趣看热点 浏览 25072

巴菲特和李嘉诚,为何后期都大量投资公用事业类生意

锦缎研究院 浏览 15502

卡萨诺:有九名球员不配在尤文踢球,戴维糟糕到令人难以直视

懂球帝 浏览 411

日本研究运输机发射远程导弹 可变身战略轰炸机

澎湃新闻 浏览 14166

米体:曼联将给奥纳纳双倍年薪&周五联系国米 德赫亚或去沙特联赛

直播吧 浏览 15180

全国政协委员、恒银科技董事长江浩然:新质生产力的内核离不开“科技创新”

经济观察报 浏览 11689

上海人寿5.2亿存款消失之谜:向大股东利益输送?

清流 浏览 19057
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1