关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻919人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

立陶宛宣布关闭与白俄罗斯边境 卢卡申科回应

环球网资讯 浏览 727

李多寅怀孕!李昇基将当爸,孩子预计2024年出生

韩娱明星趣闻 浏览 13508

擦碰中国海警艇 揭秘菲律宾“拍照打卡”式炒作套路

环球网资讯 浏览 4757

中超第27轮跑动距离榜:马德鲁加12689米居首,赛季第2次登顶

懂球帝 浏览 882

巴萨官方:佩尼亚续约至2026年,违约金4亿欧

直播吧 浏览 18650

偷学生信息搞颜值打分,“小扎模仿秀”演砸了

新京报 浏览 15283

投资理财的重要性!金价一路走高,你是否错过了最好的投资时机?

郭施亮 浏览 12102

阮经天:交往了16年,她没有背弃过我。

桑葚爱动画 浏览 832

左脚低射破门,加纳乔成为切尔西队史第6位进球的阿根廷球员

懂球帝 浏览 783

2025秋冬一定要拥有的5只包包,怎么搭都好看

LinkFashion 浏览 1828

克宫:卢卡申科与普里戈任有20年交情 自愿当调停人

环球网资讯 浏览 15531

意媒:奥斯梅恩经纪人上周和巴黎进行了会谈,德佬要价1.5亿欧

直播吧 浏览 19348

同样是星二代,为什么她路人缘那么好?

伊周潮流 浏览 732

vivo Y200「皓夜」图赏:6000mAh 蓝海电池、磐石抗摔结构

IT之家 浏览 10674

广东晋级四强4利好!胡明轩杜润旺难得暴走,王睿泽+内线状态极佳

篮球资讯达人 浏览 620

博时资本红利增强策略&波动增利策略:一边收息一边薅波动

私募排排网 浏览 979

第100台设备落地!胜科纳米与赛默飞共铸二十年“双向成就”

爱集微 浏览 760

以军对加沙地带南部的哈马斯目标发动袭击

新华社 浏览 890

女子应聘疑遭老板性暗示 涉事企业法人:出于工作需要

极目新闻 浏览 6046

伊朗海军司令宣布海湾地区将组建新的海军联盟

海外网 浏览 16633

官宣!张伟丽大战闫晓楠,争夺UFC冠军金腰带,中国德比创造历史

体坛扒客 浏览 12764
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1