关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻918人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

双双备战!马斯克请格斗冠军陪练,扎克伯格也开始练柔术

每日经济新闻 浏览 15724

中资银行,两大突发!

券商中国 浏览 11113

法拉第未来 Super One 迈入批量试制及生产阶段

IT之家 浏览 609

女子回门宴放父母34年前结婚录像 现场8成宾客曾参加

极目新闻 浏览 7198

美国坠机航母将退役

极目新闻 浏览 766

贾乃亮罕晒甜馨视频向女儿比心,网友嘲相处生分

盖饭娱乐官方号 浏览 19208

梁洛施疑和李泽楷一起参加婚宴 晒照曝光14岁长子

靓宁唠唠嗑 浏览 14466

豪门赘婿,惨被退货?

仙女事件簿 浏览 912

极氪不抱大腿,抱金砖!

DearAuto 浏览 13091

最高涨价28%,老铺黄金年内第三次调价,今年已累计涨约50%

红星资本局 浏览 808

记者:博格巴已经开始康复训练,好消息是没有肌肉损伤

直播吧 浏览 14405

全球1~8月电池装机量,韩系继续败退

汽车公社 浏览 899

林心如曝与霍建华婚姻裂隙:孕期独守空房

一盅情怀 浏览 940

央媒痛批辛巴封路,是谁给你这么大权力?

趣看热点 浏览 25824

气质女人春季最值得准备的三款单品,时尚又百搭,过了40岁也能穿

Yuki时尚酱 浏览 12779

比亚迪成为全球首家达成1400万辆里程碑的新能源车企

财闻 浏览 1003

一夜之间,矛盾又升级了!

米筐投资 浏览 1047

怒吼庆祝!库里37+3帽创历史第一神迹 末节16分66秒连中3记三分

厝边人侃体育 浏览 13124

荣耀 MagicPad3 Pro 13.3 平板电脑核心参数公布:165Hz LCD 面板

IT之家 浏览 1498

西班牙U20主帅:很高兴亚马尔、库巴西、赫伊森能进成年队

懂球帝 浏览 1466

利民推出 PA140 SE 双塔风冷:158mm 高双风扇六热管,275W 解热

IT之家 浏览 999
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1