关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者761人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

推广 || 断舍离N次也不会断了它,买过最值的冬日单品之一

黎贝卡的异想世界 浏览 648

今秋要穿这15条裙子!上身绝美,太撩人了!

Yuki女人故事 浏览 994

热火队与今年44号秀佩勒-拉松签下一份3年540万美元的合同

直播吧 浏览 10584

白宫官员:僵持数月后 美国正在放行中国光伏电池板

财联社 浏览 98407

不知不觉 赵丽颖就变成这样了

西瓜小姐MWM 浏览 15086

零跑销量相当于小米与理想之和——属于老实人的胜利

DearAuto 浏览 684

夏末初秋的代表色 请投淡驼色100票!

YOKA网 浏览 15147

主打家用泛越野 哈弗大狗PLUS售13.58万起

网易汽车 浏览 1628

央行下调常备借贷便利利率10个基点

中国人民银行网站 浏览 16328

蓝军太难黑猫太黑!切尔西一周内两张脸

体坛周报 浏览 798

中国手机厂商印度劫:查税与搜查后 要求引入印资

时代周报 浏览 16237

中方决定对5家美国军工企业实施制裁

外交部 浏览 12668

双11的「阳谋」,李佳琦都没躲过

豹变 浏览 628

宁浩:孤岛回音

吐槽电影院 浏览 12407

《大江大河3》:梁父终入狱且病死狱中

肆季娱乐 浏览 13287

卡帕西8000行代码手搓ChatGPT,成本仅100美元,手把手教程来了

量子位 浏览 997

满清唯一皇太子:文武双全,因人格分裂被废,最终被囚禁而死

趣看热点 浏览 26334

92岁默多克又交新女友!外媒曝女方为邓文迪闺蜜

盖饭娱乐官方号 浏览 14788

抢在苹果之前,三星推出三折叠手机

华尔街见闻官方 浏览 220

11人涉菅义伟长子不当宴请被处分菅义伟长子“政商勾结”案最新消息

趣看热点 浏览 133844

美媒炒作中国大豆采购进度 遭到美国贸易代表直接反驳

澎湃新闻 浏览 7325
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1