关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者757人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

场均14.3分!马拉加球员卡利诺斯基当选本届洲际杯MVP!

直播吧 浏览 1538

软银清仓英伟达,孙正义套现415亿

YOUNG财经 浏览 620

今年流行的多巴胺穿搭,太减龄了!

小西的穿搭日记 浏览 16681

女友BELLA+封面 | aespa GISELLE: 以努力为名的青春

伊周潮流 浏览 769

微信AI团队,悄悄干了件大事,算力消耗暴降44%!

智东西 浏览 663

低价“银行直供房”激增,有房产价格低于市价25%

第一财经 浏览 617

公牛官方:帕威左脚遭遇急性骨水肿 将在两周后进行重新评估

直播吧 浏览 12516

李璇:三镇开出国内球员顶薪与邓涵文续约,但没能续约成功

懂球帝 浏览 192

50+女人听我一句劝,别穿大红大紫和超短裙,才能优雅到老

静儿时尚达人 浏览 743

展开激战!击落战机!苏丹多地武装冲突升级

环球网资讯 浏览 15782

环球:对外关系法施行 中国把态度摆到了桌面上

环球网资讯 浏览 15763

宾夕法尼亚大学提出分子设计新方法:如何让药物既有效又安全?

科技行者 浏览 769

苹果iOS 26.2 Beta1上线:日版开放侧载

快科技 浏览 637

媒体:敏感时刻和地点 伊朗连环爆炸案令人细思恐极

新京报评论 浏览 12730

百度智能云公布两款自研AI芯片,昆仑芯比外界想象得更有野心

钛媒体APP 浏览 533

NBA战报:勇士124-120篮网,托马斯空砍41分

懂球帝 浏览 12828

AI教程|我替你淘了10个超好用的 AI 智能体

硅星人 浏览 12314

媒体:西班牙可以思考下 为何胡塞武装不袭击中国船只

新民周刊 浏览 73218

50+女人冬季适合这样打扮,甩掉油腻感!得体优雅一点不显老

静儿时尚达人 浏览 13162

媒体:赖清德再当汉奸"卖台" 看美媒报道一定心碎一地

环球时报新闻 浏览 31734

戚薇李承铉能消停点不?为圈钱上800个综艺,夫妻那点破事看腻了

娱乐圈笔娱君 浏览 902
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1