关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者588人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

火箭将退役哈登13号球衣,费尔蒂塔表示他永远是一个火箭人

趣看热点 浏览 25629

媒体:在美国对华政策调整刺激下 欧洲三大国都要访华

南风窗 浏览 29783

朝鲜进行"核反击假想综合战术训练" 金正恩现场指导

环球网资讯 浏览 108146

乐视被指是"打工人天花板" 其负债仍超过200亿

潇湘晨报 浏览 69989

媒体:上合组织因俄乌战事面临三重困境 中国迎来机遇

直新闻 浏览 63758

不用等AI毁灭人类了!谷歌前CEO预言:明年美大选“一团糟”

财联社 浏览 15204

虐囚事件发酵高官引咎辞职 以总理称遭"严重公关危机"

上观新闻 浏览 705

是否会增加轮换?老里:不会 但若有需要 队员们都随时做好了准备

直播吧 浏览 18523

贝拉尔多辟谣离队传闻:在巴黎非常开心,会全力以赴实现目标

懂球帝 浏览 730

速度与激情9确认引进,上映时间待定

趣看热点 浏览 72850

林子祥和学生结婚,78岁开演唱会,依然一票难求

犀利辣椒 浏览 815

大S律师首次发声,怒斥张兰:过分到连鬼都害怕的程度!

缘木不求娱 浏览 12504

租客死亡4年后房东以"房屋贬值"把中介告了 法院判了

封面新闻 浏览 6629

2天挨4 针,韩国皮肤科,挤满“特种兵医美”的中国人

每日人物 浏览 983

美国计划将胡塞武装重新列为恐怖组织

央视新闻客户端 浏览 76920

中金:日股还能买么?

网易财经 浏览 12823

突遭暂缓!实控人曾巨额行贿200万!又是海通证券保荐

财通社 浏览 15327

存储芯片需求强劲,佰维存储业绩有望迎来“戴维斯双击”

览富财经网 浏览 10897

白宫:拜登将于周二到访波兰 无计划访问乌克兰

环球网资讯 浏览 19395

阿莫林:利马已经接近参加合练;踢三中卫对马奎尔有好处

懂球帝 浏览 831

50+女人秋冬穿衣避坑指南:衣不紧身、不花哨,这样穿更高级

静儿时尚达人 浏览 357
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1