关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者887人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

潘功胜任央行党委书记, 三十载金融岁月功绩卓越获业内认可|钛度宏观

钛媒体APP 浏览 15865

OpenAI “宫斗”大戏调查结果公布,官方宣布新董事会成员

第一财经资讯 浏览 12494

美股纳指、标普转涨,特斯拉大涨超10%,英伟达曾跌约2.6%

华尔街见闻官方 浏览 10828

特朗普"力挺"中国 高市闯祸能否拥有核武日本说了不算

空天力量 浏览 37915

美舰穿航台湾海峡东部战区回应了什么?到底是怎么回事?

趣看热点 浏览 211820

全网最后一批躺赚博主,也被AI挤兑失业了

新周刊 浏览 1029

美论坛:为什么中国明知很容易被摧毁 仍在南海建基地

博览历史 浏览 4171

酿酒入列历史经典产业,郎酒的“慢功夫”见真章

征探财经 浏览 693

外媒:白俄境内瓦格纳车队向俄方向进发

界面新闻 浏览 14554

9年17轮融资!市场份额仅0.6%佑驾创新赴港IPO,阿里CEO和四维图新都是股东

时代周报 浏览 11242

女网红拉姆被前夫烧伤细节曝光,汽油直接淋遍其全身

趣看热点 浏览 26710

谷歌IMO金牌级Gemini 3深夜上线!华人大神挂帅,OpenAI无力反击

新智元 浏览 205

百强房企超五成未拿地,什么情况?

中国基金报 浏览 15631

中老年男人,为什么劝你冬天“戴帽子”?4个优势,很多人不知道

潮人志Fashion 浏览 13325

白宫在台湾地区领导人选举前罕见发声:无偏爱候选人

上游新闻 浏览 75357

曼联阻止青训新福登过早首秀!担心重蹈青木覆辙,目前不适合登场

罗米的曼联博客 浏览 1055

Meta被曝靠诈骗广告赚取巨额利润

北京商报 浏览 641

芬奇谈输球:我认为大家获得了一些不错的机会 但可能打得着急了

直播吧 浏览 12500

蔚来 ES6 汽车将迎里程碑时刻,第 30 万台今年 11 月交付

IT之家 浏览 841

TMT行情短期难言见顶?机构建议这么布局

21世纪经济报道 浏览 18236

以为丁真在西藏丁真是四川小伙,四川:原来爱会消失

趣看热点 浏览 26627
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1