关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者854人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

专家:普里戈任或退出政治舞台 到白俄是自我流放

上观新闻 浏览 15840

保险|未按规定使用经备案的保险条款 泰康在线被罚11万

网易财经 浏览 12031

菲律宾向非法"坐滩"军舰空投补给 中方回应

央视新闻客户端 浏览 12597

中国使出大招 全世界嘲笑美:终于中国出来收拾美国了

南宫一二 浏览 5136

千亿公司浙商大佬病逝 80后"少东家"面临股票停牌

每日经济新闻 浏览 114463

2023年新能源销量:这场《繁花》,注定绽放

汽车公社 浏览 12644

缅甸政府军突袭KK园区 查获30套星链设备

红星新闻 浏览 6124

疑似董小姐回应“牵手门”风波:做自己就好了

饭桶说史 浏览 16565

华为相关人士:“进军ERP市场”系误读,仅供内部使用

上海证券报 浏览 19109

大量用户举报投诉,微信:严厉打击!

大象新闻 浏览 753

新增远程代客泊车辅助 深蓝S7i高阶智驾深度体验

车市红点 浏览 12510

宁愿净身出户与闫妮离婚,邹伟现在怎么样了?

洲洲影视娱评 浏览 964

贝克汉姆一家出游,12岁小七发育过猛穿吊带短裙

好丹 浏览 14388

在都市里种下一颗自然的种子 欧拉5设计解析

网易汽车 浏览 1460

大学副教授成老赖仍开宝马用新手机 一次餐费花8000元

新京报 浏览 5297

12.28 万元起,奇瑞 iCAR 全新超级 V23“方盒子”SUV 上市

IT之家 浏览 1621

800名美欧官员指责政府可能参与战争罪

环球网 浏览 12531

光阴的故事丨接力放映露天电影70载 他们用坚守点亮光影记忆

北青网-北京青年报 浏览 1573

“十几万的BBA没人买,我能怎么办?”

汽车公社 浏览 11072

NBA战报:雷霆94-91险胜掘金,沃特森15分

懂球帝 浏览 951

比亚迪连续4个季度超越特斯拉

大象新闻 浏览 987
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1