关闭广告

上海AI实验室团队首创视频驱动交互网页重建基准

科技行者417人阅读


这项由上海AI实验室、浙江大学、中国科学技术大学深圳分校等机构联合完成的突破性研究发表于2025年9月,论文编号为arXiv:2509.24709。研究团队包括陈阳、刘明浩、沈雨帆等多位来自不同院校的研究者,项目由上海AI实验室的沈雨帆教授领导。有兴趣深入了解的读者可以通过该论文编号查询完整论文内容。

当我们浏览网页时,看到精美的界面、流畅的动画效果和各种交互功能,很少有人会想到这背后需要大量的代码来支撑。传统上,要让AI学会制作网页,研究者们通常只给它看静态的截图,然后让它生成对应的代码。这就像让一个人仅凭一张照片就要画出整幅画作一样,缺少了很多重要信息。

然而,真实的网页远比静态截图复杂得多。当用户点击按钮时页面会发生变化,当鼠标悬停在某个区域时会出现新的内容,当用户填写表单时系统会给出相应反馈。这些动态的交互过程包含了网页运作的核心逻辑,但在传统的AI训练方法中却被完全忽略了。

正是在这样的背景下,研究团队提出了一个革命性的想法:为什么不让AI观看完整的用户操作视频,就像人类学习使用软件一样,通过观察整个交互过程来理解网页的工作原理呢?

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

时代不同了,莲花怎么办?

HighendLife 浏览 940

加速进化抢单“双11”

北京商报 浏览 339

“一哥”蔚来加速掉队,李斌卷不动了?

雪豹财经社 浏览 15965

AR行业2~3年内出现“iPhone时刻”?智能眼镜龙头加速布局上海

第一财经资讯 浏览 307

媒体:美军进驻芬兰基地 俄北方舰队受严重威胁

环球网资讯 浏览 12573

高通遭反垄断调查,国产平替芯片机会来了?

禾颜阅车 浏览 556

埃迪-豪:弗兰克的球队无球时很有侵略性;英联杯对我们很重要

懂球帝 浏览 315

情侣连续9年在千年古树下合影:18岁喜欢的人还在一起

潇湘晨报 浏览 6147

“苏超”“赣超”再破纪录!全国最大规模“社超”来了

国是直通车 浏览 1130

44岁吴佩慈罕见素装现身 和范玮琪一起为闺蜜庆生

素素娱乐 浏览 19458

首款中国超跑,比亚迪仰望 U9 将入驻《GT 赛车 7》

IT之家 浏览 376

大厂秋招又起:为什么“ATMD”成第一梯队

三言科技 浏览 13589

社区团购迎来新对手,大战卷土重来?

Tech星球 浏览 14218

韩媒吐槽中国球迷加油声太大是怎么回事?韩国人果然输不起

趣看热点 浏览 24821

卢拉:不希望美国对委发动“地面入侵”

参考消息 浏览 115

日韩回避谁更高兴❓森保一:我不考虑对手,确定对手前没看比赛

直播吧 浏览 11857

但斌人气蝉联第1,邓晓峰热度上升!10月私募人气榜出炉!

私募排排网 浏览 133

星巴克和它所代表的一切,正与我们渐行渐远

虎嗅APP 浏览 146

狂卖27亿美元,丑鞋靠什么狙击年轻人?

新消费智库 浏览 14396

冬日别乱穿衣了!分享实用的“穿搭术”给你,40岁女人别错过

静儿时尚达人 浏览 12725

欧洲将研发高超音速武器拦截系统

参考消息 浏览 14915
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1