关闭广告

GUI自动化的新突破:ServiceNow让AI更准确定位屏幕界面元素

科技行者332人阅读


这项由ServiceNow、魁北克人工智能研究院、蒙特利尔大学、约克大学、蒙特利尔理工学院和麦吉尔大学联合进行的研究发表于2025年10月,论文编号为arXiv:2510.03230v1。研究团队由王苏宇辰、张天宇、Ahmed Masry、Christopher Pal、Spandana Gella、刘邦和Perouz Taslakian等学者组成,他们致力于解决人工智能在GUI(图形用户界面)自动化中面临的核心难题。有兴趣深入了解的读者可以通过论文编号arXiv:2510.03230v1查询完整论文。

现代生活中,我们每天都要与各种软件界面打交道——从手机应用到电脑程序,从网页浏览到办公软件。如果能让人工智能像人类一样准确地识别和操作这些界面元素,将会极大提升工作效率。然而,要让AI准确找到屏幕上的按钮、文本框或菜单项,就像要求一个从未见过地图的人在陌生城市中找到特定建筑物一样困难。

这项研究的核心贡献在于解决了当前视觉语言模型在GUI定位任务中的一个根本性问题:如何将自然语言指令准确转换为屏幕上的像素坐标。研究团队发现,现有方法就像让一个盲人通过触摸来画地图一样效率低下,因为AI模型需要在没有明确参照物的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

数十农民工被拖欠百万工钱 劳务公司:争取春节前兑付

大风新闻 浏览 1242

复旦大学法学院学生在毕业典礼上挥拳打老师 院方通报

复旦大学法学院 浏览 62478

自然杂志公布2020十大科学发现,南极上空臭氧层的修复使高速气流停止漂移

趣看热点 浏览 25573

具身智能开启汽车产业万亿新赛道

车质网 浏览 26

一个月来至少三起,台积电频频投资硅谷AI芯片创企

界面新闻 浏览 15580

今年秋天,有这几件单品就够了

黎贝卡的异想世界 浏览 513

2名以方被扣押人员失联 卡桑旅要求以军暂停空袭24小时

极目新闻 浏览 963

杨丞琳太搞笑!阔腿裤穿成"没有脚"

木子爱娱乐大号 浏览 19119

王传福:汽车行业已进入淘汰赛阶段,简单拼装活下来的概率很小

界面新闻 浏览 16130

美媒:预计在耶伦访华后 美将针对中国芯片再采取行动

环球网资讯 浏览 93437

米卢:在中国足球学校中孩子并不喜欢足球,进球也不庆祝

懂球帝 浏览 11187

全球核武库变化趋势报告出炉 中国又"背锅"

枢密院十号 浏览 15869

中超-阿齐兹戴帽阿奇姆彭破门+伤退 三镇3-1送深圳四连败

直播吧 浏览 15024

李凯尔晒与家人合照:特伦蒂诺的家庭时光 热爱我们的生活

直播吧 浏览 14471

福建省女足比赛因染发球员过多被判负头发不够黑不能出场

趣看热点 浏览 25787

2021世俱杯改为日本承办,24支球队缩减至7支

趣看热点 浏览 25011

本月刚出镜的"消防虎"被公诉 初次见领导就送1万红包

红星新闻 浏览 78315

利物浦起飞?今夏砸2.4亿连签3强援升级中场!首发豪阵曝光可争冠

我爱英超 浏览 14038

奚梦瑶带何超欣为甘比捧场 两大阔太同框似同龄人

萌神木木 浏览 12162

黄子佼为脱罪庭上卖惨!自曝离婚请求轻判,律师痛批毁掉别人一生

萌神木木 浏览 409

宇树科技更名!正在办理工商变更,已完成首期上市辅导

红星资本局 浏览 399
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1