关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者325人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大连海鲜成双十一最热销特产之一 海参大虾扇贝备受追捧

半岛晨报 浏览 81

这才是优雅女人的穿衣“典范”!外套厚实、裤子挺阔,太高级

静儿时尚达人 浏览 12681

反卷与新秩:中国厨电已走向未来

市值Observation 浏览 13890

修杰楷庆祝生日获贾静雯献吻 称继女是"宝贝女儿"

娱絮 浏览 18906

众多UP主吐槽陈凯歌被举报,对人身攻击零容忍

趣看热点 浏览 25004

京东首款汽车定了!埃安UT迎泼天流量,能否逆天改命?

雷科技 浏览 408

千亿公司浙商大佬病逝 80后"少东家"面临股票停牌

每日经济新闻 浏览 113941

消息称苹果iPhone14系列官方保护壳将推新色

Tech星球 浏览 18664

炸坝事件后 泽连斯基发声:对联合国的不作为感到震惊

参考消息 浏览 90584

媒体:菲自我感觉良好 以为能跟大陆和台湾都说得上话

新民晚报 浏览 75484

台媒:邱国正传递两岸濒临战事的信息 示警意味浓厚

直新闻 浏览 81458

法拉利战略转型,电动跃马如何取悦中国用户

桑之未 浏览 582

生数科技完成数千万元天使+轮融资,锦秋基金独家投资

网易科技报道 浏览 14408

马卡: 姆巴佩在皇马达成50球里程碑,本赛季点球命中率显著提升

直播吧 浏览 1147

已生龙凤胎?何超莲近照曝光 身材纤瘦力破谣言

扒虾侃娱 浏览 15772

马斯克向左,黄仁勋向右

汽车公社 浏览 10665

知名网红"小黑妮"官宣怀孕:以后打算再生1个随我姓

鲁中晨报 浏览 5457

男子在悬崖边请人拍照滑倒坠下 遗体在水潭底部被找到

封面新闻 浏览 6101

德外长:支持向沙特出售欧洲战斗机

环球网资讯 浏览 12509

白宫:美政府正密切关注胡塞武装任何报复性袭击

环球网资讯 浏览 12306

户外品牌除了炸山就没有出路了吗?

诗与星空 浏览 389
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1