关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者323人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一不做二不休?张恒爆郑爽利用阴阳合同逃税漏税

趣看热点 浏览 25080

为什么宋朝这么弱却有320年的历史?

趣看热点 浏览 25072

欧洲议会选举在即:冯德莱恩若连任将打造"军工巨头"

参考消息 浏览 67477

29岁女白领荒野求生半月瘦成"闪电":睡觉时放一把刀

都市快报橙柿互动 浏览 11718

佘诗曼《新闻女王2》首波口碑出炉了!现场观众的评价一针见血

娱乐圈笔娱君 浏览 165

拜登就瓦格纳事件明确表态:普京"绝对"因此被削弱

澎湃新闻 浏览 15217

耶伦抨击特朗普对华政策让美国"更加脆弱和孤立"

环球网资讯 浏览 12590

东方美打败所有风格,成为今冬最火!

小西的穿搭日记 浏览 12829

汤唯最刻骨铭心的那段情,我每年都想重温

Yuki女人故事 浏览 538

拒15亿,Andrew Tulloch重返Meta,Thinking Machines Lab痛失联创

机器之心Pro 浏览 565

美国一架F-35坠毁 飞行员弹射逃生被送医

环球网 浏览 10762

时尚芭莎删除那艺娜物料,网友称其被“退货”

韩小娱 浏览 465

定位中大型SUV 红旗HS6 PHEV开启盲订

车质网 浏览 181

美国务院:如普里戈任出现在与美有引渡条约国家,美国将寻求执行指控

环球网资讯 浏览 15085

香港女星晒海外大别墅,不拍戏专注内地当网红

扒圈818 浏览 18839

东体:中国球迷如《大话西游》里的小妖,被唐僧废话折磨绝望自杀

直播吧 浏览 12440

苏亚雷斯:保级信心主要来自我的球员,包括逆境中展现的决心

懂球帝 浏览 551

全面!斯玛特全场20中9得到25分6板8助3断 助攻抢断均全场最高

直播吧 浏览 12230

瑞信危机中真正“血本无归”的人出现了

财联社 浏览 18677

“复古运动风”今年秋天太流行了,这样穿减龄又好看!

LinkFashion 浏览 553

吊打内娱的阴湿女王,回来了

独立鱼 浏览 429
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1