关闭广告

蚂蚁集团突破性研究:一个视觉"万能钥匙"让AI同时理解和创造图像

科技行者41人阅读


这项由蚂蚁集团旗下Inclusion AI团队领导的重要研究发表于2025年10月,研究团队包括黄梓源、郑丹丹、邹程等众多研究员。论文题为《Ming-UniVision: Joint Image Understanding and Generation with a Unified Continuous Tokenizer》,感兴趣的读者可以通过arXiv:2510.06590查询完整论文,相关代码和模型已在GitHub、HuggingFace等平台开源。

AI看懂图片和创造图片,原本是两个完全不同的任务,就像一个人既要当翻译官又要当画家。以往的AI系统通常需要分别训练两套完全不同的"大脑"来处理这两种任务。现在,蚂蚁集团的研究团队找到了一种方法,让AI用同一套"视觉语言"既能理解图片内容,又能根据文字描述创造全新的图像。

这个突破性发现的关键在于他们开发

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

北京爆冷输天津3人败笔!许利民糟糕执教,三宁狂铁,方硕引丢分

篮球资讯达人 浏览 168

中国游客称在瑞士看到峨眉山石 官方证实:已落户10年

封面新闻 浏览 8935

中国新能源汽车渗透率58.37%创历史新高

大象新闻 浏览 579

音乐节撞上"双预警"观众要求退票被拒:现场都是烂泥

上观新闻 浏览 63566

一名德国男子因涉嫌为俄罗斯从事间谍活动被捕

环球网资讯 浏览 14217

美一架飞机闯入华盛顿禁飞区:被战机拦截后坠毁

环球网 浏览 15927

布林肯:美国对日本核污染水排海计划感到“满意”

环球时报国际 浏览 86049

《花少》工作人员曝杨颖耍大牌!频繁黑脸甩脸色,让新疆艺人擦鞋

文艺圈娱乐号 浏览 12727

成功男士偏爱的三种配饰 你戴过吗?

齐鲁壹点 浏览 16648

摩恩电气深V之意

富凯财经 浏览 28

格威:没有哪两队比他们更值得 很幸运能成为这两队的一员

直播吧 浏览 10277

楼市回暖 贝壳伤寒

一视财经 浏览 16193

以军空袭黎巴嫩南部轰炸真主党重型机械 画面披露

环球网资讯 浏览 563

奥巴马意外现身 庆祝胜利

参考消息网 浏览 5086

包钢股份拟投6000万元在北京成立技术公司:建钢铁工业基地“智囊团”

澎湃新闻 浏览 10780

秦刚:敦促有关国家停止鼓噪"今日乌克兰 明日台湾"

环球网资讯 浏览 95263

魏国人范睢为何投靠秦国,又做了秦国的丞相

趣看热点 浏览 25194

入秋包包合集!这12个有质感还不撞款!

Yuki女人故事 浏览 573

46岁周杰伦身患“不死癌症”已超20多年

阿晭评论哥 浏览 579

媒体:趁乱"搁浅"24年的菲破船 到了该拖走的时候了

新民周刊 浏览 14351

多国警告以色列进攻拉法将造成“灾难性后果”

新华社 浏览 11899
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1