关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西159人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

卢拉将率超大代表团访华 专家:他历来有友华情结

环球网资讯 浏览 19175

五粮液能“平替”茅台?

虎嗅APP 浏览 16944

从深度捆绑到互相减持,丰田与电装各怀异想

DearAuto 浏览 12474

丰田章男年薪达9.99亿日元,创丰田汽车历史之最

界面新闻 浏览 15268

多名陌生男子闯入室内后59岁住户坠亡 嫌犯取保候审

红星新闻 浏览 89352

陈晓陈妍希久违公开互动 夫妻俩追剧玩剧透太甜蜜

网易娱乐 浏览 19704

乌媒民调:乌军总司令若参加总统选举 泽连斯基将落败

每日经济新闻 浏览 74668

冰箱:莫雷一直纵容哈登不做脏活累活 现在前者终于自食其果了

直播吧 浏览 14288

股民有些承受不起了

格隆汇 浏览 12385

金融监管应该关注秩序规则,而不是明天指数涨到多少

观察者网 浏览 12559

Skip:在全明星赛之后 我们要看看利拉德在六月能否更出色

直播吧 浏览 12301

天马推出高端 OLED 技术品牌“天马天工屏”

IT之家 浏览 1478

3nm制程M3芯片将上线?消息称苹果或于下半年更新iMac产品

财联社 浏览 19059

捷途纵横G700限时售30.49万起 轮端扭矩过万

网易汽车 浏览 703

和沈腾争冠军!时隔六年,徐峥新片要杀回暑期档?成本超2亿

靠谱电影君 浏览 10893

郑智化吐槽大陆机场,评论区沦陷

娱乐圈笔娱君 浏览 633

米兰1-0恩波利全场数据对比:射门15-5,射正5-2,角球11-4

直播吧 浏览 11405

诺贝尔奖官方公布爱因斯坦成绩单,鸡汤文原来都是骗人的?

趣看热点 浏览 25498

接班?曝泰州远大或更名为"江苏队" 可能迁往南京

直播吧 浏览 24931

向太怒骂范冰冰经纪人,众星力捧向佐的《封神》,她却耍大牌

不八卦会死星人 浏览 802

被娃写作业逼疯 妈妈"邪修法"直播写作业引2万人围观

极目新闻 浏览 15273
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1