关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西10931人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

低价＂银行直供房＂激增有房产价格低于市价25%

第一财经资讯浏览 4495

死磕影像十一年：vivo探索另一种可能

远川研究所浏览 532

西方官员：乌军反攻若再无进展泽连斯基或很快＂求和＂

参考消息浏览 14429

极兔速递三季度包裹量76.8亿件，同比增长23.1%

封面新闻浏览 549

梅西职业生涯已完成399次助攻，打入889粒进球+60次帽子戏法

懂球帝浏览 483

＂1999年小朋友捐140元给国家造航母＂热传当事人发声

都市快报橙柿互动浏览 4374

特朗普突然中止与加拿大贸易谈判加元汇率直线跳水

每日经济新闻浏览 6390

埃弗顿前锋莫派：哭泣并不可耻，C罗也是有感情的普通人

直播吧浏览 10147

汪小菲错付了！葛斯齐称会继续爆料，被骂两面派

萌神木木浏览 19428

特斯拉进入平价棋局不足4万美元的新车又是鲶鱼?

禾颜阅车浏览 571

瑞银和瑞信合并后将是什么样？

第一财经资讯浏览 18143

命名Milano，阿尔法·罗密欧新紧凑型SUV名称公布

天天汽车浏览 12231

“金色眼镜蛇”军演美派出罕见兵力美媒:意在中国

环球网资讯浏览 18764

解放军迅速组织起大规模演习战机机型令岛内诧异

枢密院十号浏览 14248

今年的毛衣，放松穿更好看！

LinkFashion 浏览 10985

温网女单首轮：朱琳两盘不敌世界第一斯瓦泰克，止步第一轮

直播吧浏览 14954

北京广告协会：请相关品牌方等对内地男歌手蔡某某做好风险把控

新京报浏览 15143

拜登瞒天过海秘访基辅行程以＂高尔夫锦标赛＂为掩护

红星新闻浏览 95250

中国军工半夜笑醒：印度太实在，多年梦想实现

女友BELLA+封面 | SUPER JUNIOR银赫：二十年初心的破茧之旅

伊周潮流浏览 1247

巴黎时装周刘诗诗美出新高度！越来越好看的关键点原来在这儿！

LinkFashion 浏览 441

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

特朗普＂闯祸...

斗鱼回应监管...

今日热点：李...

知名男星被曝...

泰国止步16...

前央视主持人...

普里戈任私人飞机在俄坠毁美媒：拜登已听取简报

31岁原辽宁女篮运动员猝然离世友人:不敢相信是真的

商务部公告附件首次改为wps格式，金山办公的信创未来该咋看？

低价＂银行直供房＂激增有房产价格低于市价25%

死磕影像十一年：vivo探索另一种可能

西方官员：乌军反攻若再无进展泽连斯基或很快＂求和＂

极兔速递三季度包裹量76.8亿件，同比增长23.1%

梅西职业生涯已完成399次助攻，打入889粒进球+60次帽子戏法

＂1999年小朋友捐140元给国家造航母＂热传当事人发声

特朗普突然中止与加拿大贸易谈判加元汇率直线跳水

埃弗顿前锋莫派：哭泣并不可耻，C罗也是有感情的普通人

汪小菲错付了！葛斯齐称会继续爆料，被骂两面派

特斯拉进入平价棋局不足4万美元的新车又是鲶鱼?

瑞银和瑞信合并后将是什么样？

命名Milano，阿尔法·罗密欧新紧凑型SUV名称公布

“金色眼镜蛇”军演美派出罕见兵力美媒:意在中国

解放军迅速组织起大规模演习战机机型令岛内诧异

今年的毛衣，放松穿更好看！

温网女单首轮：朱琳两盘不敌世界第一斯瓦泰克，止步第一轮

北京广告协会：请相关品牌方等对内地男歌手蔡某某做好风险把控

拜登瞒天过海秘访基辅行程以＂高尔夫锦标赛＂为掩护

中国军工半夜笑醒：印度太实在，多年梦想实现

女友BELLA+封面 | SUPER JUNIOR银赫：二十年初心的破茧之旅

巴黎时装周刘诗诗美出新高度！越来越好看的关键点原来在这儿！

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

特朗普＂闯祸...

斗鱼回应监管...

今日热点：李...

知名男星被曝...

泰国止步16...

前央视主持人...

普里戈任私人飞机在俄坠毁 美媒：拜登已听取简报

31岁原辽宁女篮运动员猝然离世 友人:不敢相信是真的

商务部公告附件首次改为wps格式，金山办公的信创未来该咋看？

低价＂银行直供房＂激增 有房产价格低于市价25%

死磕影像十一年：vivo探索另一种可能

西方官员：乌军反攻若再无进展 泽连斯基或很快＂求和＂

极兔速递三季度包裹量76.8亿件，同比增长23.1%

梅西职业生涯已完成399次助攻，打入889粒进球+60次帽子戏法

＂1999年小朋友捐140元给国家造航母＂热传 当事人发声

特朗普突然中止与加拿大贸易谈判 加元汇率直线跳水

埃弗顿前锋莫派：哭泣并不可耻，C罗也是有感情的普通人

汪小菲错付了！葛斯齐称会继续爆料，被骂两面派

特斯拉进入平价棋局 不足4万美元的新车又是鲶鱼?

瑞银和瑞信合并后将是什么样？

命名Milano，阿尔法·罗密欧新紧凑型SUV名称公布

“金色眼镜蛇”军演美派出罕见兵力 美媒:意在中国

解放军迅速组织起大规模演习 战机机型令岛内诧异

今年的毛衣，放松穿更好看！

温网女单首轮：朱琳两盘不敌世界第一斯瓦泰克，止步第一轮

北京广告协会：请相关品牌方等对内地男歌手蔡某某做好风险把控

拜登瞒天过海秘访基辅 行程以＂高尔夫锦标赛＂为掩护

中国军工半夜笑醒：印度太实在，多年梦想实现

女友BELLA+封面 | SUPER JUNIOR银赫：二十年初心的破茧之旅

巴黎时装周刘诗诗美出新高度！越来越好看的关键点原来在这儿！

普里戈任私人飞机在俄坠毁美媒：拜登已听取简报

31岁原辽宁女篮运动员猝然离世友人:不敢相信是真的

低价＂银行直供房＂激增有房产价格低于市价25%

西方官员：乌军反攻若再无进展泽连斯基或很快＂求和＂

＂1999年小朋友捐140元给国家造航母＂热传当事人发声

特朗普突然中止与加拿大贸易谈判加元汇率直线跳水

特斯拉进入平价棋局不足4万美元的新车又是鲶鱼?

“金色眼镜蛇”军演美派出罕见兵力美媒:意在中国

解放军迅速组织起大规模演习战机机型令岛内诧异

拜登瞒天过海秘访基辅行程以＂高尔夫锦标赛＂为掩护