关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西10929人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

精彩推荐

比亚迪：新品牌2023年将推跑车、越野等品类，首车对标奔驰大G

网易科技报道浏览 18963

20名以色列被扣押人员将分两批获释

CCTV国际时讯浏览 573

普通人秋天应该怎么穿衣？颜色选对、衣服穿对，简单又大方

静儿时尚达人浏览 21

稳定输出！杜兰特半场10中7拿到14分正负值+14

直播吧浏览 13115

美国国会最新AI规则：除付费版ChatGPT外不得使用其他产品

财联社浏览 14716

冯仑：兄弟管公司，女朋友管章子，「江湖人」的企业往往都死得快

冯仑风马牛浏览 536

H-1B签证费涨至10万美元分析人士:将重创美科技行业

财联社浏览 16695

中南双能卫渴望逐梦CBA:希望能冲击下想去宏远

网易体育浏览 16799

“小米系”再撤退，大股东们为何抛弃“扫地茅”石头科技？

野马财经浏览 15275

＂网游大佬＂陈天桥成美国＂大地主＂曾靠盛大套现88亿

封面新闻浏览 74709

匿名者向五角大楼捐赠1.3亿美元支付政府停摆期间美军薪资

澎湃新闻浏览 348

小S晒全家福为18岁长女庆生，与老公同框零互动，长女将赴美留学

娱絮浏览 12283

北京大爷独自赡养父母56年继承2500万房产后哥姐眼红

大佬日志浏览 78068

62岁何赛飞的“真实”，让多少明星“无地自容”

可乐谈情感浏览 351

空间升级/后排配腿托豹8大五座版上市售37.98万起

网易汽车浏览 437

四川阿坝红旗桥垮塌：系山体变形加剧滑塌造成

新京报浏览 9630

女县委书记与3万民众跳健身操申报大世界基尼斯纪录

极目新闻浏览 79894

以军称已有87万巴勒斯坦人从加沙城撤离

环球网资讯浏览 556

8000万年薪！沙特媒体：吉达联合正争分夺秒说服萨拉赫加盟

直播吧浏览 13766

又一个！郭源元自曝在范范孕期遭到陈建州性骚扰

网易娱乐浏览 15378

当《蚁人》照进现实：西湖大学造出能爬会游、摔不坏的“机器小强”

都市快报橙柿互动浏览 1163

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

《重影》：高...

马德兴：扬帅...

三种动力版本...

范子铭晒照低...

开年首周88...

全世界最美的...

首家复牌，佳兆业离恢复元气还有多远

秦刚:我当外长美媒不给我＂战狼＂称号了我＂若有所失＂

俄反对派人士之死引发轩然大波英法德元首纷纷发声

比亚迪：新品牌2023年将推跑车、越野等品类，首车对标奔驰大G

20名以色列被扣押人员将分两批获释

普通人秋天应该怎么穿衣？颜色选对、衣服穿对，简单又大方

稳定输出！杜兰特半场10中7拿到14分正负值+14

美国国会最新AI规则：除付费版ChatGPT外不得使用其他产品

冯仑：兄弟管公司，女朋友管章子，「江湖人」的企业往往都死得快

H-1B签证费涨至10万美元分析人士:将重创美科技行业

中南双能卫渴望逐梦CBA:希望能冲击下想去宏远

“小米系”再撤退，大股东们为何抛弃“扫地茅”石头科技？

＂网游大佬＂陈天桥成美国＂大地主＂曾靠盛大套现88亿

匿名者向五角大楼捐赠1.3亿美元支付政府停摆期间美军薪资

小S晒全家福为18岁长女庆生，与老公同框零互动，长女将赴美留学

北京大爷独自赡养父母56年继承2500万房产后哥姐眼红

62岁何赛飞的“真实”，让多少明星“无地自容”

空间升级/后排配腿托豹8大五座版上市售37.98万起

四川阿坝红旗桥垮塌：系山体变形加剧滑塌造成

女县委书记与3万民众跳健身操申报大世界基尼斯纪录

以军称已有87万巴勒斯坦人从加沙城撤离

8000万年薪！沙特媒体：吉达联合正争分夺秒说服萨拉赫加盟

又一个！郭源元自曝在范范孕期遭到陈建州性骚扰

当《蚁人》照进现实：西湖大学造出能爬会游、摔不坏的“机器小强”

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

《重影》：高...

马德兴：扬帅...

三种动力版本...

范子铭晒照低...

开年首周88...

全世界最美的...

首家复牌，佳兆业离恢复元气还有多远

秦刚:我当外长美媒不给我＂战狼＂称号了 我＂若有所失＂

俄反对派人士之死引发轩然大波 英法德元首纷纷发声

比亚迪：新品牌2023年将推跑车、越野等品类，首车对标奔驰大G

20名以色列被扣押人员将分两批获释

普通人秋天应该怎么穿衣？颜色选对、衣服穿对，简单又大方

稳定输出！杜兰特半场10中7拿到14分 正负值+14

美国国会最新AI规则：除付费版ChatGPT外 不得使用其他产品

冯仑：兄弟管公司，女朋友管章子，「江湖人」的企业往往都死得快

H-1B签证费涨至10万美元 分析人士:将重创美科技行业

中南双能卫渴望逐梦CBA:希望能冲击下 想去宏远

“小米系”再撤退，大股东们为何抛弃“扫地茅”石头科技？

＂网游大佬＂陈天桥成美国＂大地主＂ 曾靠盛大套现88亿

匿名者向五角大楼捐赠1.3亿美元 支付政府停摆期间美军薪资

小S晒全家福为18岁长女庆生，与老公同框零互动，长女将赴美留学

北京大爷独自赡养父母56年 继承2500万房产后哥姐眼红

62岁何赛飞的“真实”，让多少明星“无地自容”

空间升级/后排配腿托 豹8大五座版上市售37.98万起

四川阿坝红旗桥垮塌：系山体变形加剧滑塌造成

女县委书记与3万民众跳健身操 申报大世界基尼斯纪录

以军称已有87万巴勒斯坦人从加沙城撤离

8000万年薪！沙特媒体：吉达联合正争分夺秒说服萨拉赫加盟

又一个！郭源元自曝在范范孕期遭到陈建州性骚扰

当《蚁人》照进现实： 西湖大学造出能爬会游、摔不坏的“机器小强”

秦刚:我当外长美媒不给我＂战狼＂称号了我＂若有所失＂

俄反对派人士之死引发轩然大波英法德元首纷纷发声

稳定输出！杜兰特半场10中7拿到14分正负值+14

美国国会最新AI规则：除付费版ChatGPT外不得使用其他产品

H-1B签证费涨至10万美元分析人士:将重创美科技行业

中南双能卫渴望逐梦CBA:希望能冲击下想去宏远

＂网游大佬＂陈天桥成美国＂大地主＂曾靠盛大套现88亿

匿名者向五角大楼捐赠1.3亿美元支付政府停摆期间美军薪资

北京大爷独自赡养父母56年继承2500万房产后哥姐眼红

空间升级/后排配腿托豹8大五座版上市售37.98万起

女县委书记与3万民众跳健身操申报大世界基尼斯纪录

当《蚁人》照进现实：西湖大学造出能爬会游、摔不坏的“机器小强”