关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西10929人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

比亚迪:新品牌2023年将推跑车、越野等品类,首车对标奔驰大G

网易科技报道 浏览 18963

20名以色列被扣押人员将分两批获释

CCTV国际时讯 浏览 573

普通人秋天应该怎么穿衣?颜色选对、衣服穿对,简单又大方

静儿时尚达人 浏览 21

稳定输出!杜兰特半场10中7拿到14分 正负值+14

直播吧 浏览 13115

美国国会最新AI规则:除付费版ChatGPT外 不得使用其他产品

财联社 浏览 14716

冯仑:兄弟管公司,女朋友管章子,「江湖人」的企业往往都死得快

冯仑风马牛 浏览 536

H-1B签证费涨至10万美元 分析人士:将重创美科技行业

财联社 浏览 16695

中南双能卫渴望逐梦CBA:希望能冲击下 想去宏远

网易体育 浏览 16799

“小米系”再撤退,大股东们为何抛弃“扫地茅”石头科技?

野马财经 浏览 15275

"网游大佬"陈天桥成美国"大地主" 曾靠盛大套现88亿

封面新闻 浏览 74709

匿名者向五角大楼捐赠1.3亿美元 支付政府停摆期间美军薪资

澎湃新闻 浏览 348

小S晒全家福为18岁长女庆生,与老公同框零互动,长女将赴美留学

娱絮 浏览 12283

北京大爷独自赡养父母56年 继承2500万房产后哥姐眼红

大佬日志 浏览 78068

62岁何赛飞的“真实”,让多少明星“无地自容”

可乐谈情感 浏览 351

空间升级/后排配腿托 豹8大五座版上市售37.98万起

网易汽车 浏览 437

四川阿坝红旗桥垮塌:系山体变形加剧滑塌造成

新京报 浏览 9630

女县委书记与3万民众跳健身操 申报大世界基尼斯纪录

极目新闻 浏览 79894

以军称已有87万巴勒斯坦人从加沙城撤离

环球网资讯 浏览 556

8000万年薪!沙特媒体:吉达联合正争分夺秒说服萨拉赫加盟

直播吧 浏览 13766

又一个!郭源元自曝在范范孕期遭到陈建州性骚扰

网易娱乐 浏览 15378

当《蚁人》照进现实: 西湖大学造出能爬会游、摔不坏的“机器小强”

都市快报橙柿互动 浏览 1163
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1