关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11381人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

初秋穿搭不要太复杂 简约大方3个技巧提升品位

Yuki时尚酱 浏览 14885

郑恺苗苗带孩子自驾出游,小姨子随行再惹争议

不八卦会死星人 浏览 15878

美国中央司令部:一架直升机在叙利亚发生事故 致22名美军人受伤

环球网资讯 浏览 16446

伊姐周六热推:电视剧《余生有涯》;电视剧《猎豹》......

伊周潮流 浏览 1043

宋慧乔与朋友相聚:抱爱犬笑容温柔,嘟嘴玩自拍

笑猫说说 浏览 15059

东风奕派eπ007,入门不到16万

懂车之道 浏览 12459

关晓彤与鹿晗日本过七夕节 路人曝鹿晗宠女友细节

叶公子 浏览 14627

除了T恤 夏天也很需要这4款衬衫

日系志Yumi 浏览 16730

美政府停摆15天白宫放话要裁1万人 女法官颁令叫停

红星新闻 浏览 6229

媒体:禁用中国无人机零部件 印度又学起了美国

直新闻 浏览 14891

停不下来,肯扬-马丁继续怼追梦:没有库里和克莱你只是队内第12人

懂球帝 浏览 382

ESPN:普利西奇与米兰原则性谈妥个人条款,但转会费未谈妥

直播吧 浏览 15339

上海9旬老太举报保姆虐待 儿媳:保姆逼写自愿给钱字据

极目新闻 浏览 92863

海港战町田泽维亚海报:象棋将军局,谋定后动

懂球帝 浏览 906

德科:C罗是我见过最谦逊的人,他和梅西是不同类型的天才

懂球帝 浏览 1516

章小蕙、英拉才是真名媛:风衣不配打底裤、头发微卷,优雅又高级

潮人志Fashion 浏览 12560

被安排与都美竹同场观影!秦牛正威发声开撕表不满

萌神木木 浏览 14292

稳了?皇马此前16次淘汰赛首回合取胜最终15次晋级

趣看热点 浏览 24863

台媒曝光周星驰天价片酬!没有天价不愿接演,比张国荣还要高三倍

文艺圈娱乐号 浏览 12922

女子用"AI流浪汉"照片整蛊丈夫引来警察 网友表示不解

央视网 浏览 8944

美官方称空袭效果好 美媒称胡塞武装未受重创

国际在线 浏览 12875
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1