关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11345人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

航行警告:渤海部分海域进行军事演习

央视军事 浏览 1656

海口紧急提醒:所有出岛小车暂勿到港 待渡车场已饱和

上观新闻 浏览 80387

国家安全机关破获美国中央情报局间谍案

国家安全部 浏览 84046

体制内的男生已经不受欢迎了?

识局 浏览 10907

谢婷婷疑似恢复单身?独自带女儿送新年祝福,外籍老公3年没露面

素素娱乐 浏览 12940

最近很火的发型,原来这么简单!

黎贝卡的异想世界 浏览 691

OpenMind 开源全球首个“AI 原生”机器人系统 OM1 Beta

IT之家 浏览 1571

国乒最强对手一轮游!早田希娜0-3输日本一姐之争,平野出息了

黑色柳丁 浏览 11834

曾凡博等多人生病缺席!北京末节崩盘难阻深圳5连胜 范子铭24+9

醉卧浮生的体育世界 浏览 19295

汪苏泷被亲后毫无波澜并喝了口水,汪苏泷新恋情?

趣看热点 浏览 28093

澳媒:澳著名铸币厂曾将上百吨不符要求的金条卖给中国

环球网资讯 浏览 102049

男子被疑出轨,老婆在线求李若彤帮捉奸,本尊回复

盖饭娱乐官方号 浏览 18356

政协委员在镜头前摸了摸鼻子 现场的记者都跟着做起来

上观新闻 浏览 69948

0-2!中超领头羊丢尽颜面,连续9场不胜日本球队,还沦为亚冠垫底

侃球熊弟 浏览 844

美海军罕见宣布:解除一弹道导弹核潜艇指挥官职务

环球时报国际 浏览 1040

油头粉面别演穷人!《命悬一生》几个镜头告诉你,真穷人是什么样

娱乐圈笔娱君 浏览 1009

冲突以来驻中东美军首现死亡 拜登誓言"作出回应"

环球网 浏览 12685

加拿大所有省份均发现变异新冠病例,中国驻加拿大使馆发文提醒

趣看热点 浏览 293461

消息称台积电正与2nm制程潜在客户商谈,单片晶圆报价2.5万美元

爱集微 浏览 15291

全裸颁奖,影帝打人,一年比一年离谱,奥斯卡已经没有好电影了吗

不八卦会死星人 浏览 11696

奥斯卡社媒发文:重要的客场拿分

直播吧 浏览 15498
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1