关闭广告

7B大模型测试成绩超GPT-4！微软新研究解决工具调用难题

智东西11345人阅读

智东西
作者徐珊
编辑云鹏

智东西3月11日消息，近日微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言，STE通过大模型的“想象力”来模拟使用工具的一些合理场景，从而尝试适配不同的大模型，随后从新的反馈中，获得反馈不断优化。

ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实现了46.7%的性能提升，使其成绩超过了GPT-4。

阅读全文

版权与免责声明：本文内容转载自其他媒体，目的在于传递更多信息，不代表本网观点或立场，不承担此类作品侵权行为的自己责任及连带责任。

猜你喜欢

相关阅读

他怎么在内娱男女通吃？颜值一般但性张力绝了

Yuki女人故事浏览 1927

悬疑惊悚电影《秘密访客》，讲述了一个和睦的四口之家住进了一位秘密访客

趣看热点浏览 26738

特朗普证实：已授权中情局行动

澎湃新闻浏览 927

精彩推荐

航行警告：渤海部分海域进行军事演习

央视军事浏览 1656

海口紧急提醒：所有出岛小车暂勿到港待渡车场已饱和

上观新闻浏览 80387

国家安全机关破获美国中央情报局间谍案

国家安全部浏览 84046

体制内的男生已经不受欢迎了？

识局浏览 10907

谢婷婷疑似恢复单身？独自带女儿送新年祝福，外籍老公3年没露面

素素娱乐浏览 12940

最近很火的发型，原来这么简单！

黎贝卡的异想世界浏览 691

OpenMind 开源全球首个“AI 原生”机器人系统 OM1 Beta

IT之家浏览 1571

国乒最强对手一轮游！早田希娜0-3输日本一姐之争，平野出息了

黑色柳丁浏览 11834

曾凡博等多人生病缺席！北京末节崩盘难阻深圳5连胜范子铭24+9

醉卧浮生的体育世界浏览 19295

汪苏泷被亲后毫无波澜并喝了口水，汪苏泷新恋情？

趣看热点浏览 28093

澳媒:澳著名铸币厂曾将上百吨不符要求的金条卖给中国

环球网资讯浏览 102049

男子被疑出轨，老婆在线求李若彤帮捉奸，本尊回复

盖饭娱乐官方号浏览 18356

政协委员在镜头前摸了摸鼻子现场的记者都跟着做起来

上观新闻浏览 69948

0-2！中超领头羊丢尽颜面，连续9场不胜日本球队，还沦为亚冠垫底

侃球熊弟浏览 844

美海军罕见宣布：解除一弹道导弹核潜艇指挥官职务

环球时报国际浏览 1040

油头粉面别演穷人！《命悬一生》几个镜头告诉你，真穷人是什么样

娱乐圈笔娱君浏览 1009

冲突以来驻中东美军首现死亡拜登誓言＂作出回应＂

环球网浏览 12685

加拿大所有省份均发现变异新冠病例，中国驻加拿大使馆发文提醒

趣看热点浏览 293461

消息称台积电正与2nm制程潜在客户商谈，单片晶圆报价2.5万美元

爱集微浏览 15291

全裸颁奖，影帝打人，一年比一年离谱，奥斯卡已经没有好电影了吗

不八卦会死星人浏览 11696

奥斯卡社媒发文：重要的客场拿分

直播吧浏览 15498

本站所有信息收集于互联网，如本站收集信息侵权，请联系我们及时删除
沪ICP备20017958号-1