关闭广告

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者796人阅读


这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.26313v1)。对于关心人工智能发展的普通读者来说,这项研究解决了一个听起来很技术但实际影响深远的问题:如何让AI更好地学习和泛化知识。

当我们教孩子学习时,有两种不同的方式。第一种是让孩子反复抄写标准答案,这就像传统的监督微调方法,孩子能够完美复制,但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索,从错误中学习,这就像强化学习,虽然过程曲折,但孩子最终能举一反三。研究团队发现,第二种方法之所以更有效,关键在于孩子是在"真实练习"中学习,而不是只从固定的教材中死记硬背。

基于这个洞察,研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来,既保持了第一种方法的高效性,又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会,而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

外媒称全球可用核武库增长 炒作中国核弹数量大增

环球网资讯 浏览 16167

房产遇灾能获赔百万?“家财险”值得买吗?

环球网资讯 浏览 14640

突发!*ST雪发公告:实控人张劲失联

经济参考报 浏览 18618

大疆「摔跤」,影石「拱火」

豹变 浏览 1016

特朗普对全世界一视同仁,中美关系未必会更糟

浏览 23020

刘德华6亿别墅变打卡点!网友叹太朴实,邻居非富即贵有大量巨星

娱乐白名单 浏览 11101

洪都拉斯总统访华第二天 正式申请加入新开发银行

界面新闻 浏览 90183

"茅系股"市值一天"回血"4000亿 机构:5年5倍股在这个方向

中国证券报 浏览 26547

特警参加任务失联 86天后妻子收到境外6字短信痛哭

社会奇闻君 浏览 117165

特朗普:芝加哥市长和伊利诺伊州州长都该入狱

新华社 浏览 15625

夏天半身裙应该怎么选?这4款最受欢迎

Yuki时尚酱 浏览 15962

26小伙辞职照顾瘫痪母亲3年 家中3个姐姐均已嫁人

封面新闻 浏览 6473

何时首秀?洛城记者:哈登和塔克预计不会出战明天与湖人的比赛

直播吧 浏览 13293

超模“辣妈”米兰达可儿罕见素颜亮相

时尚丽人风行 浏览 19451

全明星级别+首轮选秀权?公牛对拉文要价现在已大幅降低

懂球帝 浏览 11094

日本研究运输机发射远程导弹 可变身战略轰炸机

澎湃新闻 浏览 14588

普通人真该看看这些穿搭!短上衣配裙子、颜色选好,自然得体

静儿时尚达人 浏览 1042

短剧翻拍《新英雄本色》,刘萧旭主演?

最爱酷影视 浏览 1023

周末重磅!特朗普关税突发,中美经贸磋商进展,下周三大事件

看财经show 浏览 786

足球世界杯赛事那些国足历史冷知识,国足没有一位主教练任期超过四年

趣看热点 浏览 25922

俄称击退乌军解围行动 乌称击退俄军进攻

国际在线 浏览 561
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1