爆点资讯

由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队，最近在人工智能领域取得了一项重要突破。这项研究发表于2025年，论文编号为arXiv:2509.23371v1，提出了一种名为MetaAPO（Meta-Weighted Adaptive Preference Optimization）的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性，我们先来看一个生活中的例子。假设你正在教孩子学习做饭，你有两种教学资源：一套经典的家传菜谱（就像AI训练中的离线数据），还有让孩子实际动手练习的机会（就像在线生成的数据）。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习，而东南大学团队的新方法则像是配备了一位智慧的厨艺老师，这位老师能够根据孩子当前的水平，灵活决定什么时候该参考菜谱，什么时候该放手让孩子实践，从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战：如何让AI既能从人类已有的经验中学习，又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据，导致AI无法适应新情况；要么完全

东南大学突破：AI学会情境化拒绝能力

【早知道】市...

评论区沦陷！...

有钱人如何安...

专栏 | 我...

张雪峰还是不...

俄防长突访前...

马克龙称瓦格纳事件反映俄军队脆弱遭扎哈罗娃回怼

孙怡恋情风波升级，被质疑知三当三

拜登成首位因＂种族灭绝共谋＂被起诉的美国总统

微软官方确认：Windows 11任务管理器出问题了！

前女友曝19岁荣梓杉出轨打人，男方评论区沦陷，网友喊话道歉退圈

申万宏源：2025年科技牛只是小菜，2026年下半年将迎来全面牛

油头粉面别演穷人！《命悬一生》几个镜头告诉你，真穷人是什么样

当中国出口全看汽车你是喜欢哭来还是喜欢笑？

博时资本红利增强策略&波动增利策略：一边收息一边薅波动

西贝的新考题：如何券后留客

印度被“揍”服！莫迪放话认怂，背后另有隐情

解放军演习期间蔡英文发图称都有掌握国台办回应

杜克大学开创新型物联网控制语言，手机就能对话所有智能设备

澳P-8A军机侵闯中国西沙领空解放军驱离

央行重磅会议释放新信号！下半年行情开门红可期？

女孩在高铁遭掌掴后还击被认定为＂互殴＂司法部发声

特斯拉成简配“鲶鱼”，中国品牌如何应对？

特朗普完成自首登记被拍摄大头照，在监狱逗留20分钟获保释

曙光宣布启动智慧工业战略

部分苹果 iPhone 17 Pro/Max 用户反馈机身褪色

换装全新设计语言北京EU8申报图曝光

Linux之父Linus配新电脑了！特别要求Intel锐炫B580显卡

朱桢二胎得子取名Jerry朱桢发文官宣Jerry的到来，晒甜蜜合照

两名国民党民代遭起诉郑丽文：民进党想团灭在野党