关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者430人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马斯克:特斯拉Optimus机器人将成为“令人难以置信的外科医生”

IT之家 浏览 363

奇才对库兹马的要价是两个是首轮签

OnFire 浏览 12147

美众院通过修正案 或禁止美军从中俄购买数字显示器

澎湃新闻 浏览 22177

因场地积水严重,欧协联里耶卡vs布拉格斯巴达比赛被迫延期

懂球帝 浏览 398

杨澜晒护照否认移民传闻:我一直都是中国公民

网易娱乐 浏览 18554

吴绮莉独自喝苦瓜汤 分享早年工作旧照片忆苦思甜

素素娱乐 浏览 15019

什么信号?有银行直接5.5折卖房

大猫财经Pro 浏览 52

iPhone Air国行版要来了!联通eSIM预约通道正式开放

三言科技 浏览 569

牛年最大规模雨雪天气来袭,超20省份将受到影响

趣看热点 浏览 130834

罗伯逊谈萨拉赫:我们都屏蔽了转会传闻,俱乐部也表明了立场

直播吧 浏览 13931

美媒承认:西方对乌军反攻态度有明显变化

环球网资讯 浏览 14181

火记晒数据:格林和白魔同场 球队每百回合净胜7.3分

直播吧 浏览 11423

中印两军日前举行第十九轮军长级会谈 外交部回应

环球网 浏览 84656

理想商业副总裁刘杰:头部三强,我们和问界肯定在里面

观察者网 浏览 10810

对话钦培吉:77岁的莲花,不做六边形战士

网易汽车 浏览 939

Windhorst:多队对骑士阿伦兴趣浓厚 但阿特金森想留下昔日爱徒

直播吧 浏览 10051

年轻人迷上在线下交换自制周边

钛媒体APP 浏览 493

一轮有望创历史新高的“鸡周期”来了?

华尔街见闻 浏览 18504

亲生父亲去世当天 尹锡悦再发亲日言论强调"日韩友好"

3号观察室 浏览 84805

德约纪念逝去恩师忍不住落泪,现场打脸意大利网协主席

网球之家 浏览 167

M3旅行版上市售94.39万元 告别平行进口

网易汽车 浏览 222
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1