爆点资讯

当我们训练人工智能写代码或解数学题时，就像教小孩做作业一样，需要给它很多练习题。但问题来了：有些题目太简单，AI一下就会了；有些题目太难，AI怎么也学不会。更麻烦的是，按照传统方法，不管题目难易，我们都给每道题分配同样的练习时间和次数。这就像让学霸和学渣都花同样时间做同一套题——既浪费了学霸的时间，也帮不到学渣。

来自伊利诺伊大学香槟分校、微软研究院和阿姆斯特丹大学的研究团队，在2025年10月发表了一项名为"Reinforce-Ada: An Adaptive Sampling Framework for Reinforce-Style LLM Training"的研究。这项研究就像给AI学习装上了"智能调节器"，让它能够根据题目难度自动分配练习时间，既不浪费计算资源，又能确保每道题都学得扎实。

研究团队的核心发现是：当前主流的AI训练方法GRPO（组相对策略优化）存在一个严重问题——当AI对某道题的所有尝试都得到相同结果时（要么全对要么全错），系统就收不到有用的学习信号，就像老师看到学生交上来的作业要么全是满分要么全是零分，无法判断学生的真实水平。

为了解决这个问

AI让机器写代码变得更聪明：伊利诺伊大学团队破解训练瓶颈新方法

泽连斯基称将...

OpenAI...

美英之后，韩...

美国歌手La...

抽签出炉！樊...

谷歌据悉计划...

樊小慧哭诉被前婆婆暴打，脸上被抓伤手臂淤青，对方还要抢孩子

首例AI生成图片侵权案始末：原告胜诉放弃赔偿，有律师质疑判决

有野心有手段的大女主有多能打？

《一路向前》大结局：叶岚罗向前一吻定情，最终在火车上举行婚礼

浙京赛后！王博提调整但拒反思，孙铭徽医院拍片，老马不满执行力

说你点啥好呢？维金斯替补23分钟 8中2仅拿5分&正负值低至-29

估价21万元奔驰车将被1元起拍系涉刑资产

上海楼市，再传大消息！

“林下生金”，看生态与产业如何共振

福田冲击高端皮卡市场失败的原因是什么？

汪小菲罕见亲晒儿子正脸照，眉眼像极了大S，凸牙问题还没改善

嫦娥五号发射成功，我国探月工程再迈出新步伐

西共体决定启动地区常备部队以应对尼日尔危机

极兔速递三季度包裹量76.8亿件，同比增长23.1%

胡塞武装在红海袭击两艘美国驱逐舰

徐若瑄48岁离婚后日本复出，时隔25年再登红白歌会

中老年男人，为什么劝你冬天“戴帽子”？4个优势，很多人不知道

智界S7交付困难，另有隐情？不是产能不足，而是有人“使绊子”？

以色列内阁为战争预算吵翻天内塔尼亚胡又放狠话

10位院士与会 2025中国自动化大会成功举行

把胖女孩做成手机壁纸，成减肥新方式

适合40岁女人的三种穿衣公式清爽又洋气

长安汽车10月销量27.8万辆同比增长11%

拉比奥：我在米兰很好地融入了球队，我和迈尼昂的关系很亲近