关闭广告

香港中文大学突破AI训练难题:单个词汇也能让机器学得更聪明

科技行者329人阅读


这项由香港中文大学的明瑞、吴昊原团队与华为诺亚方舟实验室、ChatEDA科技公司合作完成的研究,发表于2025年9月的arXiv预印本平台(论文编号:arXiv:2509.26313v1)。对于关心人工智能发展的普通读者来说,这项研究解决了一个听起来很技术但实际影响深远的问题:如何让AI更好地学习和泛化知识。

当我们教孩子学习时,有两种不同的方式。第一种是让孩子反复抄写标准答案,这就像传统的监督微调方法,孩子能够完美复制,但遇到新问题时往往不知所措。第二种是让孩子在实际练习中摸索,从错误中学习,这就像强化学习,虽然过程曲折,但孩子最终能举一反三。研究团队发现,第二种方法之所以更有效,关键在于孩子是在"真实练习"中学习,而不是只从固定的教材中死记硬背。

基于这个洞察,研究团队开发了一种名为"单词汇滚动"的新训练方法。这种方法巧妙地将两种学习方式的优点结合起来,既保持了第一种方法的高效性,又获得了第二种方法的泛化能力。核心创新在于将AI生成每个词汇的过程都视作一次完整的学习机会,而不是等到生成完整句子后再进行评估。

研究团队在数学推理、代码生成和通用推理等多个领域进行了广

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

英媒又炒“亚洲替代供应链”,未来数年可取代中国?

环球网资讯 浏览 18733

现在嫌他们老,当年追成狗!这些“半老”的男星,当年都是大帅哥

温柔娱公子 浏览 10891

新年开训!中国航母枕戈待旦再前行

北青网-北京青年报 浏览 12090

张升民任国家中央军事委员会副主席

新华社客户端 浏览 11388

2岁幼童被父亲从楼上扔下致死 警方:男子已落网

新京报 浏览 85574

紫光集团原董事长赵伟国被移送检察机关审查起诉

界面新闻 浏览 19081

菲总统马科斯访问越南,大米是焦点

环球网资讯 浏览 12268

互联网正在被“膨胀的垃圾”毁掉

环球时报国际 浏览 12034

华为智选SUV问界M9变相降价,至高5万!跟理想L9打价格战?

网上车市 浏览 11709

戛纳不是比美的地方,章子怡20年前穿吊带背心走红毯

温柔娱公子 浏览 10404

推广|| 用了好几年才推荐,这件单品真的值得投资

黎贝卡的异想世界 浏览 470

被判无期的原县委书记获减刑:曾在狱中举报300多人

澎湃新闻 浏览 92495

高能预警:最烧脑的一集来了!

吐槽电影院 浏览 11852

特斯拉Model3/ModelY Standard正式发布

网易汽车 浏览 571

老兵们打赢了第一仗,但真正的战争是整个赛季

体坛周报 浏览 407

吴昕你这么时髦是怎么个事?

时尚COSMO 浏览 13014

中国职业拳击手周润琪在澳乘公交遇袭 头部被刺伤昏迷

三湘都市报 浏览 7003

秋季开学穿搭大合集 30套标准模板快收藏

巧百搭 浏览 14502

央行换帅!潘功胜任党委书记 释放啥信号

新京报 浏览 15012

美媒:狄龙今日将与湖人、雄鹿、独行侠和火箭进行会面

直播吧 浏览 14965

手感火热!埃里克-戈登半场8中6&三分3中2砍下14分3助

直播吧 浏览 12875
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1